top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA BigVGAN v2 hỗ trợ tổng hợp âm thanh chất lượng cao

Generatived

24/9/6 4:30

NVIDIA đã đạt được những tiến bộ đáng kể trong lĩnh vực AI tạo âm thanh với sự phát triển của BigVGAN, một mô hình được thiết kế đặc biệt để tổng hợp các dạng sóng âm thanh với tốc độ và độ bền đáng kinh ngạc. Là sự hợp tác giữa nhóm Nghiên cứu học sâu ứng dụng của NVIDIA và nhóm NeMo, mô hình này được thiết kế để xử lý nhiều loại âm thanh khác nhau, bao gồm lời nói, âm thanh xung quanh và âm nhạc. BigVGAN v2, phiên bản mới nhất của BigVGAN, nhằm mục đích cải thiện cả tốc độ tổng hợp và chất lượng âm thanh, tạo ra âm thanh gần như không thể phân biệt được với bản ghi âm thực.

Model BigVGAN v2 được đặc trưng bởi khả năng cung cấp âm thanh chất lượng cao với nhiều loại âm thanh. Nó được đào tạo trên một tập dữ liệu khổng lồ bao gồm nhiều ngôn ngữ, âm thanh môi trường và nhạc cụ, cho phép bạn tạo ra các sóng âm thanh chi tiết từ một mô hình duy nhất. Kiến trúc của mô hình bao gồm một mô-đun mới có tên là Tổng hợp đa chu kỳ chống răng cưa (AMP), có chức năng tạo ra sóng âm thanh tần số cao và định kỳ. Sự đổi mới này cho phép BigVGAN v2 giải quyết thách thức tạo ra chi tiết tinh tế trong âm thanh tần số cao, một thiếu sót chung của các phương pháp mã hóa truyền thống.

Là một bước đột phá trong công nghệ tổng hợp âm thanh, BigVGAN v2 mở rộng công suất tốc độ lấy mẫu lên 44 kHz, bao phủ toàn bộ phạm vi thính giác của con người. Cải tiến này cho phép mô hình tái tạo chính xác nhiều loại âm thanh, từ những nốt trầm của trống đến những nốt cao của chũm chọe. Ngoài ra, BigVGAN v2 tăng tốc đáng kể tốc độ tổng hợp bằng cách kết hợp nhân CUDA được tối ưu hóa, mang lại khả năng suy luận nhanh hơn gấp 3 lần so với phiên bản tiền nhiệm.

Cam kết của NVIDIA trong việc thúc đẩy AI tạo âm thanh được thể hiện bằng việc phát hành BigVGAN v2, một chuẩn mực mới cho công nghệ bộ mã hóa thần kinh và chất lượng âm thanh. Hiệu suất vượt trội và khả năng tổng hợp nhanh của mô hình mang lại lợi ích cho nhiều ứng dụng, từ thực tế ảo đến tạo nội dung số. Với BigVGAN v2, NVIDIA tiếp tục vượt qua ranh giới của những gì có thể có trong lĩnh vực thính giác bằng cách tạo ra âm thanh chất lượng cao thậm chí còn dễ tiếp cận và hiệu quả hơn.

Chia sẻ bài viết này:

Tin tức mới nhất
IBM công bố bảo mật tự động cho AI đám mây

IBM công bố bảo mật tự động cho AI đám mây

24/11/15 4:30

IBM vừa công bố Autonomous Security for Cloud (ASC), sáng kiến mới nhất của công ty nhằm mục đích đơn giản hóa quá trình chuyển đổi của các tổ chức sang môi trường đám mây.

Technavio dự đoán sự tăng trưởng đáng kể trong thị trường IoT toàn cầu

Technavio dự đoán sự tăng trưởng đáng kể trong thị trường IoT toàn cầu

24/11/15 4:30

Nghiên cứu mới nhất của Technavio đã dự đoán rằng thị trường Internet vạn vật (IoT) toàn cầu sẽ mở rộng đáng kể, tăng thêm 1,55 nghìn tỷ đô la Mỹ trong giai đoạn 2024 - 2028.

Invideo ra mắt V3, giúp việc tạo video AI trở nên dễ dàng

Invideo ra mắt V3, giúp việc tạo video AI trở nên dễ dàng

24/11/15 4:30

Invideo, nền tảng sáng tạo video AI, vừa công bố cải tiến mới nhất của mình: V3.

Ironclad phát hành Jurist AI dành cho các chuyên gia pháp lý

Ironclad phát hành Jurist AI dành cho các chuyên gia pháp lý

24/11/15 4:30

Ironclad đã ra mắt Ironclad Jurist, trợ lý pháp lý AI mới được thiết kế để tăng hiệu quả cho các chuyên gia pháp lý.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
IBM công bố bảo mật tự động cho AI đám mây

IBM công bố bảo mật tự động cho AI đám mây

24/11/15 4:30

IBM vừa công bố Autonomous Security for Cloud (ASC), sáng kiến mới nhất của công ty nhằm mục đích đơn giản hóa quá trình chuyển đổi của các tổ chức sang môi trường đám mây.

Technavio dự đoán sự tăng trưởng đáng kể trong thị trường IoT toàn cầu

Technavio dự đoán sự tăng trưởng đáng kể trong thị trường IoT toàn cầu

24/11/15 4:30

Nghiên cứu mới nhất của Technavio đã dự đoán rằng thị trường Internet vạn vật (IoT) toàn cầu sẽ mở rộng đáng kể, tăng thêm 1,55 nghìn tỷ đô la Mỹ trong giai đoạn 2024 - 2028.

Invideo ra mắt V3, giúp việc tạo video AI trở nên dễ dàng

Invideo ra mắt V3, giúp việc tạo video AI trở nên dễ dàng

24/11/15 4:30

Invideo, nền tảng sáng tạo video AI, vừa công bố cải tiến mới nhất của mình: V3.

Ironclad phát hành Jurist AI dành cho các chuyên gia pháp lý

Ironclad phát hành Jurist AI dành cho các chuyên gia pháp lý

24/11/15 4:30

Ironclad đã ra mắt Ironclad Jurist, trợ lý pháp lý AI mới được thiết kế để tăng hiệu quả cho các chuyên gia pháp lý.

bottom of page