Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
NVIDIA BigVGAN v2 hỗ trợ tổng hợp âm thanh chất lượng cao
Generatived
24/9/6 4:30
NVIDIA đã đạt được những tiến bộ đáng kể trong lĩnh vực AI tạo âm thanh với sự phát triển của BigVGAN, một mô hình được thiết kế đặc biệt để tổng hợp các dạng sóng âm thanh với tốc độ và độ bền đáng kinh ngạc. Là sự hợp tác giữa nhóm Nghiên cứu học sâu ứng dụng của NVIDIA và nhóm NeMo, mô hình này được thiết kế để xử lý nhiều loại âm thanh khác nhau, bao gồm lời nói, âm thanh xung quanh và âm nhạc. BigVGAN v2, phiên bản mới nhất của BigVGAN, nhằm mục đích cải thiện cả tốc độ tổng hợp và chất lượng âm thanh, tạo ra âm thanh gần như không thể phân biệt được với bản ghi âm thực.
Model BigVGAN v2 được đặc trưng bởi khả năng cung cấp âm thanh chất lượng cao với nhiều loại âm thanh. Nó được đào tạo trên một tập dữ liệu khổng lồ bao gồm nhiều ngôn ngữ, âm thanh môi trường và nhạc cụ, cho phép bạn tạo ra các sóng âm thanh chi tiết từ một mô hình duy nhất. Kiến trúc của mô hình bao gồm một mô-đun mới có tên là Tổng hợp đa chu kỳ chống răng cưa (AMP), có chức năng tạo ra sóng âm thanh tần số cao và định kỳ. Sự đổi mới này cho phép BigVGAN v2 giải quyết thách thức tạo ra chi tiết tinh tế trong âm thanh tần số cao, một thiếu sót chung của các phương pháp mã hóa truyền thống.
Là một bước đột phá trong công nghệ tổng hợp âm thanh, BigVGAN v2 mở rộng công suất tốc độ lấy mẫu lên 44 kHz, bao phủ toàn bộ phạm vi thính giác của con người. Cải tiến này cho phép mô hình tái tạo chính xác nhiều loại âm thanh, từ những nốt trầm của trống đến những nốt cao của chũm chọe. Ngoài ra, BigVGAN v2 tăng tốc đáng kể tốc độ tổng hợp bằng cách kết hợp nhân CUDA được tối ưu hóa, mang lại khả năng suy luận nhanh hơn gấp 3 lần so với phiên bản tiền nhiệm.
Cam kết của NVIDIA trong việc thúc đẩy AI tạo âm thanh được thể hiện bằng việc phát hành BigVGAN v2, một chuẩn mực mới cho công nghệ bộ mã hóa thần kinh và chất lượng âm thanh. Hiệu suất vượt trội và khả năng tổng hợp nhanh của mô hình mang lại lợi ích cho nhiều ứng dụng, từ thực tế ảo đến tạo nội dung số. Với BigVGAN v2, NVIDIA tiếp tục vượt qua ranh giới của những gì có thể có trong lĩnh vực thính giác bằng cách tạo ra âm thanh chất lượng cao thậm chí còn dễ tiếp cận và hiệu quả hơn.
Chia sẻ bài viết này:
Tin tức mới nhất
Visier công bố thành công của sáng kiến Workforce AI Edge
24/11/15 4:30
Visier báo cáo kết quả kinh doanh khả quan trong quý 3 của năm tài chính, nhấn mạnh nhu cầu ngày càng tăng đối với các giải pháp AI dành cho lực lượng lao động.
Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI
24/11/15 4:30
Webware.ai đã ra mắt Rivi, một công cụ tiếp thị và bán hàng mới sử dụng AI được thiết kế riêng để tăng cường sự hiện diện kỹ thuật số của các doanh nghiệp dịch vụ vừa và nhỏ.
Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới
24/11/15 4:30
Các công ty đang dần từ bỏ cách tiếp cận thận trọng "chờ đợi và quan sát" đang thấy ở nhiều công ty và đang chủ động hơn trong việc tích hợp AI vào bán lẻ.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Visier công bố thành công của sáng kiến Workforce AI Edge
24/11/15 4:30
Visier báo cáo kết quả kinh doanh khả quan trong quý 3 của năm tài chính, nhấn mạnh nhu cầu ngày càng tăng đối với các giải pháp AI dành cho lực lượng lao động.
Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI
24/11/15 4:30
Webware.ai đã ra mắt Rivi, một công cụ tiếp thị và bán hàng mới sử dụng AI được thiết kế riêng để tăng cường sự hiện diện kỹ thuật số của các doanh nghiệp dịch vụ vừa và nhỏ.
Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới
24/11/15 4:30
Các công ty đang dần từ bỏ cách tiếp cận thận trọng "chờ đợi và quan sát" đang thấy ở nhiều công ty và đang chủ động hơn trong việc tích hợp AI vào bán lẻ.