top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA BigVGAN v2 hỗ trợ tổng hợp âm thanh chất lượng cao

Generatived

24/9/6 4:30

NVIDIA đã đạt được những tiến bộ đáng kể trong lĩnh vực AI tạo âm thanh với sự phát triển của BigVGAN, một mô hình được thiết kế đặc biệt để tổng hợp các dạng sóng âm thanh với tốc độ và độ bền đáng kinh ngạc. Là sự hợp tác giữa nhóm Nghiên cứu học sâu ứng dụng của NVIDIA và nhóm NeMo, mô hình này được thiết kế để xử lý nhiều loại âm thanh khác nhau, bao gồm lời nói, âm thanh xung quanh và âm nhạc. BigVGAN v2, phiên bản mới nhất của BigVGAN, nhằm mục đích cải thiện cả tốc độ tổng hợp và chất lượng âm thanh, tạo ra âm thanh gần như không thể phân biệt được với bản ghi âm thực.

Model BigVGAN v2 được đặc trưng bởi khả năng cung cấp âm thanh chất lượng cao với nhiều loại âm thanh. Nó được đào tạo trên một tập dữ liệu khổng lồ bao gồm nhiều ngôn ngữ, âm thanh môi trường và nhạc cụ, cho phép bạn tạo ra các sóng âm thanh chi tiết từ một mô hình duy nhất. Kiến trúc của mô hình bao gồm một mô-đun mới có tên là Tổng hợp đa chu kỳ chống răng cưa (AMP), có chức năng tạo ra sóng âm thanh tần số cao và định kỳ. Sự đổi mới này cho phép BigVGAN v2 giải quyết thách thức tạo ra chi tiết tinh tế trong âm thanh tần số cao, một thiếu sót chung của các phương pháp mã hóa truyền thống.

Là một bước đột phá trong công nghệ tổng hợp âm thanh, BigVGAN v2 mở rộng công suất tốc độ lấy mẫu lên 44 kHz, bao phủ toàn bộ phạm vi thính giác của con người. Cải tiến này cho phép mô hình tái tạo chính xác nhiều loại âm thanh, từ những nốt trầm của trống đến những nốt cao của chũm chọe. Ngoài ra, BigVGAN v2 tăng tốc đáng kể tốc độ tổng hợp bằng cách kết hợp nhân CUDA được tối ưu hóa, mang lại khả năng suy luận nhanh hơn gấp 3 lần so với phiên bản tiền nhiệm.

Cam kết của NVIDIA trong việc thúc đẩy AI tạo âm thanh được thể hiện bằng việc phát hành BigVGAN v2, một chuẩn mực mới cho công nghệ bộ mã hóa thần kinh và chất lượng âm thanh. Hiệu suất vượt trội và khả năng tổng hợp nhanh của mô hình mang lại lợi ích cho nhiều ứng dụng, từ thực tế ảo đến tạo nội dung số. Với BigVGAN v2, NVIDIA tiếp tục vượt qua ranh giới của những gì có thể có trong lĩnh vực thính giác bằng cách tạo ra âm thanh chất lượng cao thậm chí còn dễ tiếp cận và hiệu quả hơn.

Chia sẻ bài viết này:

Tin tức mới nhất
Thông báo mở rộng AI của Dell Technologies Communications

Thông báo mở rộng AI của Dell Technologies Communications

24/11/15 4:30

Dell Technologies (Round Rock, Texas) thông báo đã mở rộng chương trình "Dell AI for Telecom" dành cho các công ty viễn thông.

Hỗ trợ triển khai Generative AI Lancers bắt đầu

Hỗ trợ triển khai Generative AI Lancers bắt đầu

24/11/15 4:30

Lancers (Shibuya-ku, Tokyo) đã ra mắt "Giải pháp Generative AI Lancers" để hỗ trợ các công ty giới thiệu Generative AI .

Hỗ trợ Trung tâm cuộc gọi AI của Công nghệ hệ thống Nhật Bản

Hỗ trợ Trung tâm cuộc gọi AI của Công nghệ hệ thống Nhật Bản

24/11/15 4:30

Japan System Technologies (Osaka) đã tích hợp "BIZTEL" của Link và AI Messenger Voicebot của AI Shift vào hoạt động nội bộ của hệ thống hỗ trợ kinh doanh dành cho các công ty bảo hiểm "iBss".

Hỗ trợ chính quyền địa phương AI của thành phố Imakuraie Goto

Hỗ trợ chính quyền địa phương AI của thành phố Imakuraie Goto

24/11/15 4:30

Imacrie (Minato-ku, Tokyo) đã bắt đầu cung cấp "gói Generative AI exaBase cho hoạt động của chính quyền địa phương" cho Thành phố Goto.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Thông báo mở rộng AI của Dell Technologies Communications

Thông báo mở rộng AI của Dell Technologies Communications

24/11/15 4:30

Dell Technologies (Round Rock, Texas) thông báo đã mở rộng chương trình "Dell AI for Telecom" dành cho các công ty viễn thông.

Hỗ trợ triển khai Generative AI Lancers bắt đầu

Hỗ trợ triển khai Generative AI Lancers bắt đầu

24/11/15 4:30

Lancers (Shibuya-ku, Tokyo) đã ra mắt "Giải pháp Generative AI Lancers" để hỗ trợ các công ty giới thiệu Generative AI .

Hỗ trợ Trung tâm cuộc gọi AI của Công nghệ hệ thống Nhật Bản

Hỗ trợ Trung tâm cuộc gọi AI của Công nghệ hệ thống Nhật Bản

24/11/15 4:30

Japan System Technologies (Osaka) đã tích hợp "BIZTEL" của Link và AI Messenger Voicebot của AI Shift vào hoạt động nội bộ của hệ thống hỗ trợ kinh doanh dành cho các công ty bảo hiểm "iBss".

Hỗ trợ chính quyền địa phương AI của thành phố Imakuraie Goto

Hỗ trợ chính quyền địa phương AI của thành phố Imakuraie Goto

24/11/15 4:30

Imacrie (Minato-ku, Tokyo) đã bắt đầu cung cấp "gói Generative AI exaBase cho hoạt động của chính quyền địa phương" cho Thành phố Goto.

bottom of page