top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA NeMo cải thiện tốc độ và độ chính xác của các mô hình ASR

Generatived

24/9/25 3:30

NVIDIA NeMo tiếp tục cải tiến các mô hình Nhận dạng giọng nói tự động (ASR) và được công nhận về hiệu suất trên Bảng xếp hạng ASR ôm mặt mở. Bộ mô hình bao gồm nhiều kiến ​​trúc cân bằng giữa tốc độ và độ chính xác, bao gồm các mô hình CTC, RNN-T, TDT, TDT-CTC và AED. Mỗi mô hình được thiết kế với các tính năng cụ thể, chẳng hạn như mô hình CTC không tự hồi quy để suy luận nhanh và mô hình AED tự hồi quy cho độ chính xác cao.

Công ty đã loại bỏ các tắc nghẽn tốc độ trước đây trong các mô hình ASR, tăng tốc độ suy luận lên tới 10 lần. Sự cải tiến này là do một số cải tiến quan trọng, bao gồm khả năng tự động chuyển các tensor sang bfloat16, một thuật toán vòng lặp nhãn cải tiến và sự ra đời của đồ thị CUDA trong NeMo 2.0.0. Những tối ưu hóa này làm giảm đáng kể chi phí truyền, tải tính toán thấp và các vấn đề về hiệu suất khác nhau mà trước đây đã cản trở hiệu quả của mô hình.

NVIDIA cũng giải quyết các thách thức về độ chính xác trộn tự động (AMP) và tối ưu hóa xử lý hàng loạt để cải thiện hiệu suất hơn nữa. Bằng cách tận dụng tối đa khả năng suy luận có độ chính xác một nửa và chuyển sang xử lý hàng loạt đầy đủ, công ty đã đạt được mức tăng thông lượng đáng kể. Hơn nữa, với việc giới thiệu các nút có điều kiện CUDA Graphs, giờ đây có thể loại bỏ chi phí khởi động kernel trong các mô hình RNN-T và TDT, vốn thường chịu tải tính toán thấp.

Đỉnh cao của những cải tiến này không chỉ giúp tăng tốc độ của mô hình ASR của NVIDIA mà còn giúp tiết kiệm chi phí đáng kể. So sánh chi phí phiên âm 1 triệu giờ âm thanh bằng CPU và GPU NVIDIA, chúng tôi đã chứng minh mức tiết kiệm chi phí lên tới 4,5 lần cho suy luận dựa trên GPU trên NVIDIA A100. NVIDIA tiếp tục cải tiến mô hình và tích hợp các công nghệ tiên tiến như nút điều kiện CUDA Graphs và TorchInductor để tăng thêm tốc độ và hiệu quả của GPU. Mẫu CTC đầu dò hybrid nhỏ gọn của công ty, Parakeet TDT CTC 10M, cũng đã cải thiện độ chính xác và tốc độ, mở rộng khả năng của NeMo ASR.

Chia sẻ bài viết này:

Tin tức mới nhất
Chức năng mới của Beatrust hỗ trợ việc kết hợp tài năng

Chức năng mới của Beatrust hỗ trợ việc kết hợp tài năng

24/11/15 4:30

Beatrust (Minato-ku, Tokyo) đã bổ sung các tính năng mới: "Beatrust Scout", tính năng tìm kiếm ứng viên phù hợp từ cơ sở dữ liệu kỹ năng nội bộ của công ty và "Tag Extraction", tính năng tự động trích xuất kỹ năng từ thông tin nhân sự.

Được chọn là đối tác Generative AI của MegazoneCloud

Được chọn là đối tác Generative AI của MegazoneCloud

24/11/15 4:30

MegazoneCloud (Seoul, Hàn Quốc) đã được chọn làm thành viên ban đầu của Liên minh đổi mới đối tác Generative AI do Amazon Web Services khởi xướng.

Triển lãm chung của Studio51 và 4AP Triển lãm AI

Triển lãm chung của Studio51 và 4AP Triển lãm AI

24/11/15 4:30

Studio51 (Shinjuku-ku, Tokyo) sẽ hợp tác triển lãm với 4AP (Musashino-shi, Tokyo) tại Triển lãm AI/Trí tuệ nhân tạo được tổ chức tại Makuhari Messe từ ngày 20 tháng 11 năm 2024.

Trung tâm AI Accenture Kyoto mở cửa

Trung tâm AI Accenture Kyoto mở cửa

24/11/15 4:30

Accenture (Minato-ku, Tokyo) đã khai trương "Trung tâm AI tiên tiến Accenture Kyoto" mới tại Nakagyo-ku, thành phố Kyoto.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Chức năng mới của Beatrust hỗ trợ việc kết hợp tài năng

Chức năng mới của Beatrust hỗ trợ việc kết hợp tài năng

24/11/15 4:30

Beatrust (Minato-ku, Tokyo) đã bổ sung các tính năng mới: "Beatrust Scout", tính năng tìm kiếm ứng viên phù hợp từ cơ sở dữ liệu kỹ năng nội bộ của công ty và "Tag Extraction", tính năng tự động trích xuất kỹ năng từ thông tin nhân sự.

Được chọn là đối tác Generative AI của MegazoneCloud

Được chọn là đối tác Generative AI của MegazoneCloud

24/11/15 4:30

MegazoneCloud (Seoul, Hàn Quốc) đã được chọn làm thành viên ban đầu của Liên minh đổi mới đối tác Generative AI do Amazon Web Services khởi xướng.

Triển lãm chung của Studio51 và 4AP Triển lãm AI

Triển lãm chung của Studio51 và 4AP Triển lãm AI

24/11/15 4:30

Studio51 (Shinjuku-ku, Tokyo) sẽ hợp tác triển lãm với 4AP (Musashino-shi, Tokyo) tại Triển lãm AI/Trí tuệ nhân tạo được tổ chức tại Makuhari Messe từ ngày 20 tháng 11 năm 2024.

Trung tâm AI Accenture Kyoto mở cửa

Trung tâm AI Accenture Kyoto mở cửa

24/11/15 4:30

Accenture (Minato-ku, Tokyo) đã khai trương "Trung tâm AI tiên tiến Accenture Kyoto" mới tại Nakagyo-ku, thành phố Kyoto.

bottom of page