Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
NVIDIA NeMo cải thiện tốc độ và độ chính xác của các mô hình ASR
Generatived
24/9/25 3:30
NVIDIA NeMo tiếp tục cải tiến các mô hình Nhận dạng giọng nói tự động (ASR) và được công nhận về hiệu suất trên Bảng xếp hạng ASR ôm mặt mở. Bộ mô hình bao gồm nhiều kiến trúc cân bằng giữa tốc độ và độ chính xác, bao gồm các mô hình CTC, RNN-T, TDT, TDT-CTC và AED. Mỗi mô hình được thiết kế với các tính năng cụ thể, chẳng hạn như mô hình CTC không tự hồi quy để suy luận nhanh và mô hình AED tự hồi quy cho độ chính xác cao.
Công ty đã loại bỏ các tắc nghẽn tốc độ trước đây trong các mô hình ASR, tăng tốc độ suy luận lên tới 10 lần. Sự cải tiến này là do một số cải tiến quan trọng, bao gồm khả năng tự động chuyển các tensor sang bfloat16, một thuật toán vòng lặp nhãn cải tiến và sự ra đời của đồ thị CUDA trong NeMo 2.0.0. Những tối ưu hóa này làm giảm đáng kể chi phí truyền, tải tính toán thấp và các vấn đề về hiệu suất khác nhau mà trước đây đã cản trở hiệu quả của mô hình.
NVIDIA cũng giải quyết các thách thức về độ chính xác trộn tự động (AMP) và tối ưu hóa xử lý hàng loạt để cải thiện hiệu suất hơn nữa. Bằng cách tận dụng tối đa khả năng suy luận có độ chính xác một nửa và chuyển sang xử lý hàng loạt đầy đủ, công ty đã đạt được mức tăng thông lượng đáng kể. Hơn nữa, với việc giới thiệu các nút có điều kiện CUDA Graphs, giờ đây có thể loại bỏ chi phí khởi động kernel trong các mô hình RNN-T và TDT, vốn thường chịu tải tính toán thấp.
Đỉnh cao của những cải tiến này không chỉ giúp tăng tốc độ của mô hình ASR của NVIDIA mà còn giúp tiết kiệm chi phí đáng kể. So sánh chi phí phiên âm 1 triệu giờ âm thanh bằng CPU và GPU NVIDIA, chúng tôi đã chứng minh mức tiết kiệm chi phí lên tới 4,5 lần cho suy luận dựa trên GPU trên NVIDIA A100. NVIDIA tiếp tục cải tiến mô hình và tích hợp các công nghệ tiên tiến như nút điều kiện CUDA Graphs và TorchInductor để tăng thêm tốc độ và hiệu quả của GPU. Mẫu CTC đầu dò hybrid nhỏ gọn của công ty, Parakeet TDT CTC 10M, cũng đã cải thiện độ chính xác và tốc độ, mở rộng khả năng của NeMo ASR.
Chia sẻ bài viết này:
Tin tức mới nhất
Hội thảo AI Rewire sẽ được tổ chức vào tháng 10 năm 2024
24/11/15 4:30
Rewire (Minato-ku, Tokyo) sẽ tổ chức hội thảo có chủ đề "AI của CƠ HỘI" vào ngày 24 tháng 10 năm 2024.
Thông báo về Hội thảo trực tuyến WonderSpace SEO/SEM
24/11/15 4:30
WonderSpace (Minato-ku, Tokyo) đã thông báo rằng họ sẽ tổ chức một hội thảo trực tuyến về cách cải thiện hiệu quả tạo nội dung SEO/SEM bằng ChatGPT.
Dự án kịch bản AI cho phim truyền hình ABEJA Hashida
24/11/15 4:30
ABEJA (Minato-ku, Tokyo) sẽ hợp tác với Quỹ văn hóa Hashida (Chiyoda-ku, Tokyo) và tham gia dự án "AI Hashida SUGAko".
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Hội thảo AI Rewire sẽ được tổ chức vào tháng 10 năm 2024
24/11/15 4:30
Rewire (Minato-ku, Tokyo) sẽ tổ chức hội thảo có chủ đề "AI của CƠ HỘI" vào ngày 24 tháng 10 năm 2024.
Thông báo về Hội thảo trực tuyến WonderSpace SEO/SEM
24/11/15 4:30
WonderSpace (Minato-ku, Tokyo) đã thông báo rằng họ sẽ tổ chức một hội thảo trực tuyến về cách cải thiện hiệu quả tạo nội dung SEO/SEM bằng ChatGPT.
Dự án kịch bản AI cho phim truyền hình ABEJA Hashida
24/11/15 4:30
ABEJA (Minato-ku, Tokyo) sẽ hợp tác với Quỹ văn hóa Hashida (Chiyoda-ku, Tokyo) và tham gia dự án "AI Hashida SUGAko".