Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
NVIDIA NeMo cải thiện tốc độ và độ chính xác của các mô hình ASR
Generatived
24/9/25 3:30
NVIDIA NeMo tiếp tục cải tiến các mô hình Nhận dạng giọng nói tự động (ASR) và được công nhận về hiệu suất trên Bảng xếp hạng ASR ôm mặt mở. Bộ mô hình bao gồm nhiều kiến trúc cân bằng giữa tốc độ và độ chính xác, bao gồm các mô hình CTC, RNN-T, TDT, TDT-CTC và AED. Mỗi mô hình được thiết kế với các tính năng cụ thể, chẳng hạn như mô hình CTC không tự hồi quy để suy luận nhanh và mô hình AED tự hồi quy cho độ chính xác cao.
Công ty đã loại bỏ các tắc nghẽn tốc độ trước đây trong các mô hình ASR, tăng tốc độ suy luận lên tới 10 lần. Sự cải tiến này là do một số cải tiến quan trọng, bao gồm khả năng tự động chuyển các tensor sang bfloat16, một thuật toán vòng lặp nhãn cải tiến và sự ra đời của đồ thị CUDA trong NeMo 2.0.0. Những tối ưu hóa này làm giảm đáng kể chi phí truyền, tải tính toán thấp và các vấn đề về hiệu suất khác nhau mà trước đây đã cản trở hiệu quả của mô hình.
NVIDIA cũng giải quyết các thách thức về độ chính xác trộn tự động (AMP) và tối ưu hóa xử lý hàng loạt để cải thiện hiệu suất hơn nữa. Bằng cách tận dụng tối đa khả năng suy luận có độ chính xác một nửa và chuyển sang xử lý hàng loạt đầy đủ, công ty đã đạt được mức tăng thông lượng đáng kể. Hơn nữa, với việc giới thiệu các nút có điều kiện CUDA Graphs, giờ đây có thể loại bỏ chi phí khởi động kernel trong các mô hình RNN-T và TDT, vốn thường chịu tải tính toán thấp.
Đỉnh cao của những cải tiến này không chỉ giúp tăng tốc độ của mô hình ASR của NVIDIA mà còn giúp tiết kiệm chi phí đáng kể. So sánh chi phí phiên âm 1 triệu giờ âm thanh bằng CPU và GPU NVIDIA, chúng tôi đã chứng minh mức tiết kiệm chi phí lên tới 4,5 lần cho suy luận dựa trên GPU trên NVIDIA A100. NVIDIA tiếp tục cải tiến mô hình và tích hợp các công nghệ tiên tiến như nút điều kiện CUDA Graphs và TorchInductor để tăng thêm tốc độ và hiệu quả của GPU. Mẫu CTC đầu dò hybrid nhỏ gọn của công ty, Parakeet TDT CTC 10M, cũng đã cải thiện độ chính xác và tốc độ, mở rộng khả năng của NeMo ASR.
Chia sẻ bài viết này:
Tin tức mới nhất
Trợ lý AI của eClinicalWorks giúp tăng hiệu quả tại Khoa thấp khớp Oklahoma
24/11/15 4:30
eClinicalWorks đã công bố việc triển khai thành công công nghệ hình ảnh hỗ trợ AI tại Cao đẳng thấp khớp Oklahoma, giúp cải thiện việc quản lý tài liệu và độ chính xác của hồ sơ bệnh nhân.
MegazoneCloud tham gia Liên minh đổi mới Generative AI AWS
24/11/15 4:30
MegazoneCloud, công ty quản lý đám mây hàng đầu Châu Á, đã được chọn làm đối tác chính trong Liên minh đổi mới đối tác Generative AI Amazon Web Services (AWS).
Monte Carlo công bố những cải tiến cho nền tảng quan sát dữ liệu của mình
24/11/15 4:30
Monte Carlo đã công bố một loạt cải tiến cho nền tảng quan sát dữ liệu của mình tại Hội nghị thượng đỉnh quan sát dữ liệu IMPACT.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Trợ lý AI của eClinicalWorks giúp tăng hiệu quả tại Khoa thấp khớp Oklahoma
24/11/15 4:30
eClinicalWorks đã công bố việc triển khai thành công công nghệ hình ảnh hỗ trợ AI tại Cao đẳng thấp khớp Oklahoma, giúp cải thiện việc quản lý tài liệu và độ chính xác của hồ sơ bệnh nhân.
MegazoneCloud tham gia Liên minh đổi mới Generative AI AWS
24/11/15 4:30
MegazoneCloud, công ty quản lý đám mây hàng đầu Châu Á, đã được chọn làm đối tác chính trong Liên minh đổi mới đối tác Generative AI Amazon Web Services (AWS).
Monte Carlo công bố những cải tiến cho nền tảng quan sát dữ liệu của mình
24/11/15 4:30
Monte Carlo đã công bố một loạt cải tiến cho nền tảng quan sát dữ liệu của mình tại Hội nghị thượng đỉnh quan sát dữ liệu IMPACT.