Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
NVIDIA NeMo cải thiện tốc độ và độ chính xác của các mô hình ASR
Generatived
24/9/25 3:30
NVIDIA NeMo tiếp tục cải tiến các mô hình Nhận dạng giọng nói tự động (ASR) và được công nhận về hiệu suất trên Bảng xếp hạng ASR ôm mặt mở. Bộ mô hình bao gồm nhiều kiến trúc cân bằng giữa tốc độ và độ chính xác, bao gồm các mô hình CTC, RNN-T, TDT, TDT-CTC và AED. Mỗi mô hình được thiết kế với các tính năng cụ thể, chẳng hạn như mô hình CTC không tự hồi quy để suy luận nhanh và mô hình AED tự hồi quy cho độ chính xác cao.
Công ty đã loại bỏ các tắc nghẽn tốc độ trước đây trong các mô hình ASR, tăng tốc độ suy luận lên tới 10 lần. Sự cải tiến này là do một số cải tiến quan trọng, bao gồm khả năng tự động chuyển các tensor sang bfloat16, một thuật toán vòng lặp nhãn cải tiến và sự ra đời của đồ thị CUDA trong NeMo 2.0.0. Những tối ưu hóa này làm giảm đáng kể chi phí truyền, tải tính toán thấp và các vấn đề về hiệu suất khác nhau mà trước đây đã cản trở hiệu quả của mô hình.
NVIDIA cũng giải quyết các thách thức về độ chính xác trộn tự động (AMP) và tối ưu hóa xử lý hàng loạt để cải thiện hiệu suất hơn nữa. Bằng cách tận dụng tối đa khả năng suy luận có độ chính xác một nửa và chuyển sang xử lý hàng loạt đầy đủ, công ty đã đạt được mức tăng thông lượng đáng kể. Hơn nữa, với việc giới thiệu các nút có điều kiện CUDA Graphs, giờ đây có thể loại bỏ chi phí khởi động kernel trong các mô hình RNN-T và TDT, vốn thường chịu tải tính toán thấp.
Đỉnh cao của những cải tiến này không chỉ giúp tăng tốc độ của mô hình ASR của NVIDIA mà còn giúp tiết kiệm chi phí đáng kể. So sánh chi phí phiên âm 1 triệu giờ âm thanh bằng CPU và GPU NVIDIA, chúng tôi đã chứng minh mức tiết kiệm chi phí lên tới 4,5 lần cho suy luận dựa trên GPU trên NVIDIA A100. NVIDIA tiếp tục cải tiến mô hình và tích hợp các công nghệ tiên tiến như nút điều kiện CUDA Graphs và TorchInductor để tăng thêm tốc độ và hiệu quả của GPU. Mẫu CTC đầu dò hybrid nhỏ gọn của công ty, Parakeet TDT CTC 10M, cũng đã cải thiện độ chính xác và tốc độ, mở rộng khả năng của NeMo ASR.
Chia sẻ bài viết này:
Tin tức mới nhất
Visier công bố thành công của sáng kiến Workforce AI Edge
24/11/15 4:30
Visier báo cáo kết quả kinh doanh khả quan trong quý 3 của năm tài chính, nhấn mạnh nhu cầu ngày càng tăng đối với các giải pháp AI dành cho lực lượng lao động.
Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI
24/11/15 4:30
Webware.ai đã ra mắt Rivi, một công cụ tiếp thị và bán hàng mới sử dụng AI được thiết kế riêng để tăng cường sự hiện diện kỹ thuật số của các doanh nghiệp dịch vụ vừa và nhỏ.
Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới
24/11/15 4:30
Các công ty đang dần từ bỏ cách tiếp cận thận trọng "chờ đợi và quan sát" đang thấy ở nhiều công ty và đang chủ động hơn trong việc tích hợp AI vào bán lẻ.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Visier công bố thành công của sáng kiến Workforce AI Edge
24/11/15 4:30
Visier báo cáo kết quả kinh doanh khả quan trong quý 3 của năm tài chính, nhấn mạnh nhu cầu ngày càng tăng đối với các giải pháp AI dành cho lực lượng lao động.
Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI
24/11/15 4:30
Webware.ai đã ra mắt Rivi, một công cụ tiếp thị và bán hàng mới sử dụng AI được thiết kế riêng để tăng cường sự hiện diện kỹ thuật số của các doanh nghiệp dịch vụ vừa và nhỏ.
Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới
24/11/15 4:30
Các công ty đang dần từ bỏ cách tiếp cận thận trọng "chờ đợi và quan sát" đang thấy ở nhiều công ty và đang chủ động hơn trong việc tích hợp AI vào bán lẻ.