top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA NeMo cải thiện tốc độ và độ chính xác của các mô hình ASR

Generatived

24/9/25 3:30

NVIDIA NeMo tiếp tục cải tiến các mô hình Nhận dạng giọng nói tự động (ASR) và được công nhận về hiệu suất trên Bảng xếp hạng ASR ôm mặt mở. Bộ mô hình bao gồm nhiều kiến ​​trúc cân bằng giữa tốc độ và độ chính xác, bao gồm các mô hình CTC, RNN-T, TDT, TDT-CTC và AED. Mỗi mô hình được thiết kế với các tính năng cụ thể, chẳng hạn như mô hình CTC không tự hồi quy để suy luận nhanh và mô hình AED tự hồi quy cho độ chính xác cao.

Công ty đã loại bỏ các tắc nghẽn tốc độ trước đây trong các mô hình ASR, tăng tốc độ suy luận lên tới 10 lần. Sự cải tiến này là do một số cải tiến quan trọng, bao gồm khả năng tự động chuyển các tensor sang bfloat16, một thuật toán vòng lặp nhãn cải tiến và sự ra đời của đồ thị CUDA trong NeMo 2.0.0. Những tối ưu hóa này làm giảm đáng kể chi phí truyền, tải tính toán thấp và các vấn đề về hiệu suất khác nhau mà trước đây đã cản trở hiệu quả của mô hình.

NVIDIA cũng giải quyết các thách thức về độ chính xác trộn tự động (AMP) và tối ưu hóa xử lý hàng loạt để cải thiện hiệu suất hơn nữa. Bằng cách tận dụng tối đa khả năng suy luận có độ chính xác một nửa và chuyển sang xử lý hàng loạt đầy đủ, công ty đã đạt được mức tăng thông lượng đáng kể. Hơn nữa, với việc giới thiệu các nút có điều kiện CUDA Graphs, giờ đây có thể loại bỏ chi phí khởi động kernel trong các mô hình RNN-T và TDT, vốn thường chịu tải tính toán thấp.

Đỉnh cao của những cải tiến này không chỉ giúp tăng tốc độ của mô hình ASR của NVIDIA mà còn giúp tiết kiệm chi phí đáng kể. So sánh chi phí phiên âm 1 triệu giờ âm thanh bằng CPU và GPU NVIDIA, chúng tôi đã chứng minh mức tiết kiệm chi phí lên tới 4,5 lần cho suy luận dựa trên GPU trên NVIDIA A100. NVIDIA tiếp tục cải tiến mô hình và tích hợp các công nghệ tiên tiến như nút điều kiện CUDA Graphs và TorchInductor để tăng thêm tốc độ và hiệu quả của GPU. Mẫu CTC đầu dò hybrid nhỏ gọn của công ty, Parakeet TDT CTC 10M, cũng đã cải thiện độ chính xác và tốc độ, mở rộng khả năng của NeMo ASR.

Chia sẻ bài viết này:

Tin tức mới nhất
Cloudera giới thiệu Copilot để tăng năng suất cho các chuyên gia dữ liệu

Cloudera giới thiệu Copilot để tăng năng suất cho các chuyên gia dữ liệu

24/11/15 4:30

Cloudera đã công bố Cloudera Copilot dành cho Cloudera AI tại EVOLVE24 Paris.

Cognigy phát hành AI dựa trên tác nhân để nâng cao dịch vụ khách hàng

Cognigy phát hành AI dựa trên tác nhân để nâng cao dịch vụ khách hàng

24/11/15 4:30

Cognigy vừa công bố Agentic AI, một tính năng mới của nền tảng Cognigy.AI nhằm mục đích chuyển đổi dịch vụ khách hàng cho doanh nghiệp.

Người mua sắm sử dụng GenAI để mua sắm thông minh hơn trong kỳ nghỉ lễ

Người mua sắm sử dụng GenAI để mua sắm thông minh hơn trong kỳ nghỉ lễ

24/11/15 4:30

Trong bối cảnh áp lực kinh tế, một bộ phận đáng kể người tiêu dùng, lên tới 75%, đang chuẩn bị tận dụng các đợt giảm giá Black Friday, Cyber Monday và Ngày lễ độc thân.

Hệ sinh thái AI đàn hồi thúc đẩy sự phát triển của doanh nghiệp RAG

Hệ sinh thái AI đàn hồi thúc đẩy sự phát triển của doanh nghiệp RAG

24/11/15 4:30

Elastic vừa công bố hệ sinh thái AI nhằm mục đích giúp các nhà phát triển doanh nghiệp đẩy nhanh quá trình tạo và triển khai các ứng dụng Retrieval Augmented Generation (RAG).

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Cloudera giới thiệu Copilot để tăng năng suất cho các chuyên gia dữ liệu

Cloudera giới thiệu Copilot để tăng năng suất cho các chuyên gia dữ liệu

24/11/15 4:30

Cloudera đã công bố Cloudera Copilot dành cho Cloudera AI tại EVOLVE24 Paris.

Cognigy phát hành AI dựa trên tác nhân để nâng cao dịch vụ khách hàng

Cognigy phát hành AI dựa trên tác nhân để nâng cao dịch vụ khách hàng

24/11/15 4:30

Cognigy vừa công bố Agentic AI, một tính năng mới của nền tảng Cognigy.AI nhằm mục đích chuyển đổi dịch vụ khách hàng cho doanh nghiệp.

Người mua sắm sử dụng GenAI để mua sắm thông minh hơn trong kỳ nghỉ lễ

Người mua sắm sử dụng GenAI để mua sắm thông minh hơn trong kỳ nghỉ lễ

24/11/15 4:30

Trong bối cảnh áp lực kinh tế, một bộ phận đáng kể người tiêu dùng, lên tới 75%, đang chuẩn bị tận dụng các đợt giảm giá Black Friday, Cyber Monday và Ngày lễ độc thân.

Hệ sinh thái AI đàn hồi thúc đẩy sự phát triển của doanh nghiệp RAG

Hệ sinh thái AI đàn hồi thúc đẩy sự phát triển của doanh nghiệp RAG

24/11/15 4:30

Elastic vừa công bố hệ sinh thái AI nhằm mục đích giúp các nhà phát triển doanh nghiệp đẩy nhanh quá trình tạo và triển khai các ứng dụng Retrieval Augmented Generation (RAG).

bottom of page