NVIDIA NeMo Meningkatkan Model ASR untuk Kecepatan dan Akurasi 8/2530

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA NeMo meningkatkan kecepatan dan akurasi model ASR

Generatived

24/9/25 3:30

NVIDIA NeMo terus menyempurnakan model Pengenalan Ucapan Otomatis (ASR) dan diakui kinerjanya di Papan Peringkat ASR Hugging Face Open. Rangkaian model mencakup berbagai arsitektur yang menyeimbangkan kecepatan dan akurasi, termasuk model CTC, RNN-T, TDT, TDT-CTC, dan AED. Setiap model dirancang dengan fitur spesifik, seperti model CTC non-autoregresif untuk inferensi cepat dan model AED autoregresif untuk akurasi tinggi.

Perusahaan telah menghilangkan hambatan kecepatan sebelumnya dalam model ASR, meningkatkan kecepatan inferensi hingga 10x. Peningkatan ini disebabkan oleh beberapa peningkatan penting, termasuk kemampuan untuk mentransmisikan tensor secara otomatis ke bfloat16, algoritma loop label yang inovatif, dan pengenalan grafik CUDA di NeMo 2.0.0. Pengoptimalan ini secara signifikan mengurangi overhead cast, beban komputasi yang rendah, dan masalah performa berbeda yang sebelumnya menghambat efisiensi model.

NVIDIA juga mengatasi tantangan presisi pencampuran otomatis (AMP) dan optimalisasi pemrosesan batch untuk lebih meningkatkan kinerja. Dengan memanfaatkan sepenuhnya inferensi setengah presisi dan beralih ke pemrosesan batch penuh, perusahaan mencapai peningkatan throughput yang signifikan. Selain itu, dengan diperkenalkannya node kondisional CUDA Graphs, overhead startup kernel kini dapat dihilangkan dalam model RNN-T dan TDT, yang biasanya memiliki beban komputasi rendah.

Puncak dari penyempurnaan ini tidak hanya meningkatkan kecepatan model ASR NVIDIA, namun juga memberikan penghematan biaya yang signifikan. Membandingkan biaya transkripsi 1 juta jam audio menggunakan CPU dan GPU NVIDIA, kami menunjukkan penghematan biaya hingga 4,5x untuk inferensi bertenaga GPU pada NVIDIA A100. NVIDIA terus menyempurnakan model dan mengintegrasikan teknologi canggih seperti node kondisi Grafik CUDA dan TorchInductor untuk lebih meningkatkan kecepatan dan efisiensi GPU. Model CTC transduser hibrida kompak perusahaan, Parakeet TDT CTC 10M, juga telah meningkatkan akurasi dan kecepatan, sehingga memperluas kemampuan NeMo ASR.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Berita terkini

NVIDIA RTX mengaktifkan plugin AI untuk pengguna Obsidian

24/11/7 4:30

Komunitas penggemar AI sedang menjajaki cara untuk mengintegrasikan model bahasa skala besar (LLM) ke dalam alur kerja produktivitas mereka dengan memanfaatkan aplikasi yang mendukung plugin komunitas.

Baca lebih lanjut

Memeluk Wajah, NVIDIA bersatu untuk inovasi robotika

24/11/7 4:30

Hugging Face dan NVIDIA berkolaborasi pada Robotics Learning Conference di Munich untuk memperkuat penelitian dan pengembangan robotika.

Baca lebih lanjut

NVIDIA meluncurkan alat AI untuk pengembangan robot tingkat lanjut

24/11/7 4:30

NVIDIA mengumumkan serangkaian alat AI dan simulasi yang bertujuan untuk mempercepat pengembangan robot bertenaga AI pada Robot Learning Conference di Munich.

Baca lebih lanjut

NVIDIA memperluas NeMo untuk mendukung pengembangan model AI

24/11/7 4:30

NVIDIA mengumumkan penyempurnaan pada platform NeMo yang mendukung pengembangan model AI generatif multimodal.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Kebijakan Privasi

Ketentuan Penggunaan Situs

Perusahaan yang mengoperasikan

Ikuti kami

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Generator seni/ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan aplikasi AI terbaik

Berita

Tentang kami

Kebijakan privasi

Ketentuan Penggunaan Situs

Perusahaan pengelola

Profil perusahaan

Berita terkini

NVIDIA RTX mengaktifkan plugin AI untuk pengguna Obsidian

24/11/7 4:30

Komunitas penggemar AI sedang menjajaki cara untuk mengintegrasikan model bahasa skala besar (LLM) ke dalam alur kerja produktivitas mereka dengan memanfaatkan aplikasi yang mendukung plugin komunitas.

Baca lebih lanjut

Memeluk Wajah, NVIDIA bersatu untuk inovasi robotika

24/11/7 4:30

Hugging Face dan NVIDIA berkolaborasi pada Robotics Learning Conference di Munich untuk memperkuat penelitian dan pengembangan robotika.

Baca lebih lanjut

NVIDIA meluncurkan alat AI untuk pengembangan robot tingkat lanjut

24/11/7 4:30

NVIDIA mengumumkan serangkaian alat AI dan simulasi yang bertujuan untuk mempercepat pengembangan robot bertenaga AI pada Robot Learning Conference di Munich.

Baca lebih lanjut

NVIDIA memperluas NeMo untuk mendukung pengembangan model AI

24/11/7 4:30

NVIDIA mengumumkan penyempurnaan pada platform NeMo yang mendukung pengembangan model AI generatif multimodal.

Baca lebih lanjut