top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA NeMo meningkatkan kecepatan dan akurasi model ASR

Generatived

24/9/25 3:30

NVIDIA NeMo terus menyempurnakan model Pengenalan Ucapan Otomatis (ASR) dan diakui kinerjanya di Papan Peringkat ASR Hugging Face Open. Rangkaian model mencakup berbagai arsitektur yang menyeimbangkan kecepatan dan akurasi, termasuk model CTC, RNN-T, TDT, TDT-CTC, dan AED. Setiap model dirancang dengan fitur spesifik, seperti model CTC non-autoregresif untuk inferensi cepat dan model AED autoregresif untuk akurasi tinggi.

Perusahaan telah menghilangkan hambatan kecepatan sebelumnya dalam model ASR, meningkatkan kecepatan inferensi hingga 10x. Peningkatan ini disebabkan oleh beberapa peningkatan penting, termasuk kemampuan untuk mentransmisikan tensor secara otomatis ke bfloat16, algoritma loop label yang inovatif, dan pengenalan grafik CUDA di NeMo 2.0.0. Pengoptimalan ini secara signifikan mengurangi overhead cast, beban komputasi yang rendah, dan masalah performa berbeda yang sebelumnya menghambat efisiensi model.

NVIDIA juga mengatasi tantangan presisi pencampuran otomatis (AMP) dan optimalisasi pemrosesan batch untuk lebih meningkatkan kinerja. Dengan memanfaatkan sepenuhnya inferensi setengah presisi dan beralih ke pemrosesan batch penuh, perusahaan mencapai peningkatan throughput yang signifikan. Selain itu, dengan diperkenalkannya node kondisional CUDA Graphs, overhead startup kernel kini dapat dihilangkan dalam model RNN-T dan TDT, yang biasanya memiliki beban komputasi rendah.

Puncak dari penyempurnaan ini tidak hanya meningkatkan kecepatan model ASR NVIDIA, namun juga memberikan penghematan biaya yang signifikan. Membandingkan biaya transkripsi 1 juta jam audio menggunakan CPU dan GPU NVIDIA, kami menunjukkan penghematan biaya hingga 4,5x untuk inferensi bertenaga GPU pada NVIDIA A100. NVIDIA terus menyempurnakan model dan mengintegrasikan teknologi canggih seperti node kondisi Grafik CUDA dan TorchInductor untuk lebih meningkatkan kecepatan dan efisiensi GPU. Model CTC transduser hibrida kompak perusahaan, Parakeet TDT CTC 10M, juga telah meningkatkan akurasi dan kecepatan, sehingga memperluas kemampuan NeMo ASR.

Bagikan artikel ini:

Berita terkini
Penggunaan Generative AI Inti dan Survei Motivasi Kerja

Penggunaan Generative AI Inti dan Survei Motivasi Kerja

24/11/13 4:30

Core (Shinjuku, Tokyo) telah mengumumkan hasil survei tentang "Motivasi kerja bergantung pada tersedia atau tidaknya Generative AI di tempat kerja"

Institut Teknologi Tokyo merilis "CloneM&A" untuk mewujudkan transaksi M&A yang efisien

Institut Teknologi Tokyo merilis "CloneM&A" untuk mewujudkan transaksi M&A yang efisien

24/11/13 4:30

Dalam langkah perintis di bidang M&A, sebuah perusahaan yang berpusat di Tokyo telah memanfaatkan teknologi "CloneM&A" bertenaga AI untuk berhasil menyelesaikan transaksi merger dan akuisisi bagi anggota Relo Group.

15Five merilis alat AI untuk meningkatkan strategi SDM

15Five merilis alat AI untuk meningkatkan strategi SDM

24/11/13 4:30

15Five telah meluncurkan Model Dampak Prediktif, alat berbasis AI yang dirancang untuk meningkatkan perencanaan SDM strategis dengan memprediksi hasil keterlibatan karyawan.

AKOOL Capai ARR $40 Juta dengan Alat AI Canggih

AKOOL Capai ARR $40 Juta dengan Alat AI Canggih

24/11/13 4:30

SANTA CLARA, California – AKOOL, pemimpin dalam pembuatan konten bertenaga AI, mengumumkan tonggak penting dengan mencapai pendapatan berulang tahunan (ARR) yang ditagih sebesar $40 juta.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Penggunaan Generative AI Inti dan Survei Motivasi Kerja

Penggunaan Generative AI Inti dan Survei Motivasi Kerja

24/11/13 4:30

Core (Shinjuku, Tokyo) telah mengumumkan hasil survei tentang "Motivasi kerja bergantung pada tersedia atau tidaknya Generative AI di tempat kerja"

Institut Teknologi Tokyo merilis "CloneM&A" untuk mewujudkan transaksi M&A yang efisien

Institut Teknologi Tokyo merilis "CloneM&A" untuk mewujudkan transaksi M&A yang efisien

24/11/13 4:30

Dalam langkah perintis di bidang M&A, sebuah perusahaan yang berpusat di Tokyo telah memanfaatkan teknologi "CloneM&A" bertenaga AI untuk berhasil menyelesaikan transaksi merger dan akuisisi bagi anggota Relo Group.

15Five merilis alat AI untuk meningkatkan strategi SDM

15Five merilis alat AI untuk meningkatkan strategi SDM

24/11/13 4:30

15Five telah meluncurkan Model Dampak Prediktif, alat berbasis AI yang dirancang untuk meningkatkan perencanaan SDM strategis dengan memprediksi hasil keterlibatan karyawan.

AKOOL Capai ARR $40 Juta dengan Alat AI Canggih

AKOOL Capai ARR $40 Juta dengan Alat AI Canggih

24/11/13 4:30

SANTA CLARA, California – AKOOL, pemimpin dalam pembuatan konten bertenaga AI, mengumumkan tonggak penting dengan mencapai pendapatan berulang tahunan (ARR) yang ditagih sebesar $40 juta.

bottom of page