Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA TensorRT-LLM: Peningkatan performa dan akurasi untuk model bahasa skala besar
Generatived
11/9/23, 09.07
Kemajuan pesat dalam model bahasa skala besar (LLM) berkontribusi terhadap pesatnya pertumbuhan ekosistem, dengan beragam arsitektur model yang dikembangkan setiap hari. Model-model yang lebih besar ini membuka kemampuan-kemampuan dan kasus-kasus penggunaan baru, sehingga mengarah pada adopsi yang luas di berbagai industri. Alasan LLM mengubah lanskap pusat data. Bisnis mendapatkan keuntungan dari peningkatan kinerja dan peningkatan akurasi, sehingga menghasilkan total biaya kepemilikan (TCO) yang lebih tinggi. Inovasi dalam model ini meningkatkan pengalaman pelanggan, yang pada gilirannya menghasilkan peningkatan pendapatan dan keuntungan. Namun, mencapai kinerja terbaik menggunakan LLM canggih selama proyek penerapan inferensi bukannya tanpa tantangan. Pengoptimalan jarang terjadi secara otomatis dan mengharuskan pengguna untuk mempertimbangkan faktor penyesuaian seperti paralelisme, alur end-to-end, dan teknik penjadwalan tingkat lanjut. Selain itu, platform komputasi yang dapat menangani presisi campuran tanpa mengorbankan presisi sangatlah penting. "TensorRT-LLM" memberikan solusi terhadap tantangan ini. Hal ini mencakup Deep Learning Compiler TensorRT, kernel yang dioptimalkan, pra-pemrosesan dan pasca-pemrosesan, serta komunikasi multi-GPU/multi-node. Semua ini dikemas ke dalam API Python open source sederhana untuk mendefinisikan, mengoptimalkan, dan menjalankan LLM untuk inferensi dalam produksi. NVIDIA TensorRT-LLM saat ini sedang dalam akses awal dan akan segera diintegrasikan ke dalam framework NVIDIA NeMo. Hal ini akan memungkinkan developer dan peneliti mengakses TensorRT-LLM melalui framework NeMo di NGC atau repositori sumber di GitHub.
Bagikan artikel ini:
Tin tức mới nhất
Penemuan AI Dukungan Bisnis Staf Virtual
28/4/25, 03.00
Discoveries (Tokyo) telah mulai menawarkan "Staf Virtual" untuk membantu perusahaan meningkatkan efisiensi bisnis mereka.
AI asli disediakan secara gratis "MaisonAI
28/4/25, 03.00
Authentic AI (Minato-ku, Tokyo) akan menyediakan platform Generative AI "MaisonAI" secara gratis untuk waktu terbatas sebagai sponsor "TOKYO AI Fashion Week 2025 A/W."
Kursus Analisis Data LINE Yahoo! Kagawa
28/4/25, 03.00
LINE Yahoo! (Tokyo) dan Brewus mengumumkan bahwa mereka akan berpartisipasi dalam pengelolaan "Kursus Pelatihan Bakat Pemanfaatan Analisis Data/ChatGPT" yang disponsori oleh Prefektur Kagawa.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Penemuan AI Dukungan Bisnis Staf Virtual
28/4/25, 03.00
Discoveries (Tokyo) telah mulai menawarkan "Staf Virtual" untuk membantu perusahaan meningkatkan efisiensi bisnis mereka.
AI asli disediakan secara gratis "MaisonAI
28/4/25, 03.00
Authentic AI (Minato-ku, Tokyo) akan menyediakan platform Generative AI "MaisonAI" secara gratis untuk waktu terbatas sebagai sponsor "TOKYO AI Fashion Week 2025 A/W."
Kursus Analisis Data LINE Yahoo! Kagawa
28/4/25, 03.00
LINE Yahoo! (Tokyo) dan Brewus mengumumkan bahwa mereka akan berpartisipasi dalam pengelolaan "Kursus Pelatihan Bakat Pemanfaatan Analisis Data/ChatGPT" yang disponsori oleh Prefektur Kagawa.