top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA TensorRT-LLM Memperkenalkan Fitur Chunked Prefill yang Efisien

Generatived

24/11/18 4:30

NVIDIA telah memperkenalkan fitur baru dalam TensorRT-LLM yang meningkatkan pemanfaatan GPU dan menyederhanakan proses penerapan bagi para pengembang. Fitur ini, yang dikenal sebagai chunked prefill, mengatasi tantangan komputasi yang ditimbulkan oleh fase prefill dan decode inference tradisional. Dengan membagi token input menjadi potongan-potongan yang lebih kecil, sistem dapat memproses cache KV dengan lebih efisien, memungkinkan penanganan beberapa permintaan secara bersamaan dan mencegah kemacetan selama fase prefill.

Pendekatan prapengisian berpotongan tidak hanya meningkatkan kinerja GPU tetapi juga memungkinkan sistem untuk mengelola konteks yang lebih panjang dan tingkat konkurensi yang lebih tinggi tanpa meningkatkan permintaan memori. Hal ini sangat bermanfaat karena memisahkan konsumsi memori dari panjang konteks permintaan yang masuk, sehingga memungkinkan pemrosesan panjang konteks yang lebih besar secara lebih efektif.

Selain itu, NVIDIA telah membuat langkah maju dalam menyederhanakan proses pembuatan mesin dengan penerapan ukuran chunk dinamis. Fitur ini secara otomatis merekomendasikan ukuran chunk optimal berdasarkan metrik penggunaan GPU, sehingga menghilangkan kebutuhan pengembang untuk secara manual menentukan panjang input maksimum. Hasilnya, ukuran buffer aktivasi kini ditentukan oleh ukuran chunk yang dikonfigurasi, yang menghasilkan penggunaan memori yang lebih efisien selama eksekusi.

Pengenalan chunked prefill di TensorRT-LLM menandai peningkatan signifikan dalam kinerja dan pemanfaatan sistem. Dengan memfasilitasi paralelisasi yang lebih baik antara fase prefill dan decode serta mengurangi waktu penyelesaian kueri, NVIDIA meningkatkan pengalaman pengguna. Pengembang yang tertarik memanfaatkan fitur ini dapat menemukan informasi lebih lanjut dan memulai melalui dokumentasi GitHub NVIDIA, mengikuti perkembangan terbaru dalam kinerja inferensi AI.

Bagikan artikel ini:

Berita terkini
NVIDIA Luncurkan Model Pembelajaran Mendalam Prediksi Iklim yang Disempurnakan

NVIDIA Luncurkan Model Pembelajaran Mendalam Prediksi Iklim yang Disempurnakan

24/11/15 4:30

Dale Duran dari Universitas Washington menyajikan model pembelajaran mendalam inovatif yang meningkatkan prediksi iklim dan cuaca dengan mengintegrasikan data atmosfer dan lautan.

NVIDIA Memperkenalkan AI Cloud untuk Pengembangan yang Aman dan Privat

NVIDIA Memperkenalkan AI Cloud untuk Pengembangan yang Aman dan Privat

24/11/15 4:30

Pendekatan inovatif untuk pengembangan AI telah diperkenalkan, dengan cloud dan pasar AI baru yang berfokus pada privasi dan kontrol data pengguna.

NVIDIA Meluncurkan Sahabat-AI untuk Mendorong Pertumbuhan AI di Indonesia

NVIDIA Meluncurkan Sahabat-AI untuk Mendorong Pertumbuhan AI di Indonesia

24/11/15 4:30

Para pemimpin teknologi Indonesia telah memulai upaya signifikan untuk memperkuat kemampuan AI di negara ini, dengan fokus pada pengembangan AI yang berdaulat bagi sebagian besar penduduk berbahasa Indonesia.

Amazon memperluas jajaran Fire TV, memperkenalkan seri Omni

Amazon memperluas jajaran Fire TV, memperkenalkan seri Omni

24/11/15 4:30

Amazon telah mengumumkan perluasan lini produk Fire TV-nya, memperkenalkan seri Omni Mini-LED baru dan memperbarui Seri 4, serta meluncurkan seri Soundbar Plus.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
NVIDIA Luncurkan Model Pembelajaran Mendalam Prediksi Iklim yang Disempurnakan

NVIDIA Luncurkan Model Pembelajaran Mendalam Prediksi Iklim yang Disempurnakan

24/11/15 4:30

Dale Duran dari Universitas Washington menyajikan model pembelajaran mendalam inovatif yang meningkatkan prediksi iklim dan cuaca dengan mengintegrasikan data atmosfer dan lautan.

NVIDIA Memperkenalkan AI Cloud untuk Pengembangan yang Aman dan Privat

NVIDIA Memperkenalkan AI Cloud untuk Pengembangan yang Aman dan Privat

24/11/15 4:30

Pendekatan inovatif untuk pengembangan AI telah diperkenalkan, dengan cloud dan pasar AI baru yang berfokus pada privasi dan kontrol data pengguna.

NVIDIA Meluncurkan Sahabat-AI untuk Mendorong Pertumbuhan AI di Indonesia

NVIDIA Meluncurkan Sahabat-AI untuk Mendorong Pertumbuhan AI di Indonesia

24/11/15 4:30

Para pemimpin teknologi Indonesia telah memulai upaya signifikan untuk memperkuat kemampuan AI di negara ini, dengan fokus pada pengembangan AI yang berdaulat bagi sebagian besar penduduk berbahasa Indonesia.

Amazon memperluas jajaran Fire TV, memperkenalkan seri Omni

Amazon memperluas jajaran Fire TV, memperkenalkan seri Omni

24/11/15 4:30

Amazon telah mengumumkan perluasan lini produk Fire TV-nya, memperkenalkan seri Omni Mini-LED baru dan memperbarui Seri 4, serta meluncurkan seri Soundbar Plus.

bottom of page