top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA dan Google DeepMind mengumumkan model Gemma AI

Generatived

24/2/22 5:26

NVIDIA mengumumkan kolaborasi dengan Google untuk memperkenalkan Gemma, serangkaian model terbuka baru yang dioptimalkan untuk platform AI NVIDIA. Model Gemma 2B dan 7B yang dikembangkan oleh Google DeepMind dirancang untuk memanfaatkan pustaka TensorRT-LLM guna meningkatkan pengoptimalan inferensi dan memberikan throughput tinggi serta performa tingkat tertinggi. Kolaborasi ini akan memungkinkan pengembang untuk memanfaatkan kekuatan model bahasa skala besar (LLM) pada desktop dengan GPU NVIDIA RTX, sehingga mendemokratisasikan akses ke kemampuan AI tingkat lanjut.

Model Gemma mendukung ukuran kosakata 256K dan panjang konteks hingga 8K, dan dirancang dengan mempertimbangkan keselamatan. Menggabungkan pemfilteran PII untuk menghapus pengidentifikasi sensitif dari kumpulan data dan memastikan pengembangan AI yang bertanggung jawab. Selain itu, model ini mendapat manfaat dari pembelajaran penguatan dari masukan manusia dan selaras dengan praktik AI yang etis. Dilatih dengan lebih dari 6 triliun token, model ini siap membantu pengembang membuat dan menerapkan aplikasi AI tingkat lanjut dengan percaya diri.

TensorRT-LLM memperkenalkan beberapa fitur yang meningkatkan performa model Gemma, termasuk kuantisasi bobot dengan dukungan untuk aktivasi FP8, XQA, dan INT4. FP8 membantu mempercepat aplikasi pembelajaran mendalam, dan XQA, kernel yang dikembangkan oleh NVIDIA AI, mengoptimalkan mekanisme perhatian selama fase pembuatan. Inovasi lainnya, INT4 AWQ, memungkinkan penggunaan memori yang efisien dan peningkatan kinerja dalam skenario dengan bandwidth memori terbatas. Kemajuan ini memungkinkan model Gemma beroperasi dengan akurasi dan kecepatan lebih tinggi bahkan dengan ukuran batch yang lebih kecil.

GPU Tensor Core H200 NVIDIA dikonfigurasi untuk memberikan kinerja luar biasa pada model Gemma, mencapai lebih dari 79.000 token per detik pada Gemma 2B dan hampir 19.000 token per detik pada Gemma 7B. Fitur ini berarti melayani ribuan pengguna secara bersamaan dengan latensi real-time pada satu GPU. Pengembang akan segera dapat merasakan Gemma melalui AI Playground NVIDIA dan aplikasi demo Chat with RTX yang akan datang. Selain itu, pos pemeriksaan model Gemma yang dioptimalkan kini tersedia di NGC, dan versi terkuantisasi FP8 dapat diakses melalui perpustakaan Hugging Face Optimum-NVIDIA, menyederhanakan integrasi inferensi LLM berkecepatan tinggi. saus:

Bagikan artikel ini:

Berita terkini
Webinar Bersama D&Y: Memperkenalkan Teknik Pemanfaatan AI

Webinar Bersama D&Y: Memperkenalkan Teknik Pemanfaatan AI

24/12/30 4:30

D&Y LLC (Kita-ku, Osaka) akan mengadakan webinar tentang penggunaan praktis AI.

Hackathon Pelajar Thailand Aiful Aihack

Hackathon Pelajar Thailand Aiful Aihack

24/12/30 4:30

Aiful (Tokyo) mengadakan hackathon yang disebut "aihack Thailand" pada bulan Desember 2024 untuk mahasiswa Universitas Chulalongkorn di Thailand.

Laporan perluasan penggunaan OpenFashion "MaisonAI"

Laporan perluasan penggunaan OpenFashion "MaisonAI"

24/12/30 4:30

OpenFashion (Minato-ku, Tokyo) melaporkan perluasan penggunaan alat Generative AI "MaisonAI" untuk industri mode.

Majalah bulanan Advanced Education Organization yang berfokus pada pengembangan sumber daya manusia AI

Majalah bulanan Advanced Education Organization yang berfokus pada pengembangan sumber daya manusia AI

24/12/30 4:30

Advanced Education Institute, sebuah lembaga pendidikan swasta yang berpusat di Minato-ku, Tokyo, mengoperasikan sekolah pascasarjana profesional dari Sekolah Pascasarjana Desain Bisnis dan Sekolah Pascasarjana Desain Sosial.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Webinar Bersama D&Y: Memperkenalkan Teknik Pemanfaatan AI

Webinar Bersama D&Y: Memperkenalkan Teknik Pemanfaatan AI

24/12/30 4:30

D&Y LLC (Kita-ku, Osaka) akan mengadakan webinar tentang penggunaan praktis AI.

Hackathon Pelajar Thailand Aiful Aihack

Hackathon Pelajar Thailand Aiful Aihack

24/12/30 4:30

Aiful (Tokyo) mengadakan hackathon yang disebut "aihack Thailand" pada bulan Desember 2024 untuk mahasiswa Universitas Chulalongkorn di Thailand.

Laporan perluasan penggunaan OpenFashion "MaisonAI"

Laporan perluasan penggunaan OpenFashion "MaisonAI"

24/12/30 4:30

OpenFashion (Minato-ku, Tokyo) melaporkan perluasan penggunaan alat Generative AI "MaisonAI" untuk industri mode.

Majalah bulanan Advanced Education Organization yang berfokus pada pengembangan sumber daya manusia AI

Majalah bulanan Advanced Education Organization yang berfokus pada pengembangan sumber daya manusia AI

24/12/30 4:30

Advanced Education Institute, sebuah lembaga pendidikan swasta yang berpusat di Minato-ku, Tokyo, mengoperasikan sekolah pascasarjana profesional dari Sekolah Pascasarjana Desain Bisnis dan Sekolah Pascasarjana Desain Sosial.

bottom of page