NVIDIA dan Google DeepMind mengumumkan model Gemma AI 2/2903

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA dan Google DeepMind mengumumkan model Gemma AI

Generatived

24/2/22 5:26

NVIDIA mengumumkan kolaborasi dengan Google untuk memperkenalkan Gemma, serangkaian model terbuka baru yang dioptimalkan untuk platform AI NVIDIA. Model Gemma 2B dan 7B yang dikembangkan oleh Google DeepMind dirancang untuk memanfaatkan pustaka TensorRT-LLM guna meningkatkan pengoptimalan inferensi dan memberikan throughput tinggi serta performa tingkat tertinggi. Kolaborasi ini akan memungkinkan pengembang untuk memanfaatkan kekuatan model bahasa skala besar (LLM) pada desktop dengan GPU NVIDIA RTX, sehingga mendemokratisasikan akses ke kemampuan AI tingkat lanjut.

Model Gemma mendukung ukuran kosakata 256K dan panjang konteks hingga 8K, dan dirancang dengan mempertimbangkan keselamatan. Menggabungkan pemfilteran PII untuk menghapus pengidentifikasi sensitif dari kumpulan data dan memastikan pengembangan AI yang bertanggung jawab. Selain itu, model ini mendapat manfaat dari pembelajaran penguatan dari masukan manusia dan selaras dengan praktik AI yang etis. Dilatih dengan lebih dari 6 triliun token, model ini siap membantu pengembang membuat dan menerapkan aplikasi AI tingkat lanjut dengan percaya diri.

TensorRT-LLM memperkenalkan beberapa fitur yang meningkatkan performa model Gemma, termasuk kuantisasi bobot dengan dukungan untuk aktivasi FP8, XQA, dan INT4. FP8 membantu mempercepat aplikasi pembelajaran mendalam, dan XQA, kernel yang dikembangkan oleh NVIDIA AI, mengoptimalkan mekanisme perhatian selama fase pembuatan. Inovasi lainnya, INT4 AWQ, memungkinkan penggunaan memori yang efisien dan peningkatan kinerja dalam skenario dengan bandwidth memori terbatas. Kemajuan ini memungkinkan model Gemma beroperasi dengan akurasi dan kecepatan lebih tinggi bahkan dengan ukuran batch yang lebih kecil.

GPU Tensor Core H200 NVIDIA dikonfigurasi untuk memberikan kinerja luar biasa pada model Gemma, mencapai lebih dari 79.000 token per detik pada Gemma 2B dan hampir 19.000 token per detik pada Gemma 7B. Fitur ini berarti melayani ribuan pengguna secara bersamaan dengan latensi real-time pada satu GPU. Pengembang akan segera dapat merasakan Gemma melalui AI Playground NVIDIA dan aplikasi demo Chat with RTX yang akan datang. Selain itu, pos pemeriksaan model Gemma yang dioptimalkan kini tersedia di NGC, dan versi terkuantisasi FP8 dapat diakses melalui perpustakaan Hugging Face Optimum-NVIDIA, menyederhanakan integrasi inferensi LLM berkecepatan tinggi. saus:

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Berita terkini

TANREN AI Yoshida Ken membantu meningkatkan efisiensi bisnis

24/12/30 4:30

TANREN (Chiyoda-ku, Tokyo) telah mengumumkan agen berbasis AI baru yang disebut "AI Yoshida Ken" bekerja sama dengan Yoshida Ken, seorang ahli dalam meningkatkan efisiensi kerja Excel .

Baca lebih lanjut

MC Digital memperluas AI untuk bisnis

24/12/30 4:30

MC Digital (Chiyoda-ku, Tokyo) telah memperkenalkan "o1" dan "o1-mini" OpenAI ke layanan Generative AI perusahaannya, "Tachyon Generative AI."

Baca lebih lanjut

XOP OpsAI menambahkan fungsi baru untuk meningkatkan efisiensi bisnis

24/12/30 4:30

XOP (Chiyoda-ku, Tokyo) telah menambahkan fitur baru ke ChatGPT perusahaannya "OpsAI."

Baca lebih lanjut

Outlook Keamanan Siber Idiroot

24/12/30 4:30

IDROUTE Consulting (Chiyoda-ku, Tokyo) menyampaikan laporan berjudul "Keamanan Siber Saat Ini dan Future : Ringkasan Tahun 2024 dan Outlook untuk Tahun 2025" pada jumpa pers Silegree Holdings.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Kebijakan Privasi

Ketentuan Penggunaan Situs

Perusahaan yang mengoperasikan

Ikuti kami

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Generator seni/ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan aplikasi AI terbaik

Berita

Tentang kami

Kebijakan privasi

Ketentuan Penggunaan Situs

Perusahaan pengelola

Profil perusahaan

Berita terkini

TANREN AI Yoshida Ken membantu meningkatkan efisiensi bisnis

24/12/30 4:30

TANREN (Chiyoda-ku, Tokyo) telah mengumumkan agen berbasis AI baru yang disebut "AI Yoshida Ken" bekerja sama dengan Yoshida Ken, seorang ahli dalam meningkatkan efisiensi kerja Excel .

Baca lebih lanjut

MC Digital memperluas AI untuk bisnis

24/12/30 4:30

MC Digital (Chiyoda-ku, Tokyo) telah memperkenalkan "o1" dan "o1-mini" OpenAI ke layanan Generative AI perusahaannya, "Tachyon Generative AI."

Baca lebih lanjut

XOP OpsAI menambahkan fungsi baru untuk meningkatkan efisiensi bisnis

24/12/30 4:30

XOP (Chiyoda-ku, Tokyo) telah menambahkan fitur baru ke ChatGPT perusahaannya "OpsAI."

Baca lebih lanjut

Outlook Keamanan Siber Idiroot

24/12/30 4:30

IDROUTE Consulting (Chiyoda-ku, Tokyo) menyampaikan laporan berjudul "Keamanan Siber Saat Ini dan Future : Ringkasan Tahun 2024 dan Outlook untuk Tahun 2025" pada jumpa pers Silegree Holdings.

Baca lebih lanjut