Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
NVIDIA dan Google DeepMind mengumumkan model Gemma AI
Generatived
24/2/22 5:26
NVIDIA mengumumkan kolaborasi dengan Google untuk memperkenalkan Gemma, serangkaian model terbuka baru yang dioptimalkan untuk platform AI NVIDIA. Model Gemma 2B dan 7B yang dikembangkan oleh Google DeepMind dirancang untuk memanfaatkan pustaka TensorRT-LLM guna meningkatkan pengoptimalan inferensi dan memberikan throughput tinggi serta performa tingkat tertinggi. Kolaborasi ini akan memungkinkan pengembang untuk memanfaatkan kekuatan model bahasa skala besar (LLM) pada desktop dengan GPU NVIDIA RTX, sehingga mendemokratisasikan akses ke kemampuan AI tingkat lanjut.
Model Gemma mendukung ukuran kosakata 256K dan panjang konteks hingga 8K, dan dirancang dengan mempertimbangkan keselamatan. Menggabungkan pemfilteran PII untuk menghapus pengidentifikasi sensitif dari kumpulan data dan memastikan pengembangan AI yang bertanggung jawab. Selain itu, model ini mendapat manfaat dari pembelajaran penguatan dari masukan manusia dan selaras dengan praktik AI yang etis. Dilatih dengan lebih dari 6 triliun token, model ini siap membantu pengembang membuat dan menerapkan aplikasi AI tingkat lanjut dengan percaya diri.
TensorRT-LLM memperkenalkan beberapa fitur yang meningkatkan performa model Gemma, termasuk kuantisasi bobot dengan dukungan untuk aktivasi FP8, XQA, dan INT4. FP8 membantu mempercepat aplikasi pembelajaran mendalam, dan XQA, kernel yang dikembangkan oleh NVIDIA AI, mengoptimalkan mekanisme perhatian selama fase pembuatan. Inovasi lainnya, INT4 AWQ, memungkinkan penggunaan memori yang efisien dan peningkatan kinerja dalam skenario dengan bandwidth memori terbatas. Kemajuan ini memungkinkan model Gemma beroperasi dengan akurasi dan kecepatan lebih tinggi bahkan dengan ukuran batch yang lebih kecil.
GPU Tensor Core H200 NVIDIA dikonfigurasi untuk memberikan kinerja luar biasa pada model Gemma, mencapai lebih dari 79.000 token per detik pada Gemma 2B dan hampir 19.000 token per detik pada Gemma 7B. Fitur ini berarti melayani ribuan pengguna secara bersamaan dengan latensi real-time pada satu GPU. Pengembang akan segera dapat merasakan Gemma melalui AI Playground NVIDIA dan aplikasi demo Chat with RTX yang akan datang. Selain itu, pos pemeriksaan model Gemma yang dioptimalkan kini tersedia di NGC, dan versi terkuantisasi FP8 dapat diakses melalui perpustakaan Hugging Face Optimum-NVIDIA, menyederhanakan integrasi inferensi LLM berkecepatan tinggi. saus:
Bagikan artikel ini:
Berita terkini
TANREN AI Yoshida Ken membantu meningkatkan efisiensi bisnis
24/12/30 4:30
TANREN (Chiyoda-ku, Tokyo) telah mengumumkan agen berbasis AI baru yang disebut "AI Yoshida Ken" bekerja sama dengan Yoshida Ken, seorang ahli dalam meningkatkan efisiensi kerja Excel .
MC Digital memperluas AI untuk bisnis
24/12/30 4:30
MC Digital (Chiyoda-ku, Tokyo) telah memperkenalkan "o1" dan "o1-mini" OpenAI ke layanan Generative AI perusahaannya, "Tachyon Generative AI."
XOP OpsAI menambahkan fungsi baru untuk meningkatkan efisiensi bisnis
24/12/30 4:30
XOP (Chiyoda-ku, Tokyo) telah menambahkan fitur baru ke ChatGPT perusahaannya "OpsAI."
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Profil perusahaan
Berita terkini
TANREN AI Yoshida Ken membantu meningkatkan efisiensi bisnis
24/12/30 4:30
TANREN (Chiyoda-ku, Tokyo) telah mengumumkan agen berbasis AI baru yang disebut "AI Yoshida Ken" bekerja sama dengan Yoshida Ken, seorang ahli dalam meningkatkan efisiensi kerja Excel .
MC Digital memperluas AI untuk bisnis
24/12/30 4:30
MC Digital (Chiyoda-ku, Tokyo) telah memperkenalkan "o1" dan "o1-mini" OpenAI ke layanan Generative AI perusahaannya, "Tachyon Generative AI."
XOP OpsAI menambahkan fungsi baru untuk meningkatkan efisiensi bisnis
24/12/30 4:30
XOP (Chiyoda-ku, Tokyo) telah menambahkan fitur baru ke ChatGPT perusahaannya "OpsAI."