Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
Pembaruan hiperkomputer Google AI
Generatived
24/11/7 4:30
Google (AS) mengumumkan pembaruan besar pada lapisan perangkat lunak hiperkomputer AI-nya. Menyediakan pusat pusat untuk meningkatkan kinerja pelatihan dan inferensi, meningkatkan ketahanan, dan mengelola sumber daya. Sumber daya hiperkomputer AI baru di GitHub kini mencakup implementasi referensi seperti MaxText dan MaxDiffusion, serta alat orkestrasi XPK.
Bekerja sama dengan NVIDIA (AS), MaxText mendukung A3 Mega VM. Hal ini menggandakan bandwidth jaringan GPU-ke-GPU, sehingga mempercepat pelatihan model bahasa besar. Pelatihan presisi campuran FP8 juga meningkatkan pemanfaatan perangkat keras. Google menunjukkan bahwa pelatihan FP8 dengan AQT secara signifikan meningkatkan pemanfaatan model FLOP yang efektif.
Google juga menyediakan referensi implementasi dan kernel untuk MoE (Mixture of Experts). Hal ini memungkinkan Anda menyesuaikan jumlah pakar dan meningkatkan fleksibilitas dan performa model. Kami juga melakukan open source pada kernel Pallas yang dioptimalkan di Cloud TPU untuk lebih mempercepat pelatihan model MoE.
Memperkenalkan resep pemantauan referensi untuk memfasilitasi pemantauan pelatihan skala besar. Membantu memaksimalkan pemanfaatan sumber daya dan meningkatkan kualitas ML melalui dasbor Cloud Monitoring. Selain itu, SparseCore untuk Cloud TPU v5p kini tersedia secara umum, sehingga meningkatkan performa model Rekomendasi secara signifikan. Performa inferensi LLM juga meningkat dua kali lipat dengan fitur baru JetStream.
Bagikan artikel ini:
Berita terkini
JLL Azara meningkatkan wawasan data real estat perusahaan
24/11/13 4:30
JLL telah meluncurkan JLL Azara, versi terbaru dari rangkaian alat bertenaga AI.
Johnson Controls Meningkatkan OpenBlue dengan Kemampuan AI
24/11/13 4:30
Johnson Controls telah mengumumkan peningkatan signifikan pada OpenBlue Enterprise Manager-nya, dengan mengintegrasikan kemampuan AI tingkat lanjut ke dalam rangkaian tersebut.
Juniper Networks Berinvestasi dalam Teknologi Inferensi AI Recogni
24/11/13 4:30
Juniper Networks mengumumkan investasi strategis di Recogni, sebuah perusahaan yang mengkhususkan diri dalam inferensi Generative AI , sebagai bagian dari putaran pendanaan Seri C Recogni senilai $102 juta baru-baru ini.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Profil perusahaan
Berita terkini
JLL Azara meningkatkan wawasan data real estat perusahaan
24/11/13 4:30
JLL telah meluncurkan JLL Azara, versi terbaru dari rangkaian alat bertenaga AI.
Johnson Controls Meningkatkan OpenBlue dengan Kemampuan AI
24/11/13 4:30
Johnson Controls telah mengumumkan peningkatan signifikan pada OpenBlue Enterprise Manager-nya, dengan mengintegrasikan kemampuan AI tingkat lanjut ke dalam rangkaian tersebut.
Juniper Networks Berinvestasi dalam Teknologi Inferensi AI Recogni
24/11/13 4:30
Juniper Networks mengumumkan investasi strategis di Recogni, sebuah perusahaan yang mengkhususkan diri dalam inferensi Generative AI , sebagai bagian dari putaran pendanaan Seri C Recogni senilai $102 juta baru-baru ini.