top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Pembaruan hiperkomputer Google AI

Generatived

24/11/7 4:30

Google (AS) mengumumkan pembaruan besar pada lapisan perangkat lunak hiperkomputer AI-nya. Menyediakan pusat pusat untuk meningkatkan kinerja pelatihan dan inferensi, meningkatkan ketahanan, dan mengelola sumber daya. Sumber daya hiperkomputer AI baru di GitHub kini mencakup implementasi referensi seperti MaxText dan MaxDiffusion, serta alat orkestrasi XPK.

Bekerja sama dengan NVIDIA (AS), MaxText mendukung A3 Mega VM. Hal ini menggandakan bandwidth jaringan GPU-ke-GPU, sehingga mempercepat pelatihan model bahasa besar. Pelatihan presisi campuran FP8 juga meningkatkan pemanfaatan perangkat keras. Google menunjukkan bahwa pelatihan FP8 dengan AQT secara signifikan meningkatkan pemanfaatan model FLOP yang efektif.

Google juga menyediakan referensi implementasi dan kernel untuk MoE (Mixture of Experts). Hal ini memungkinkan Anda menyesuaikan jumlah pakar dan meningkatkan fleksibilitas dan performa model. Kami juga melakukan open source pada kernel Pallas yang dioptimalkan di Cloud TPU untuk lebih mempercepat pelatihan model MoE.

Memperkenalkan resep pemantauan referensi untuk memfasilitasi pemantauan pelatihan skala besar. Membantu memaksimalkan pemanfaatan sumber daya dan meningkatkan kualitas ML melalui dasbor Cloud Monitoring. Selain itu, SparseCore untuk Cloud TPU v5p kini tersedia secara umum, sehingga meningkatkan performa model Rekomendasi secara signifikan. Performa inferensi LLM juga meningkat dua kali lipat dengan fitur baru JetStream.

Bagikan artikel ini:

Berita terkini
Platform Manajemen Kasus Clarra Powers untuk Profesional Hukum

Platform Manajemen Kasus Clarra Powers untuk Profesional Hukum

24/11/7 4:30

Clarra telah memperkenalkan sejumlah penyempurnaan untuk merayakan satu tahun platform manajemen kasus yang dioptimalkan untuk litigasi.

ISG merilis Survei Layanan Inovasi Digital Brasil

ISG merilis Survei Layanan Inovasi Digital Brasil

24/11/7 4:30

Information Services Group (ISG), sebuah perusahaan riset dan konsultasi teknologi global ternama, telah meluncurkan studi yang berfokus pada penyedia layanan inovasi digital di Brasil.

Webinar Kreasi Bersama AI Generasi Tiga Mata

Webinar Kreasi Bersama AI Generasi Tiga Mata

24/11/6 5:30

``Kritik TI'' yang dioperasikan oleh Triple Eyes (Chiyoda-ku, Tokyo) akan mengadakan webinar khusus pada tanggal 4 Desember.

Permohonan paten MONO-X AI dan peluncuran layanan baru

Permohonan paten MONO-X AI dan peluncuran layanan baru

24/11/6 5:30

MONO-X (Minato-ku, Tokyo) mengajukan paten untuk "MONO-X AI" pada tanggal 5 November 2024, dan memulai layanan untuk perusahaan yang telah menginstal IBM i (AS/400).

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Platform Manajemen Kasus Clarra Powers untuk Profesional Hukum

Platform Manajemen Kasus Clarra Powers untuk Profesional Hukum

24/11/7 4:30

Clarra telah memperkenalkan sejumlah penyempurnaan untuk merayakan satu tahun platform manajemen kasus yang dioptimalkan untuk litigasi.

ISG merilis Survei Layanan Inovasi Digital Brasil

ISG merilis Survei Layanan Inovasi Digital Brasil

24/11/7 4:30

Information Services Group (ISG), sebuah perusahaan riset dan konsultasi teknologi global ternama, telah meluncurkan studi yang berfokus pada penyedia layanan inovasi digital di Brasil.

Webinar Kreasi Bersama AI Generasi Tiga Mata

Webinar Kreasi Bersama AI Generasi Tiga Mata

24/11/6 5:30

``Kritik TI'' yang dioperasikan oleh Triple Eyes (Chiyoda-ku, Tokyo) akan mengadakan webinar khusus pada tanggal 4 Desember.

Permohonan paten MONO-X AI dan peluncuran layanan baru

Permohonan paten MONO-X AI dan peluncuran layanan baru

24/11/6 5:30

MONO-X (Minato-ku, Tokyo) mengajukan paten untuk "MONO-X AI" pada tanggal 5 November 2024, dan memulai layanan untuk perusahaan yang telah menginstal IBM i (AS/400).

bottom of page