top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA Blackwell Ultra mendukung sistem AI skala besar

Generatived

20/3/25, 04.00

NVIDIA mengumumkan Blackwell Ultra, platform komputasi berkecepatan tinggi baru yang dirancang untuk memenuhi permintaan inferensi AI yang terus meningkat, termasuk penskalaan selama pelatihan, pasca pelatihan, dan pengujian. Platform ini akan didukung oleh sistem NVIDIA GB300 NVL72, yang dilengkapi solusi skala rak berpendingin cairan yang menggabungkan 36 CPU NVIDIA Grace dan 72 GPU Blackwell Ultra. Sistem ini menawarkan bandwidth NVLink sebesar 130 TB/dtk yang mengesankan, menjadikannya sebagai solusi canggih untuk inferensi AI skala besar.

Platform Blackwell Ultra menjanjikan peningkatan kinerja inferensi AI yang penting untuk sistem AI multi-agen secara real-time dan inferensi konteks panjang. Blackwell Ultra Tensor Cores baru secara signifikan meningkatkan FLOPS komputasi AI, dengan model GB300 NVL72 menghadirkan AI FLOPS hingga 70x lebih banyak dibandingkan model sebelumnya. Peningkatan kinerja ini didukung oleh memori HBM3e hingga 288 GB per GPU dan memori koheren berkecepatan tinggi hingga 40 TB per rak untuk menangani model besar dan tugas kompleks secara bersamaan.

Untuk mengoptimalkan kinerja inferensi multi-node berskala besar, Blackwell Ultra dilengkapi konektivitas PCIe Gen6 dan NVIDIA ConnectX-8 800G SuperNIC yang menskalakan bandwidth jaringan hingga 800 Gb/s. Hal ini dilengkapi dengan NVIDIA Dynamo, perpustakaan sumber terbuka yang dirancang untuk meningkatkan layanan AI inferensi di seluruh node GPU. Integrasi dengan platform jaringan NVIDIA Quantum-X800 dan NVIDIA Spectrum-X memungkinkan pabrik AI dan pusat data cloud mengelola tuntutan beban kerja secara efisien yang ditentukan oleh tiga undang-undang penskalaan.

GB300 NVL72 dari NVIDIA diharapkan dapat meningkatkan output pabrik AI secara signifikan, dengan token throughput per detik per pengguna 10x lebih tinggi dan token throughput 5x lebih tinggi per detik per megawatt. Efek gabungan ini berpotensi meningkatkan kinerja output keseluruhan pabrik AI Anda sebanyak 50 kali lipat. Produk Blackwell Ultra diharapkan akan tersedia dari mitra pada akhir tahun 2025 dengan dukungan dari penyedia layanan cloud dan produsen server terkemuka.

Bagikan artikel ini:

Tin tức mới nhất
DataX menambahkan fungsi pengoptimalan otomatis untuk pengujian AB

DataX menambahkan fungsi pengoptimalan otomatis untuk pengujian AB

21/3/25, 04.30

Data X (Shinjuku, Tokyo) telah menambahkan fungsi "optimalisasi otomatis pengujian AB" ke platform pemasaran datanya "b→dash."

Sistem diagnosis asuransi AI WDC OEM mulai

Sistem diagnosis asuransi AI WDC OEM mulai

21/3/25, 04.30

WDC (Kota Funabashi, Prefektur Chiba) telah mulai menyediakan sistem diagnosis asuransi berbasis AI "Riaho" pada basis OEM.

Platform manajemen kekayaan intelektual data AI yang terintegrasi

Platform manajemen kekayaan intelektual data AI yang terintegrasi

21/3/25, 04.30

AI Data (Minato-ku, Tokyo) telah mulai menawarkan "IDX x AI Kongming™ x Tokkyo.Ai," sebuah platform yang memungkinkan pengelolaan terintegrasi kekayaan intelektual

Technica Mengumumkan Layanan Penilaian Mobil Bekas Berbasis AI "AIVALUE"

Technica Mengumumkan Layanan Penilaian Mobil Bekas Berbasis AI "AIVALUE"

21/3/25, 04.30

Technica (Tokyo) telah mengumumkan "AIVALUE," sistem penilaian AI untuk mobil bekas.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
DataX menambahkan fungsi pengoptimalan otomatis untuk pengujian AB

DataX menambahkan fungsi pengoptimalan otomatis untuk pengujian AB

21/3/25, 04.30

Data X (Shinjuku, Tokyo) telah menambahkan fungsi "optimalisasi otomatis pengujian AB" ke platform pemasaran datanya "b→dash."

Sistem diagnosis asuransi AI WDC OEM mulai

Sistem diagnosis asuransi AI WDC OEM mulai

21/3/25, 04.30

WDC (Kota Funabashi, Prefektur Chiba) telah mulai menyediakan sistem diagnosis asuransi berbasis AI "Riaho" pada basis OEM.

Platform manajemen kekayaan intelektual data AI yang terintegrasi

Platform manajemen kekayaan intelektual data AI yang terintegrasi

21/3/25, 04.30

AI Data (Minato-ku, Tokyo) telah mulai menawarkan "IDX x AI Kongming™ x Tokkyo.Ai," sebuah platform yang memungkinkan pengelolaan terintegrasi kekayaan intelektual

Technica Mengumumkan Layanan Penilaian Mobil Bekas Berbasis AI "AIVALUE"

Technica Mengumumkan Layanan Penilaian Mobil Bekas Berbasis AI "AIVALUE"

21/3/25, 04.30

Technica (Tokyo) telah mengumumkan "AIVALUE," sistem penilaian AI untuk mobil bekas.

bottom of page