Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

NVIDIA Blackwell Ultra が大規模 AI システムを強化
Generatived
25/3/20 4:00
NVIDIA は、トレーニング、トレーニング後、テスト時のスケーリングなど、AI 推論の高まる需要に応えるために設計された新しい高速コンピューティング プラットフォーム Blackwell Ultra を発表しました。このプラットフォームは、36 個の NVIDIA Grace CPU と 72 個の Blackwell Ultra GPU を組み合わせた液冷ラック スケール ソリューションを特徴とする NVIDIA GB300 NVL72 システムに搭載される予定です。このシステムは、130 TB/秒という驚異的な NVLink 帯域幅を誇り、大規模な AI 推論のための強力なソリューションとして位置付けられています。
Blackwell Ultra プラットフォームは、リアルタイムのマルチエージェント AI システムとロング コンテキスト推論に不可欠な、強化された AI 推論パフォーマンスを実現することを約束します。新しい Blackwell Ultra Tensor コアは、AI コンピューティング FLOPS を大幅に向上させ、GB300 NVL72 モデルは、以前のモデルと比較して最大 70 倍の AI FLOPS を実現します。このパフォーマンスの向上は、GPU あたり最大 288 GB の HBM3e メモリとラックあたり最大 40 TB の高速コヒーレント メモリによってサポートされており、大規模なモデルと複雑なタスクを同時に処理できます。
大規模なマルチノード推論のパフォーマンスを最適化するために、Blackwell Ultra は PCIe Gen6 接続と NVIDIA ConnectX-8 800G SuperNIC を搭載しており、ネットワーク帯域幅を 800 Gb/s に拡張します。これは、GPU ノード間で推論 AI サービスをスケールアップするように設計されたオープンソース ライブラリである NVIDIA Dynamo によって補完されます。NVIDIA Quantum-X800 および NVIDIA Spectrum-X ネットワーキング プラットフォームとの統合により、AI ファクトリーとクラウド データ センターは、3 つのスケーリング法則によって決定されるワークロード要求を効率的に管理できます。
NVIDIA の GB300 NVL72 は、AI ファクトリーの出力を大幅に向上させると予測されており、ユーザー 1 人あたりの 1 秒あたりのスループット トークンが 10 倍、メガワットあたりの 1 秒あたりのスループット トークンが 5 倍向上します。この複合効果により、AI ファクトリーの出力パフォーマンスが全体で 50 倍に増加する可能性があります。Blackwell Ultra 製品は、主要なクラウド サービス プロバイダーとサーバー メーカーのサポートを受けて、2025 年後半にパートナーから提供される予定です。
最新のニュース
AIデータ知的財産統合管理プラットフォーム
25/3/21 4:30
AIデータ(東京都港区)は、製造業の研究開発部門と研究所向けに、知財と研究データの統合管理を可能にするプラットフォーム「IDX × AI孔明™ × Tokkyo.Ai」の提供を開始した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
AIデータ知的財産統合管理プラットフォーム
25/3/21 4:30
AIデータ(東京都港区)は、製造業の研究開発部門と研究所向けに、知財と研究データの統合管理を可能にするプラットフォーム「IDX × AI孔明™ × Tokkyo.Ai」の提供を開始した。