top of page
Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
logo.png

NVIDIA GH200 NVL32 が大規模言語モデルを高速化

Generatived

2024年9月27日

AI 技術の最新の進歩により、音声ボットやコーディング アシスタントなど、迅速なインタラクションを必要とするアプリケーションに不可欠な大規模言語モデル (LLM) の応答性が大幅に向上しました。これらの改善の重要な指標は、最初のトークンまでの時間 (TTFT) です。これは、ユーザー プロンプトを受信してから LLM が応答を生成し始めるまでの速度を測定します。LLM が進化するにつれて、より多くのコンテキストでより長いクエリを処理する能力が向上し、一部のモデルでは、小説 1 冊分の長さの入力を処理できるようになりました。

NVIDIA は、NVLink スイッチ システムを介して接続された 32 個の Grace Hopper Superchips を活用して TTFT パフォーマンスを強化する新しいシステム、GH200 NVL32 を発表しました。このシステムは、最大 4,050 億のパラメーターを持つモデルを含む Llama 3.1 ファミリなどの最新の LLM の要求に対応するように設計されています。 TensorRT-LLM 最適化を利用することで、GH200 NVL32 システムは、コンテキストの長さが長い場合でも、これらのモデルで公開されている最速の TTFT を実現しました。

GH200 NVL32 システムのアーキテクチャにより、複数の GPU 間での効率的なデータ同期が可能になり、TTFT を高速化する上で重要な要素となります。これは、多数のパラメータがあるためにかなりの計算能力を必要とする Llama 3.1 405B などのモデルにとって特に重要です。システムの高帯域幅、低レイテンシの GPU 間ファブリックにより、同期時間が最小限に抑えられ、計算が高速化され、リアルタイムのユーザー エクスペリエンスが向上します。

NVIDIA のイノベーションへの取り組みはハードウェアだけにとどまらず、同社は推論パフォーマンスを向上させるための新しい手法と最適化を継続的に開発しています。これらの進歩により、強力な AI 機能がよりアクセスしやすく、コスト効率が高くなり、何百万人もの開発者と膨大な数の GPU インストール ベースを含む広範な NVIDIA エコシステムにメリットがもたらされています。今後、NVIDIA の Blackwell GB200 NVL72 プラットフォームは、コンピューティング機能をさらに向上させ、生成 AI と複雑なエージェント ワークフローの需要の高まりに応えていくことが期待されます。

この記事を共有:

最新のニュース
GEDI が OpenAI と提携してイタリアのニュースを強化

GEDI が OpenAI と提携してイタリアのニュースを強化

2024年9月27日 4:30:00

Montai Therapeutics が AI を活用した創薬を発表

Montai Therapeutics が AI を活用した創薬を発表

2024年9月27日 4:30:00

AssetHub資金調達1億円AIゲーム支援

AssetHub資金調達1億円AIゲーム支援

2024年9月27日 4:30:00

DaiMBOW(本社所在地未記載)は、2024年10月初旬にアプリ「DaiMBOW」のアップデートを実施する。

Duolingo日本語話者向けMax開始

Duolingo日本語話者向けMax開始

2024年9月27日 4:30:00

ゼネット(東京)は、AIを活用した学習支援機能を搭載した学習管理システム『Xlabo』をリリースし、無償モニター企業の募集を開始した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

最新のニュース
GEDI が OpenAI と提携してイタリアのニュースを強化

GEDI が OpenAI と提携してイタリアのニュースを強化

2024年9月27日 4:30:00

Montai Therapeutics が AI を活用した創薬を発表

Montai Therapeutics が AI を活用した創薬を発表

2024年9月27日 4:30:00

AssetHub資金調達1億円AIゲーム支援

AssetHub資金調達1億円AIゲーム支援

2024年9月27日 4:30:00

DaiMBOW(本社所在地未記載)は、2024年10月初旬にアプリ「DaiMBOW」のアップデートを実施する。

Duolingo日本語話者向けMax開始

Duolingo日本語話者向けMax開始

2024年9月27日 4:30:00

ゼネット(東京)は、AIを活用した学習支援機能を搭載した学習管理システム『Xlabo』をリリースし、無償モニター企業の募集を開始した。

bottom of page