top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA TensorRT-LLM が効率的なチャンク プレフィル機能を導入

Generatived

24/11/18 4:30

NVIDIA は、GPU の利用率を高め、開発者の導入プロセスを効率化する新しい機能を TensorRT-LLM に導入しました。チャンク プリフィルと呼ばれるこの機能は、従来のプリフィルおよびデコード推論フェーズで発生する計算上の課題に対処します。入力トークンを小さなチャンクに分割することで、システムは KV キャッシュをより効率的に処理し、複数のリクエストを同時に処理して、プリフィル フェーズ中のボトルネックを防ぐことができます。

チャンク化されたプリフィル アプローチは、GPU パフォーマンスを向上させるだけでなく、メモリ需要を増やすことなく、システムがより長いコンテキストとより高いレベルの同時実行を管理できるようにします。これは、メモリ消費と受信リクエストのコンテキスト長を切り離し、より長いコンテキスト長をより効率的に処理できるようにするため、特に有益です。

さらに、NVIDIA は、動的チャンク サイズ設定の実装により、エンジン作成プロセスの簡素化に大きく貢献しました。この機能は、GPU 使用率メト​​リックに基づいて最適なチャンク サイズを自動的に推奨するため、開発者が手動で最大入力長を指定する必要がなくなります。その結果、アクティベーション バッファ サイズは構成されたチャンク サイズによって決定されるようになり、実行時のメモリ使用がより効率的になります。

TensorRT-LLM にチャンク プリフィルが導入されたことで、システムのパフォーマンスと使用率が大幅に向上しました。プリフィル フェーズとデコード フェーズ間の並列化を促進し、クエリ完了時間を短縮することで、NVIDIA はユーザー エクスペリエンスを向上させています。この機能の活用に関心のある開発者は、NVIDIA のGitHubドキュメントで詳細情報を入手し、開始して、最新の AI 推論パフォーマンスの更新を把握することができます。

この記事を共有:

最新のニュース
日本システム技術AIコールセンター支援

日本システム技術AIコールセンター支援

24/11/15 4:30

日本システム技術(大阪)は、保険者向け業務支援システム「iBss」の社内業務に、リンク社の「BIZTEL」とAI Shift社のAI Messenger Voicebotを連携し導入した。

イマクリエ五島市AI自治体支援

イマクリエ五島市AI自治体支援

24/11/15 4:30

イマクリエ(東京都港区)は、五島市に「exaBase 生成AI for 自治体運用パッケージ」の提供を開始した。

NTTデータ、2025年版グローバルGenAI導入レポートを発表

NTTデータ、2025年版グローバルGenAI導入レポートを発表

24/11/15 4:30

NTTデータは、包括的な調査から得られた結果を発表し、リーダーの焦点が探索段階から、ビジネスパフォーマンスと組織文化の向上を目的とした生成AI (GenAI)の戦略的実装へと移行していることを示しています。

アジア財団がSTEM(STEM教育)女性キャリア開発ワークショップを発表

アジア財団がSTEM(STEM教育)女性キャリア開発ワークショップを発表

24/11/15 4:30

11月21日には、 STEM(STEM教育)分野の女子大学生のキャリア開発を支援するオンラインイベント「 STEM(STEM教育) ConnectHER: 生成AI × Self × Career Workshop & STEM(STEM教育) × Gender CAFE」が開催されます。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
日本システム技術AIコールセンター支援

日本システム技術AIコールセンター支援

24/11/15 4:30

日本システム技術(大阪)は、保険者向け業務支援システム「iBss」の社内業務に、リンク社の「BIZTEL」とAI Shift社のAI Messenger Voicebotを連携し導入した。

イマクリエ五島市AI自治体支援

イマクリエ五島市AI自治体支援

24/11/15 4:30

イマクリエ(東京都港区)は、五島市に「exaBase 生成AI for 自治体運用パッケージ」の提供を開始した。

NTTデータ、2025年版グローバルGenAI導入レポートを発表

NTTデータ、2025年版グローバルGenAI導入レポートを発表

24/11/15 4:30

NTTデータは、包括的な調査から得られた結果を発表し、リーダーの焦点が探索段階から、ビジネスパフォーマンスと組織文化の向上を目的とした生成AI (GenAI)の戦略的実装へと移行していることを示しています。

アジア財団がSTEM(STEM教育)女性キャリア開発ワークショップを発表

アジア財団がSTEM(STEM教育)女性キャリア開発ワークショップを発表

24/11/15 4:30

11月21日には、 STEM(STEM教育)分野の女子大学生のキャリア開発を支援するオンラインイベント「 STEM(STEM教育) ConnectHER: 生成AI × Self × Career Workshop & STEM(STEM教育) × Gender CAFE」が開催されます。

bottom of page