top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA TensorRT-LLM:大規模言語モデルの性能と精度の強化

Generatived

23/9/11 9:07

大規模言語モデル(LLM)の急速な進歩は、多様なモデルアーキテクチャーが日々開発され、エコシステムの急成長に貢献している。これらのより大きなモデルは、新しい機能とユースケースを解き放ち、さまざまな業界での広範な採用につながっている。LLMの推論は、データセンターの状況を変革している。企業はパフォーマンスの向上と精度の向上による恩恵を受け、その結果、総所有コスト(TCO)が向上する。これらのモデルの革新により顧客エクスペリエンスが向上し、ひいては収益と利益の増加につながる。ただし、推論展開プロジェクト中に最先端のLLMを使用して最高のパフォーマンスを達成するには、課題がないわけではない。最適化が自動的に行われることはほとんどなく、ユーザーは並列処理、エンドツーエンドのパイプライン、高度なスケジューリング技術などの微調整要素を考慮する必要がある。さらに、精度を損なうことなく混合精度を処理できるコンピューティングプラットフォームが不可欠だ。 「TensorRT-LLM」はこれらの課題に対する解決策を提供する。これには、TensorRT’s Deep Learning Compiler、最適化されたカーネル、前処理および後処理、およびマルチGPU/マルチノード通信が含まれる。これらは全て、運用環境で推論するためのLLMを定義、最適化、実行するためのシンプルなオープンソースPython APIにパッケージ化されている。NVIDIA TensorRT-LLMは現在早期アクセスが提供されており、まもなくNVIDIA NeMoフレームワークに統合される予定だ。これにより、開発者や研究者は、NGC上のNeMoフレームワークまたはGitHub上のソースリポジトリーを通じてTensorRT-LLMにアクセスできるようになる。

この記事を共有:

最新のニュース
Onplanetz中小企業補助金申請支援

Onplanetz中小企業補助金申請支援

25/4/28 3:00

Onplanetz(渋谷区)は中小企業向けに「中小企業成長加速化補助金」申請支援サービスを開始。

Ubie AIガバナンス取組ガイド掲載

Ubie AIガバナンス取組ガイド掲載

25/4/28 3:00

Ubie(東京都中央区)は、経済産業省と総務省が策定した「AI事業者ガイドライン(第1.1版)」に、同社のAIガバナンスの取り組みが掲載されたと発表。

ULTRA SOCIAL成田空港多言語AI導入

ULTRA SOCIAL成田空港多言語AI導入

25/4/28 3:00

ULTRA SOCIAL(東京都港区)は、2025年4月25日にヤマダデンキの「YAMADA TAX FREE 成田空港第1ターミナル店」に自社開発の「Spaike AI」を導入した。

ギブリーMANA Studio最新AIモデル対応

ギブリーMANA Studio最新AIモデル対応

25/4/28 3:00

ギブリー(東京都渋谷区)は、生成AI活用プラットフォーム「MANA Studio」が米OpenAIとGoogleの最新APIモデルにアップデートしたと発表。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Onplanetz中小企業補助金申請支援

Onplanetz中小企業補助金申請支援

25/4/28 3:00

Onplanetz(渋谷区)は中小企業向けに「中小企業成長加速化補助金」申請支援サービスを開始。

Ubie AIガバナンス取組ガイド掲載

Ubie AIガバナンス取組ガイド掲載

25/4/28 3:00

Ubie(東京都中央区)は、経済産業省と総務省が策定した「AI事業者ガイドライン(第1.1版)」に、同社のAIガバナンスの取り組みが掲載されたと発表。

ULTRA SOCIAL成田空港多言語AI導入

ULTRA SOCIAL成田空港多言語AI導入

25/4/28 3:00

ULTRA SOCIAL(東京都港区)は、2025年4月25日にヤマダデンキの「YAMADA TAX FREE 成田空港第1ターミナル店」に自社開発の「Spaike AI」を導入した。

ギブリーMANA Studio最新AIモデル対応

ギブリーMANA Studio最新AIモデル対応

25/4/28 3:00

ギブリー(東京都渋谷区)は、生成AI活用プラットフォーム「MANA Studio」が米OpenAIとGoogleの最新APIモデルにアップデートしたと発表。

bottom of page