Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
NVIDIA と Mistral AI が Mistral-NeMo-Minitron 8B をリリース
Generatived
24/8/23 9:00
NVIDIA と Mistral AI は最近、さまざまなベンチマークでパフォーマンスの新たな基準を確立した大規模言語モデル (LLM) である Mistral NeMo 12B を発表しました。この成功を基に、両社は、9 つの主要なベンチマークでクラス最高の精度を誇る高度なオープン アクセス モデルである Mistral-NeMo-Minitron 8B のリリースを発表しました。Mistral-NeMo-Minitron 8B の開発には、より大きな Mistral NeMo 12B の幅プルーニングと呼ばれる手法が使用され、その後、知識蒸留を使用した再トレーニング プロセスが行われました。この方法は、NVIDIA Minitron 8B および 4B、Llama-3.1-Minitron 4B などの以前のモデルで検証されています。
モデルのプルーニングと蒸留のプロセスでは、モデルのサイズを縮小して、予測機能を大幅に損なうことなく、モデルをより効率的にします。 Mistral-NeMo-Minitron 8B モデルは、元のモデルの幅を選択的に削減し、その後、軽い再トレーニング レジメンを適用することで作成されました。このアプローチは効果的かつコスト効率が高いことが実証されており、最初からトレーニングしたモデルと比較して、高品質を維持する小規模なモデルの作成を可能にします。
LLM の競争環境において、Mistral-NeMo-Minitron 8B は、その優れたパフォーマンス メトリックによって際立っています。このモデルの精度は比較表で強調されており、Gemma 7B や Llama-3.1 8B など、同様のサイズの他のモデルよりも一貫して優れています。この表は、さまざまなベンチマークでモデルの優れたパフォーマンスを示しており、太字の数字は 8B モデル クラスの中で最高のスコアを示しています。
Mistral-NeMo-Minitron 8B のリリースは、言語モデルの進化における重要な一歩です。これは、構造化された重みの削減と知識の蒸留を組み合わせた有効性を示すだけでなく、この分野の将来の進歩の土台を築くものでもあります。このモデルの開発に使用された技術は、生成 AI 用の NVIDIA NeMo フレームワークに統合され、言語処理技術の機能がさらに強化されることが期待されています。ソース:
最新のニュース
HelixML、プライベートAI管理向けHelix 1.4をリリース
24/11/13 4:30
HelixML は、KubeCon + CloudNativeCon 2024 で Helix 1.4 を発表しました。
イマーシブ・ラボ、AI 駆動型サイバーシナリオジェネレータを発表
24/11/13 4:30
Immersive Labs は、組織が危機シミュレーション用にカスタマイズされた脅威シナリオを作成できるようにすることでサイバーレジリエンスを強化するように設計された新しい AI シナリオ ジェネレーターを発表しました。
Copyright © 2024 Generatived - All right Reserved.
ニュース
AIと法律/制度/経済/社会
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
HelixML、プライベートAI管理向けHelix 1.4をリリース
24/11/13 4:30
HelixML は、KubeCon + CloudNativeCon 2024 で Helix 1.4 を発表しました。
イマーシブ・ラボ、AI 駆動型サイバーシナリオジェネレータを発表
24/11/13 4:30
Immersive Labs は、組織が危機シミュレーション用にカスタマイズされた脅威シナリオを作成できるようにすることでサイバーレジリエンスを強化するように設計された新しい AI シナリオ ジェネレーターを発表しました。