Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
MLCommons が MLPerf Inference v4.1 の結果を発表
Generatived
24/8/29 2:00
MLCommons は、機械学習システムのパフォーマンスを評価する MLPerf Inference v4.1 ベンチマーク スイートの最新結果を発表しました。データ センターとエッジ システムの両方をカバーするこのスイートは、AI および ML モデル用の公平で再現可能なベンチマーク プラットフォームを提供することを目指しています。最新リリースには 6 つの新しいプロセッサの結果が含まれており、そのうちのいくつかは現在利用可能で、その他はプレビューとして提供されています。
ベンチマーク スイートには 22 の組織が参加しており、さまざまな AI システム テクノロジーが紹介されています。結果は、AI テクノロジーの評価と調達に不可欠な透明性のあるパフォーマンス ベンチマークに対する業界の取り組みを強調しています。参加者には、AMD や Sustainable Metal Cloud など、MLPerf Inference への新規提出企業を含むテクノロジー大手と新興企業の両方が含まれています。
MLPerf Inference スイートへの注目すべき追加は、専門家混合 (MoE) モデル アーキテクチャに基づく新しいベンチマークです。このアプローチでは、複数の小さなモデル、つまり「エキスパート」を利用して推論タスクを処理します。これにより、従来の単一モデル システムよりもパフォーマンス上のメリットが得られます。これまでで最も複雑なものの 1 つである MoE ベンチマークは、Mixtral 8x7B モデルを使用し、Q&A、数学の問題解決、コード生成などのタスクをカバーします。
ベンチマーク スイートには電力消費テストも含まれており、データ センターとエッジ環境で動作するシステムについて 31 件の結果が提出されています。これらのテストは、電力コストが全体的な運用コストに大きく影響するため、AI システムのエネルギー需要を理解することの重要性を強調しています。MLCommons は、オープンで透明性のあるベンチマークを提供することで AI 業界をサポートし続け、急速に進化する AI テクノロジーの状況を関係者が乗り越えられるよう支援しています。
最新のニュース
FutureHR AI開発スキル50日プログラム
24/11/8 4:30
FutureHR(東京都渋谷区)は、プログラミング未経験者やエンジニアへのキャリアチェンジ希望者を対象に、50日間のオンラインプログラム「codio AI camp」を提供開始。
Copyright © 2024 Generatived - All right Reserved.
ニュース
AIと法律/制度/経済/社会
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
FutureHR AI開発スキル50日プログラム
24/11/8 4:30
FutureHR(東京都渋谷区)は、プログラミング未経験者やエンジニアへのキャリアチェンジ希望者を対象に、50日間のオンラインプログラム「codio AI camp」を提供開始。