Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
MLCommons が MLPerf Inference v4.1 の結果を発表
Generatived
24/8/29 2:00
MLCommons は、機械学習システムのパフォーマンスを評価する MLPerf Inference v4.1 ベンチマーク スイートの最新結果を発表しました。データ センターとエッジ システムの両方をカバーするこのスイートは、AI および ML モデル用の公平で再現可能なベンチマーク プラットフォームを提供することを目指しています。最新リリースには 6 つの新しいプロセッサの結果が含まれており、そのうちのいくつかは現在利用可能で、その他はプレビューとして提供されています。
ベンチマーク スイートには 22 の組織が参加しており、さまざまな AI システム テクノロジーが紹介されています。結果は、AI テクノロジーの評価と調達に不可欠な透明性のあるパフォーマンス ベンチマークに対する業界の取り組みを強調しています。参加者には、AMD や Sustainable Metal Cloud など、MLPerf Inference への新規提出企業を含むテクノロジー大手と新興企業の両方が含まれています。
MLPerf Inference スイートへの注目すべき追加は、専門家混合 (MoE) モデル アーキテクチャに基づく新しいベンチマークです。このアプローチでは、複数の小さなモデル、つまり「エキスパート」を利用して推論タスクを処理します。これにより、従来の単一モデル システムよりもパフォーマンス上のメリットが得られます。これまでで最も複雑なものの 1 つである MoE ベンチマークは、Mixtral 8x7B モデルを使用し、Q&A、数学の問題解決、コード生成などのタスクをカバーします。
ベンチマーク スイートには電力消費テストも含まれており、データ センターとエッジ環境で動作するシステムについて 31 件の結果が提出されています。これらのテストは、電力コストが全体的な運用コストに大きく影響するため、AI システムのエネルギー需要を理解することの重要性を強調しています。MLCommons は、オープンで透明性のあるベンチマークを提供することで AI 業界をサポートし続け、急速に進化する AI テクノロジーの状況を関係者が乗り越えられるよう支援しています。
最新のニュース
ソフトバンク国内最大AIスパコン構築
24/11/14 4:30
ソフトバンク(東京)は、NVIDIA Blackwellを搭載した国内最大級のAIスーパーコンピューターの構築と、Grace Blackwellの導入計画を発表した。
アルファポリス小説AI検索β開始
24/11/14 4:30
アルファポリス(東京都渋谷区)は、小説・漫画の投稿サイト「アルファポリス」で、AWSの「Amazon Bedrock」を用いた「小説検索AIアシスタントβ」を2024年11月11日にリリースした。
Copyright © 2024 Generatived - All right Reserved.
ニュース
AIと法律/制度/経済/社会
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
ソフトバンク国内最大AIスパコン構築
24/11/14 4:30
ソフトバンク(東京)は、NVIDIA Blackwellを搭載した国内最大級のAIスーパーコンピューターの構築と、Grace Blackwellの導入計画を発表した。
アルファポリス小説AI検索β開始
24/11/14 4:30
アルファポリス(東京都渋谷区)は、小説・漫画の投稿サイト「アルファポリス」で、AWSの「Amazon Bedrock」を用いた「小説検索AIアシスタントβ」を2024年11月11日にリリースした。