top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

MLCommons が MLPerf Inference v4.1 の結果を発表

Generatived

24/8/29 2:00

MLCommons は、機械学習システムのパフォーマンスを評価する MLPerf Inference v4.1 ベンチマーク スイートの最新結果を発表しました。データ センターとエッジ システムの両方をカバーするこのスイートは、AI および ML モデル用の公平で再現可能なベンチマーク プラットフォームを提供することを目指しています。最新リリースには 6 つの新しいプロセッサの結果が含まれており、そのうちのいくつかは現在利用可能で、その他はプレビューとして提供されています。

ベンチマーク スイートには 22 の組織が参加しており、さまざまな AI システム テクノロジーが紹介されています。結果は、AI テクノロジーの評価と調達に不可欠な透明性のあるパフォーマンス ベンチマークに対する業界の取り組みを強調しています。参加者には、AMD や Sustainable Metal Cloud など、MLPerf Inference への新規提出企業を含むテクノロジー大手と新興企業の両方が含まれています。

MLPerf Inference スイートへの注目すべき追加は、専門家混合 (MoE) モデル アーキテクチャに基づく新しいベンチマークです。このアプローチでは、複数の小さなモデル、つまり「エキスパート」を利用して推論タスクを処理します。これにより、従来の単一モデル システムよりもパフォーマンス上のメリットが得られます。これまでで最も複雑なものの 1 つである MoE ベンチマークは、Mixtral 8x7B モデルを使用し、Q&A、数学の問題解決、コード生成などのタスクをカバーします。

ベンチマーク スイートには電力消費テストも含まれており、データ センターとエッジ環境で動作するシステムについて 31 件の結果が提出されています。これらのテストは、電力コストが全体的な運用コストに大きく影響するため、AI システムのエネルギー需要を理解することの重要性を強調しています。MLCommons は、オープンで透明性のあるベンチマークを提供することで AI 業界をサポートし続け、急速に進化する AI テクノロジーの状況を関係者が乗り越えられるよう支援しています。

この記事を共有:

最新のニュース
UNICOMエンジニアリングがXE9680-IRイマージョンサーバーを発表

UNICOMエンジニアリングがXE9680-IRイマージョンサーバーを発表

24/11/14 4:30

UNICOM Engineering は、データセンターの効率性と持続可能性を高めるために設計された新しいサーバー プラットフォーム XE9680-IR を発表しました。

ソフトバンクと富士通がAI-RANを共同開発

ソフトバンクと富士通がAI-RANを共同開発

24/11/14 4:30

ソフトバンク(東京)と富士通(東京)は、AIとRANを統合した新技術「AI-RAN」の実用化に向け、共同研究開発を進めることを発表した。

NVIDIAとソフトバンクが日本のAIスーパーコンピューターを発表

NVIDIAとソフトバンクが日本のAIスーパーコンピューターを発表

24/11/14 4:30

NVIDIA の AI Summit Japan は、人工知能における日本の将来に関する重要な発表の場となりました。

NVIDIA、AI が世界の産業に及ぼす影響を予測

NVIDIA、AI が世界の産業に及ぼす影響を予測

24/11/14 4:30

デジタル時代は前例のない量のデータをもたらし、推定ではその量は 120 ゼタバイトと驚異的です。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
UNICOMエンジニアリングがXE9680-IRイマージョンサーバーを発表

UNICOMエンジニアリングがXE9680-IRイマージョンサーバーを発表

24/11/14 4:30

UNICOM Engineering は、データセンターの効率性と持続可能性を高めるために設計された新しいサーバー プラットフォーム XE9680-IR を発表しました。

ソフトバンクと富士通がAI-RANを共同開発

ソフトバンクと富士通がAI-RANを共同開発

24/11/14 4:30

ソフトバンク(東京)と富士通(東京)は、AIとRANを統合した新技術「AI-RAN」の実用化に向け、共同研究開発を進めることを発表した。

NVIDIAとソフトバンクが日本のAIスーパーコンピューターを発表

NVIDIAとソフトバンクが日本のAIスーパーコンピューターを発表

24/11/14 4:30

NVIDIA の AI Summit Japan は、人工知能における日本の将来に関する重要な発表の場となりました。

NVIDIA、AI が世界の産業に及ぼす影響を予測

NVIDIA、AI が世界の産業に及ぼす影響を予測

24/11/14 4:30

デジタル時代は前例のない量のデータをもたらし、推定ではその量は 120 ゼタバイトと驚異的です。

bottom of page