top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

SambaNova が Samba-1 Turbo で新たな LLMBenchmarkを設定

Generatived

24/5/30 4:43

SambaNova Systemsは、Artificial Analysisが実施した最新の大規模言語モデル(LLM)ベンチマークでトップパフォーマーとして浮上した。同社のSamba-1 Turboモデルは、1秒当たり1,000トークン以上を処理するという新記録を達成した。これは、Llama 3 8Bのパフォーマンスの大幅な飛躍だ。CEOのRodrigo Liang氏は、正確さのために速度を犠牲にすることなく、コスト効率の高いカスタムAIシステムを企業に提供し、組織がワークフローを強化してイノベーションをより迅速に促進できるようにするという同社の取り組みを強調した。

Artificial Analysisの共同設立者兼CEOであるMicah Hill-Smith氏は、SambaNovaの功績を認め、Samba-1 Turboの推論性能が他の全てのベンチマークを上回ったことを指摘した。このモデルの1秒当たり1,084トークンという優れた出力は、他のプロバイダーの平均速度の8倍以上だ。さらに、Samba-1 TurboのLlama 3 Instruct (8B)モデルの品質は、16ビット精度の標準に準拠していることが確認されている。

SambaNovaのアプローチは、わずか16個のチップでLlama 3 8Bモデルを前例のない速度で実行し、1つのノードで最大1000個のLlama3チェックポイントをホストできるという点で競合他社とは異なる。この効率性により、完全な精度が維持されるだけでなく、同様のタスクに数百個のチップを必要とする競合他社と比較してコストが大幅に削減される。同社のテクノロジーにより、速度を犠牲にすることなく複数のモデルを同時に実行できるため、総所有コストが10分の1に削減される。

SambaNovaの共同設立者であり、スタンフォード大学の著名なコンピューター科学者でもあるKunle Olukotun氏は、成功の背後にある技術革新を強調し、SN40Lチップのデータフローアーキテクチャーを称賛した。この設計により、レーテンシーが最小限に抑えられ、スループットが最大化され、従来のGPUベースのソリューションを上回り、瞬時のAI機能を実現する。SambaNovaは、企業にSamba-1 Turboの機能を直接体験していただくよう呼びかけている。

この記事を共有:

最新のニュース
ServiceNowとFive9 がEnhance AI

ServiceNowとFive9 がEnhance AI

24/11/14 4:30

ServiceNowとFive9 は、 AI を活用したソリューションで従業員と顧客のエクスペリエンスを強化するためのパートナーシップの拡大を発表しました。

リタールとエプランが持続可能な産業ソリューションを展示

リタールとエプランが持続可能な産業ソリューションを展示

24/11/14 4:30

Rittal は、2 つの重要な業界イベントで、最新の産業オートメーションおよび AI 対応 IT インフラストラクチャ ソリューションを展示する予定です。

スカイラインキャピタル、AI 駆動型金融プラットフォームの立ち上げを発表

スカイラインキャピタル、AI 駆動型金融プラットフォームの立ち上げを発表

24/11/14 4:30

Skyline Capital は、金融業界を再定義する AI 主導の金融プラットフォームを発表しました。

ソフトバンク、NVIDIA 技術を活用した AI vRAN オーケストレーターを発表

ソフトバンク、NVIDIA 技術を活用した AI vRAN オーケストレーターを発表

24/11/14 4:30

ソフトバンクは、AI-RANの中心概念である共有仮想化インフラストラクチャ上でのAIおよびvRANアプリケーションの運用を容易にするために設計されたオーケストレーターを発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
ServiceNowとFive9 がEnhance AI

ServiceNowとFive9 がEnhance AI

24/11/14 4:30

ServiceNowとFive9 は、 AI を活用したソリューションで従業員と顧客のエクスペリエンスを強化するためのパートナーシップの拡大を発表しました。

リタールとエプランが持続可能な産業ソリューションを展示

リタールとエプランが持続可能な産業ソリューションを展示

24/11/14 4:30

Rittal は、2 つの重要な業界イベントで、最新の産業オートメーションおよび AI 対応 IT インフラストラクチャ ソリューションを展示する予定です。

スカイラインキャピタル、AI 駆動型金融プラットフォームの立ち上げを発表

スカイラインキャピタル、AI 駆動型金融プラットフォームの立ち上げを発表

24/11/14 4:30

Skyline Capital は、金融業界を再定義する AI 主導の金融プラットフォームを発表しました。

ソフトバンク、NVIDIA 技術を活用した AI vRAN オーケストレーターを発表

ソフトバンク、NVIDIA 技術を活用した AI vRAN オーケストレーターを発表

24/11/14 4:30

ソフトバンクは、AI-RANの中心概念である共有仮想化インフラストラクチャ上でのAIおよびvRANアプリケーションの運用を容易にするために設計されたオーケストレーターを発表しました。

bottom of page