top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

SambaNova が Samba-1 Turbo で新たな LLMBenchmarkを設定

Generatived

24/5/30 4:43

SambaNova Systemsは、Artificial Analysisが実施した最新の大規模言語モデル(LLM)ベンチマークでトップパフォーマーとして浮上した。同社のSamba-1 Turboモデルは、1秒当たり1,000トークン以上を処理するという新記録を達成した。これは、Llama 3 8Bのパフォーマンスの大幅な飛躍だ。CEOのRodrigo Liang氏は、正確さのために速度を犠牲にすることなく、コスト効率の高いカスタムAIシステムを企業に提供し、組織がワークフローを強化してイノベーションをより迅速に促進できるようにするという同社の取り組みを強調した。

Artificial Analysisの共同設立者兼CEOであるMicah Hill-Smith氏は、SambaNovaの功績を認め、Samba-1 Turboの推論性能が他の全てのベンチマークを上回ったことを指摘した。このモデルの1秒当たり1,084トークンという優れた出力は、他のプロバイダーの平均速度の8倍以上だ。さらに、Samba-1 TurboのLlama 3 Instruct (8B)モデルの品質は、16ビット精度の標準に準拠していることが確認されている。

SambaNovaのアプローチは、わずか16個のチップでLlama 3 8Bモデルを前例のない速度で実行し、1つのノードで最大1000個のLlama3チェックポイントをホストできるという点で競合他社とは異なる。この効率性により、完全な精度が維持されるだけでなく、同様のタスクに数百個のチップを必要とする競合他社と比較してコストが大幅に削減される。同社のテクノロジーにより、速度を犠牲にすることなく複数のモデルを同時に実行できるため、総所有コストが10分の1に削減される。

SambaNovaの共同設立者であり、スタンフォード大学の著名なコンピューター科学者でもあるKunle Olukotun氏は、成功の背後にある技術革新を強調し、SN40Lチップのデータフローアーキテクチャーを称賛した。この設計により、レーテンシーが最小限に抑えられ、スループットが最大化され、従来のGPUベースのソリューションを上回り、瞬時のAI機能を実現する。SambaNovaは、企業にSamba-1 Turboの機能を直接体験していただくよう呼びかけている。

この記事を共有:

最新のニュース
Cloudera、データ専門家の生産性向上のため Copilot を発表

Cloudera、データ専門家の生産性向上のため Copilot を発表

24/11/15 4:30

Cloudera は、 EVOLVE24 Paris でCloudera AI 向けのCloudera Copilot を発表しました。

Cognigy、顧客サービス強化のためのエージェント型 AI をリリース

Cognigy、顧客サービス強化のためのエージェント型 AI をリリース

24/11/15 4:30

Cognigy は、企業の顧客サービスの変革を目的とした Cognigy.AI プラットフォームの新機能である Agentic AI を発表しました。

買い物客はより賢いホリデーシーズンの買い物のために GenAI を採用

買い物客はより賢いホリデーシーズンの買い物のために GenAI を採用

24/11/15 4:30

経済的なプレッシャーの中、消費者のかなりの部分、最大 75% が、ブラックフライデー、サイバーマンデー、独身の日セールを利用しようと準備を進めています。

弾力性のある AI エコシステムがエンタープライズ RAG 開発を加速

弾力性のある AI エコシステムがエンタープライズ RAG 開発を加速

24/11/15 4:30

Elastic は、エンタープライズ開発者が Retrieval Augmented Generation (RAG) アプリケーションの作成と展開を迅速化できるように支援することを目的とした AI エコシステムを発表しました。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Cloudera、データ専門家の生産性向上のため Copilot を発表

Cloudera、データ専門家の生産性向上のため Copilot を発表

24/11/15 4:30

Cloudera は、 EVOLVE24 Paris でCloudera AI 向けのCloudera Copilot を発表しました。

Cognigy、顧客サービス強化のためのエージェント型 AI をリリース

Cognigy、顧客サービス強化のためのエージェント型 AI をリリース

24/11/15 4:30

Cognigy は、企業の顧客サービスの変革を目的とした Cognigy.AI プラットフォームの新機能である Agentic AI を発表しました。

買い物客はより賢いホリデーシーズンの買い物のために GenAI を採用

買い物客はより賢いホリデーシーズンの買い物のために GenAI を採用

24/11/15 4:30

経済的なプレッシャーの中、消費者のかなりの部分、最大 75% が、ブラックフライデー、サイバーマンデー、独身の日セールを利用しようと準備を進めています。

弾力性のある AI エコシステムがエンタープライズ RAG 開発を加速

弾力性のある AI エコシステムがエンタープライズ RAG 開発を加速

24/11/15 4:30

Elastic は、エンタープライズ開発者が Retrieval Augmented Generation (RAG) アプリケーションの作成と展開を迅速化できるように支援することを目的とした AI エコシステムを発表しました。

bottom of page