Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
Groq、LPU™システムでLLM性能記録を再び更新
Generatived
23/8/31 17:00
AIソリューションプロバイダーであるGroqは、大規模言語モデル(LLM)であるLlama-2 70Bの推論パフォーマンスが大幅に向上したことを発表した。わずか3週間で、同社はパフォーマンスを2倍以上に向上させることに成功し、LPU™ システム上でユーザー当たり240トークン/秒(T/s)以上の速度で実行できるようになった。この成果は、GroqがLlama-2 70Bでユーザー当たり100T/sに初めて到達した後に行われ、米国で製造された第1世代の14nmシリコンのさらなるパフォーマンス向上の可能性についての疑問を引き起こした。
Groqの顧客はプライベートデモを公開しており、それぞれの業界で低レーテンシーLLMの使用例の可能性の新たな世界を切り開いている。例えば、LLMを使用すると、オンラインフォーラムやソーシャル メディアからの大量のテキストデータを監視でき、潜在的なサイバー攻撃やセキュリティー侵害を迅速に検出できる。これらのモデルの超低レーテンシーは、リアルタイムの分析と対応にとって極めて重要であり、機密情報、重要なインフラ、国家安全保障の保護において重要な役割を果たす。
LLMは、自然災害時の地域の緊急対応に革命を起こす可能性もある。これらのモデルは、ソーシャルメディア、緊急通報、天気予報からのリアルタイム データを分析することで、緊急に支援が必要な地域を特定し、脅威を予測し、初期対応者や影響を受けたコミュニティーに正確なガイダンスを提供できる。
最新のニュース
UNICOMエンジニアリングがXE9680-IRイマージョンサーバーを発表
24/11/14 4:30
UNICOM Engineering は、データセンターの効率性と持続可能性を高めるために設計された新しいサーバー プラットフォーム XE9680-IR を発表しました。
ソフトバンクと富士通がAI-RANを共同開発
24/11/14 4:30
ソフトバンク(東京)と富士通(東京)は、AIとRANを統合した新技術「AI-RAN」の実用化に向け、共同研究開発を進めることを発表した。
NVIDIAとソフトバンクが日本のAIスーパーコンピューターを発表
24/11/14 4:30
NVIDIA の AI Summit Japan は、人工知能における日本の将来に関する重要な発表の場となりました。
Copyright © 2024 Generatived - All right Reserved.
ニュース
AIと法律/制度/経済/社会
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
UNICOMエンジニアリングがXE9680-IRイマージョンサーバーを発表
24/11/14 4:30
UNICOM Engineering は、データセンターの効率性と持続可能性を高めるために設計された新しいサーバー プラットフォーム XE9680-IR を発表しました。
ソフトバンクと富士通がAI-RANを共同開発
24/11/14 4:30
ソフトバンク(東京)と富士通(東京)は、AIとRANを統合した新技術「AI-RAN」の実用化に向け、共同研究開発を進めることを発表した。
NVIDIAとソフトバンクが日本のAIスーパーコンピューターを発表
24/11/14 4:30
NVIDIA の AI Summit Japan は、人工知能における日本の将来に関する重要な発表の場となりました。