Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
Groq、LPU™システムでLLM性能記録を再び更新
Generatived
23/8/31 17:00
AIソリューションプロバイダーであるGroqは、大規模言語モデル(LLM)であるLlama-2 70Bの推論パフォーマンスが大幅に向上したことを発表した。わずか3週間で、同社はパフォーマンスを2倍以上に向上させることに成功し、LPU™ システム上でユーザー当たり240トークン/秒(T/s)以上の速度で実行できるようになった。この成果は、GroqがLlama-2 70Bでユーザー当たり100T/sに初めて到達した後に行われ、米国で製造された第1世代の14nmシリコンのさらなるパフォーマンス向上の可能性についての疑問を引き起こした。
Groqの顧客はプライベートデモを公開しており、それぞれの業界で低レーテンシーLLMの使用例の可能性の新たな世界を切り開いている。例えば、LLMを使用すると、オンラインフォーラムやソーシャル メディアからの大量のテキストデータを監視でき、潜在的なサイバー攻撃やセキュリティー侵害を迅速に検出できる。これらのモデルの超低レーテンシーは、リアルタイムの分析と対応にとって極めて重要であり、機密情報、重要なインフラ、国家安全保障の保護において重要な役割を果たす。
LLMは、自然災害時の地域の緊急対応に革命を起こす可能性もある。これらのモデルは、ソーシャルメディア、緊急通報、天気予報からのリアルタイム データを分析することで、緊急に支援が必要な地域を特定し、脅威を予測し、初期対応者や影響を受けたコミュニティーに正確なガイダンスを提供できる。
最新のニュース
NVIDIA、GeForce RTX ユーザー向けに新アプリをリリース
24/11/13 4:30
NVIDIA は、GeForce RTX GPU ユーザーのエクスペリエンスを向上させるために設計された新しいアプリを正式にリリースしました。
Microsoft AI ソリューションがフォーチュン 500 企業を変革
24/11/13 4:30
Microsoft は、人工知能 (AI) がビジネスに与える影響を理解するために、顧客やパートナーと積極的に連携してきました。
Copyright © 2024 Generatived - All right Reserved.
ニュース
AIと法律/制度/経済/社会
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
NVIDIA、GeForce RTX ユーザー向けに新アプリをリリース
24/11/13 4:30
NVIDIA は、GeForce RTX GPU ユーザーのエクスペリエンスを向上させるために設計された新しいアプリを正式にリリースしました。
Microsoft AI ソリューションがフォーチュン 500 企業を変革
24/11/13 4:30
Microsoft は、人工知能 (AI) がビジネスに与える影響を理解するために、顧客やパートナーと積極的に連携してきました。