Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

Google Cloud が Gemma 3 AI モデルを発表
Generatived
25/3/13 4:30
Gemma 3 の導入は AI 分野における大きな進歩であり、開発者に速度と移植性の両方を優先するモデル スイートを提供します。これらのモデルは、大規模な高度な AI アプリケーションの作成を容易にするように設計されています。Cloud Run と統合すると、開発者は AI モデルを組み込んだサーバーレス ワークロードを驚くほど簡単にデプロイでき、効率とユーザー エクスペリエンスが向上します。
Gemma 3 は、その優れたパフォーマンスで際立っており、コスト効率の高い推論ワークロードに最適な、より小さなメモリ フットプリントを誇ります。予備評価では、Llama-405B、DeepSeek-V3、o3-mini などの競合製品を上回り、サイズに対する優れたパフォーマンスが認められています。このモデル ファミリにより、開発者は、画像、テキスト、短いビデオを分析できる高度なテキストおよび視覚推論機能を備えたアプリケーションを作成できます。さらに、Gemma 3 の 128k トークンの大きなコンテキスト ウィンドウにより、小説全体などの広範な情報を処理できるため、より複雑な AI タスクが可能になります。
Gemma 3 と Cloud Run の相乗効果により、シームレスなサーバーレス推論エクスペリエンスが実現します。Google Cloud の完全マネージドGoogleサーバーレス プラットフォームである Cloud Run を使用すると、開発者はインフラストラクチャの管理に煩わされることなくコンテナ ランタイムを利用できます。この設定により、非アクティブなときにモデルをゼロにスケーリングし、需要に応じて動的にスケーリングすることでコストとパフォーマンスが最適化されるだけでなく、開発者は使用したリソースに対してのみ料金を支払うことになります。GPU アクセラレーションのメリットが加わった Cloud Run サービスは、インスタンスがわずか 5 秒で起動し、30 秒未満で AI 推論結果を提供できます。この迅速なデプロイ機能は、応答性の高いユーザー エクスペリエンスを必要とするアプリケーションにとって非常に重要です。さらに、Cloud Run での GPU 使用コストが削減されたため、AI モデルのデプロイのコスト効率がさらに最適化されています。
最新のニュース
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。