Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
Gcore、超低遅延のエッジ AI サービスを開始
Generatived
24/6/7 4:22
Gcoreは、超低レーテンシーのエクスペリエンスでAIアプリケーションを強化するように設計された最新のサービス、Gcore Inference at the Edgeを発表した。このサービスにより、事前トレーニング済みの機械学習モデルをエッジ推論ノードに配布できるようになり、リアルタイムでシームレスな推論が可能になる。このソリューションは、生成AIやリアルタイムの行動分析などのさまざまなアプリケーション向けのAIモデルの効率的で安全な展開を可能にすることで、自動車、製造、小売、テクノロジーなど、さまざまな分野にメリットをもたらすだろう。
同社の新サービスは、Gcoreの高度な低遅延ルーティング技術を活用した180を超えるエッジノードの広範なネットワークで運用されている。高性能ノードをユーザーの近くに配置することで、このサービスはNVIDIA L40S GPUを活用し、通常30ミリ秒未満の迅速な応答時間を保証する。この設定は、リクエストを最も低いレーテンシーで最も近い推論領域に誘導することで、ユーザーエクスペリエンスを最適化するように設計されている。
Gcore Inference at the Edgeは、Gcore ML Model Hubで利用可能なオープンソースの基盤モデルを含む、幅広いMLモデルをサポートしている。開発チームは、モデルを選択してトレーニングし、グローバルに展開する前に特定のニーズを満たすことができるようになった。これにより、トレーニングしたのと同じサーバー上でAIモデルを実行するという、パフォーマンスが最適にならないことが多いという一般的な課題を克服できる。
このサービスには、柔軟な価格モデルによるコスト効率の高い導入、自動DDoS保護、主要なデータプライバシーおよびセキュリティー標準へのコンプライアンス、負荷の急増を管理する自動スケーリング機能、無制限のオブジェクト ストレージなど、いくつかの重要な利点がある。GcoreのCEOであるAndre Reitenbach氏は、導入コストやインフラストラクチャーを気にすることなく、機械学習モデルのトレーニングに集中できるように、顧客に手間のかからないAI推論エクスペリエンスを提供するという同社の取り組みを強調した。
最新のニュース
WonderSpace SEOウェビナー開催告知
24/11/15 4:30
WonderSpace(東京都港区)は、ChatGPTを活用したSEOコンテンツ作成の効率化に関するウェビナーを開催すると発表した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
AIと法律/制度/経済/社会
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
WonderSpace SEOウェビナー開催告知
24/11/15 4:30
WonderSpace(東京都港区)は、ChatGPTを活用したSEOコンテンツ作成の効率化に関するウェビナーを開催すると発表した。