top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

マイクロソフト、マルチモーダルタスク向け Phi-4 AI モデルを発表

Generatived

25/2/27 4:30

Microsoft は、小型言語モデルの Phi ファミリーに新たに追加された Phi-4-multimodal と Phi-4-mini を導入し、AI の提供を拡大しました。Phi-4-multimodal モデルは、音声、視覚、テキスト入力を同時に処理するように調整されており、コンテキスト認識アプリケーションの作成を可能にします。一方、Phi-4-mini はテキストベースのタスクに最適化されており、よりコンパクトな形式で高い精度とスケーラビリティを誇ります。現在、両方のモデルは、 Azure AI Foundry、HuggingFace、および NVIDIA API Catalog を通じて開発者がアクセス可能であり、後者は Phi-4-multimodal の実験用プラットフォームを提供します。

Phi-4 マルチモーダル モデルは、音声、視覚、テキスト処理を 1 つの統合アーキテクチャに統合した、AI の大きな進歩を表しています。この 56 億のパラメータ モデルは、クロスモーダル学習技術を利用して、さまざまな入力タイプでの自然なインタラクションとコンテキスト認識応答を促進します。効率性を重視して設計されており、低遅延の推論を実現しながら計算負荷を最小限に抑え、デバイス上での展開に適したものにします。

Microsoft の Phi-4-multimodal は、視覚入力と音声入力の両方の処理において優れたパフォーマンスを発揮し、音声認識と翻訳のベンチマークで他の最先端モデルを凌駕しています。Huggingface OpenASR リーダーボードでトップの座を獲得し、音声要約において有望な成果を上げています。サイズは小さいものの、OCR や視覚的推論などのマルチモーダル タスクでも競争力のあるパフォーマンスを維持しています。

38 億のパラメータを持つモデルである Phi-4-mini は、テキストベースのタスクに優れ、長いシーケンスをサポートし、高い精度を実現します。関数呼び出し機能により、外部 API やデータ ソースとやり取りできるため、実用性が高まります。Phi-4-mini と Phi-4-multimodal はどちらも、コンピューティング リソースが限られている環境での使用を想定して設計されており、コスト効率が高く、遅延に敏感なソリューションを提供します。また、簡単にカスタマイズできるため、さまざまな業界のさまざまな分析アプリケーションに適しています。

この記事を共有:

最新のニュース
Meta for Education が没入型学習サービスを開始

Meta for Education が没入型学習サービスを開始

25/2/27 4:30

Meta for Education は、Meta Quest デバイスと Meta Horizon マネージド サービスを通じて学習に新たな次元を提供する、複合現実および仮想現実教育サービスを正式に一般向けに開始しました。

マイクロソフト、マルチモーダルタスク向け Phi-4 AI モデルを発表

マイクロソフト、マルチモーダルタスク向け Phi-4 AI モデルを発表

25/2/27 4:30

Microsoft は、小型言語モデルの Phi ファミリーに新たに追加された Phi-4-multimodal と Phi-4-mini を導入し、AI の提供を拡大しました。

Vision Tech、強化されたビデオ言語モデルを発表

Vision Tech、強化されたビデオ言語モデルを発表

25/2/27 4:30

視覚言語モデル (VLM) は、言語モデルに視覚的理解を初めて導入した 2020 年の誕生以来、大きな進歩を遂げてきました。

カスタマークラウドAI無料相談開始

カスタマークラウドAI無料相談開始

25/2/26 4:30

カスタマークラウド(東京都新宿区)は、企業のAI戦略に関する初回無料相談を開始すると発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
Meta for Education が没入型学習サービスを開始

Meta for Education が没入型学習サービスを開始

25/2/27 4:30

Meta for Education は、Meta Quest デバイスと Meta Horizon マネージド サービスを通じて学習に新たな次元を提供する、複合現実および仮想現実教育サービスを正式に一般向けに開始しました。

マイクロソフト、マルチモーダルタスク向け Phi-4 AI モデルを発表

マイクロソフト、マルチモーダルタスク向け Phi-4 AI モデルを発表

25/2/27 4:30

Microsoft は、小型言語モデルの Phi ファミリーに新たに追加された Phi-4-multimodal と Phi-4-mini を導入し、AI の提供を拡大しました。

Vision Tech、強化されたビデオ言語モデルを発表

Vision Tech、強化されたビデオ言語モデルを発表

25/2/27 4:30

視覚言語モデル (VLM) は、言語モデルに視覚的理解を初めて導入した 2020 年の誕生以来、大きな進歩を遂げてきました。

カスタマークラウドAI無料相談開始

カスタマークラウドAI無料相談開始

25/2/26 4:30

カスタマークラウド(東京都新宿区)は、企業のAI戦略に関する初回無料相談を開始すると発表した。

bottom of page