top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

マイクロソフト、マルチモーダルタスク向け Phi-4 AI モデルを発表

Generatived

25/2/27 4:30

Microsoft は、小型言語モデルの Phi ファミリーに新たに追加された Phi-4-multimodal と Phi-4-mini を導入し、AI の提供を拡大しました。Phi-4-multimodal モデルは、音声、視覚、テキスト入力を同時に処理するように調整されており、コンテキスト認識アプリケーションの作成を可能にします。一方、Phi-4-mini はテキストベースのタスクに最適化されており、よりコンパクトな形式で高い精度とスケーラビリティを誇ります。現在、両方のモデルは、 Azure AI Foundry、HuggingFace、および NVIDIA API Catalog を通じて開発者がアクセス可能であり、後者は Phi-4-multimodal の実験用プラットフォームを提供します。

Phi-4 マルチモーダル モデルは、音声、視覚、テキスト処理を 1 つの統合アーキテクチャに統合した、AI の大きな進歩を表しています。この 56 億のパラメータ モデルは、クロスモーダル学習技術を利用して、さまざまな入力タイプでの自然なインタラクションとコンテキスト認識応答を促進します。効率性を重視して設計されており、低遅延の推論を実現しながら計算負荷を最小限に抑え、デバイス上での展開に適したものにします。

Microsoft の Phi-4-multimodal は、視覚入力と音声入力の両方の処理において優れたパフォーマンスを発揮し、音声認識と翻訳のベンチマークで他の最先端モデルを凌駕しています。Huggingface OpenASR リーダーボードでトップの座を獲得し、音声要約において有望な成果を上げています。サイズは小さいものの、OCR や視覚的推論などのマルチモーダル タスクでも競争力のあるパフォーマンスを維持しています。

38 億のパラメータを持つモデルである Phi-4-mini は、テキストベースのタスクに優れ、長いシーケンスをサポートし、高い精度を実現します。関数呼び出し機能により、外部 API やデータ ソースとやり取りできるため、実用性が高まります。Phi-4-mini と Phi-4-multimodal はどちらも、コンピューティング リソースが限られている環境での使用を想定して設計されており、コスト効率が高く、遅延に敏感なソリューションを提供します。また、簡単にカスタマイズできるため、さまざまな業界のさまざまな分析アプリケーションに適しています。

この記事を共有:

最新のニュース
鉄建建設とMODE、高速道路リニューアル実験

鉄建建設とMODE、高速道路リニューアル実験

25/2/27 4:30

鉄建建設(東京都千代田区)とMODE(米国カリフォルニア州サンマテオ)は、高速道路リニューアルのための車線規制管理を効率化する実証実験を開始した。

NTTデータ先端技術 LLMアプリセキュリティ診断

NTTデータ先端技術 LLMアプリセキュリティ診断

25/2/27 4:30

NTTデータ先端技術(東京都千代田区)は、新たに「INTELLILINK AIセキュリティ診断 for LLMアプリケーション」の提供を開始すると発表した。

オープン病院EXPO大阪出展案内

オープン病院EXPO大阪出展案内

25/2/27 4:30

オープン(東京都港区)は、2025年3月5日から7日に「第11回 病院 EXPO【大阪】」に出展する。

ベストティーチャーAI英語アシスタント開始

ベストティーチャーAI英語アシスタント開始

25/2/27 4:30

ベストティーチャー(東京都渋谷区)は、LINE公式アカウントでAIを活用した「AI英語アシスタント機能」の提供を開始した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
鉄建建設とMODE、高速道路リニューアル実験

鉄建建設とMODE、高速道路リニューアル実験

25/2/27 4:30

鉄建建設(東京都千代田区)とMODE(米国カリフォルニア州サンマテオ)は、高速道路リニューアルのための車線規制管理を効率化する実証実験を開始した。

NTTデータ先端技術 LLMアプリセキュリティ診断

NTTデータ先端技術 LLMアプリセキュリティ診断

25/2/27 4:30

NTTデータ先端技術(東京都千代田区)は、新たに「INTELLILINK AIセキュリティ診断 for LLMアプリケーション」の提供を開始すると発表した。

オープン病院EXPO大阪出展案内

オープン病院EXPO大阪出展案内

25/2/27 4:30

オープン(東京都港区)は、2025年3月5日から7日に「第11回 病院 EXPO【大阪】」に出展する。

ベストティーチャーAI英語アシスタント開始

ベストティーチャーAI英語アシスタント開始

25/2/27 4:30

ベストティーチャー(東京都渋谷区)は、LINE公式アカウントでAIを活用した「AI英語アシスタント機能」の提供を開始した。

bottom of page