top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Microsoft ra mắt mô hình AI Phi-4 cho các tác vụ đa phương thức

Generatived

25/2/27 4:30

Microsoft đã mở rộng các dịch vụ AI của mình bằng cách giới thiệu các bổ sung mới cho họ mô hình ngôn ngữ nhỏ gọn Phi: Phi-4-multimodal và Phi-4-mini. Mô hình Phi-4-multimodal được điều chỉnh để xử lý đồng thời các đầu vào giọng nói, hình ảnh và văn bản, cho phép tạo các ứng dụng nhận biết ngữ cảnh. Trong khi đó, Phi-4-mini được tối ưu hóa cho các tác vụ dựa trên văn bản, tự hào có độ chính xác cao và khả năng mở rộng trong một định dạng nhỏ gọn hơn. Cả hai mô hình hiện có thể truy cập được đối với các nhà phát triển thông qua Azure AI Foundry, HuggingFace và NVIDIA API Catalog, với mô hình sau cung cấp một nền tảng để thử nghiệm với Phi-4-multimodal.

Mô hình đa phương thức Phi-4 đại diện cho một bước tiến lớn trong AI, kết hợp xử lý giọng nói, thị giác và văn bản thành một kiến ​​trúc thống nhất. Mô hình 5,6 tỷ tham số này sử dụng các kỹ thuật học tập đa phương thức để tạo điều kiện cho tương tác tự nhiên và phản hồi nhận biết ngữ cảnh trên nhiều loại đầu vào. Nó được thiết kế để đạt hiệu quả, cung cấp suy luận độ trễ thấp đồng thời giảm thiểu gánh nặng tính toán, khiến nó phù hợp để triển khai trên thiết bị.

Phi-4-multimodal của Microsoft hoạt động tốt trong việc xử lý cả đầu vào hình ảnh và âm thanh, vượt trội hơn các mô hình tiên tiến khác trong các chuẩn mực nhận dạng giọng nói và dịch thuật. Nó đã giành vị trí hàng đầu trên bảng xếp hạng Huggingface OpenASR và đã cho thấy kết quả đầy hứa hẹn trong việc tóm tắt giọng nói. Mặc dù có kích thước nhỏ, nó cũng duy trì hiệu suất cạnh tranh trong các tác vụ đa phương thức như OCR và lý luận trực quan.

Phi-4-mini, một mô hình có 3,8 tỷ tham số, vượt trội trong các tác vụ dựa trên văn bản, hỗ trợ các chuỗi dài và đạt được độ chính xác cao. Khả năng gọi hàm của nó cho phép nó tương tác với API và nguồn dữ liệu bên ngoài, khiến nó trở nên rất thiết thực. Cả Phi-4-mini và Phi-4-multimodal đều được thiết kế để sử dụng trong các môi trường có tài nguyên điện toán hạn chế, cung cấp các giải pháp tiết kiệm chi phí, nhạy cảm với độ trễ. Chúng cũng dễ dàng tùy chỉnh, khiến chúng phù hợp với nhiều ứng dụng phân tích trong các ngành công nghiệp khác nhau.

Chia sẻ bài viết này:

Tin tức mới nhất
Tekken và MODE tiến hành thí nghiệm cải tạo đường cao tốc

Tekken và MODE tiến hành thí nghiệm cải tạo đường cao tốc

25/2/27 4:30

Tekken Construction (Chiyoda-ku, Tokyo) và MODE (San Mateo, California, Hoa Kỳ) đã bắt đầu một thí nghiệm trình diễn nhằm cải thiện hiệu quả quản lý hạn chế làn đường để đổi mới đường cao tốc.

Đánh giá bảo mật ứng dụng LLM công nghệ tiên tiến của NTT DATA

Đánh giá bảo mật ứng dụng LLM công nghệ tiên tiến của NTT DATA

25/2/27 4:30

NTT DATA Advanced Technologies (Chiyoda-ku, Tokyo) đã thông báo rằng họ sẽ bắt đầu cung cấp "Chẩn đoán bảo mật AI INTELLILINK cho ứng dụng LLM" mới.

Thông tin triển lãm Open Hospital EXPO Osaka

Thông tin triển lãm Open Hospital EXPO Osaka

25/2/27 4:30

Open (Minato-ku, Tokyo) sẽ trưng bày tại Triển lãm Bệnh viện lần thứ 11 [Osaka] từ ngày 5 đến ngày 7 tháng 3 năm 2025.

Trợ lý tiếng Anh AI tốt nhất đã ra mắt

Trợ lý tiếng Anh AI tốt nhất đã ra mắt

25/2/27 4:30

Best Teacher (Shibuya-ku, Tokyo) đã bắt đầu cung cấp "chức năng trợ lý tiếng Anh AI" dựa trên AI trên tài khoản LINE chính thức của mình.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Tekken và MODE tiến hành thí nghiệm cải tạo đường cao tốc

Tekken và MODE tiến hành thí nghiệm cải tạo đường cao tốc

25/2/27 4:30

Tekken Construction (Chiyoda-ku, Tokyo) và MODE (San Mateo, California, Hoa Kỳ) đã bắt đầu một thí nghiệm trình diễn nhằm cải thiện hiệu quả quản lý hạn chế làn đường để đổi mới đường cao tốc.

Đánh giá bảo mật ứng dụng LLM công nghệ tiên tiến của NTT DATA

Đánh giá bảo mật ứng dụng LLM công nghệ tiên tiến của NTT DATA

25/2/27 4:30

NTT DATA Advanced Technologies (Chiyoda-ku, Tokyo) đã thông báo rằng họ sẽ bắt đầu cung cấp "Chẩn đoán bảo mật AI INTELLILINK cho ứng dụng LLM" mới.

Thông tin triển lãm Open Hospital EXPO Osaka

Thông tin triển lãm Open Hospital EXPO Osaka

25/2/27 4:30

Open (Minato-ku, Tokyo) sẽ trưng bày tại Triển lãm Bệnh viện lần thứ 11 [Osaka] từ ngày 5 đến ngày 7 tháng 3 năm 2025.

Trợ lý tiếng Anh AI tốt nhất đã ra mắt

Trợ lý tiếng Anh AI tốt nhất đã ra mắt

25/2/27 4:30

Best Teacher (Shibuya-ku, Tokyo) đã bắt đầu cung cấp "chức năng trợ lý tiếng Anh AI" dựa trên AI trên tài khoản LINE chính thức của mình.

bottom of page