Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Microsoft ra mắt mô hình AI Phi-4 cho các tác vụ đa phương thức

Generatived

25/2/27 4:30

Microsoft đã mở rộng các dịch vụ AI của mình bằng cách giới thiệu các bổ sung mới cho họ mô hình ngôn ngữ nhỏ gọn Phi: Phi-4-multimodal và Phi-4-mini. Mô hình Phi-4-multimodal được điều chỉnh để xử lý đồng thời các đầu vào giọng nói, hình ảnh và văn bản, cho phép tạo các ứng dụng nhận biết ngữ cảnh. Trong khi đó, Phi-4-mini được tối ưu hóa cho các tác vụ dựa trên văn bản, tự hào có độ chính xác cao và khả năng mở rộng trong một định dạng nhỏ gọn hơn. Cả hai mô hình hiện có thể truy cập được đối với các nhà phát triển thông qua Azure AI Foundry, HuggingFace và NVIDIA API Catalog, với mô hình sau cung cấp một nền tảng để thử nghiệm với Phi-4-multimodal.

Mô hình đa phương thức Phi-4 đại diện cho một bước tiến lớn trong AI, kết hợp xử lý giọng nói, thị giác và văn bản thành một kiến trúc thống nhất. Mô hình 5,6 tỷ tham số này sử dụng các kỹ thuật học tập đa phương thức để tạo điều kiện cho tương tác tự nhiên và phản hồi nhận biết ngữ cảnh trên nhiều loại đầu vào. Nó được thiết kế để đạt hiệu quả, cung cấp suy luận độ trễ thấp đồng thời giảm thiểu gánh nặng tính toán, khiến nó phù hợp để triển khai trên thiết bị.

Phi-4-multimodal của Microsoft hoạt động tốt trong việc xử lý cả đầu vào hình ảnh và âm thanh, vượt trội hơn các mô hình tiên tiến khác trong các chuẩn mực nhận dạng giọng nói và dịch thuật. Nó đã giành vị trí hàng đầu trên bảng xếp hạng Huggingface OpenASR và đã cho thấy kết quả đầy hứa hẹn trong việc tóm tắt giọng nói. Mặc dù có kích thước nhỏ, nó cũng duy trì hiệu suất cạnh tranh trong các tác vụ đa phương thức như OCR và lý luận trực quan.

Phi-4-mini, một mô hình có 3,8 tỷ tham số, vượt trội trong các tác vụ dựa trên văn bản, hỗ trợ các chuỗi dài và đạt được độ chính xác cao. Khả năng gọi hàm của nó cho phép nó tương tác với API và nguồn dữ liệu bên ngoài, khiến nó trở nên rất thiết thực. Cả Phi-4-mini và Phi-4-multimodal đều được thiết kế để sử dụng trong các môi trường có tài nguyên điện toán hạn chế, cung cấp các giải pháp tiết kiệm chi phí, nhạy cảm với độ trễ. Chúng cũng dễ dàng tùy chỉnh, khiến chúng phù hợp với nhiều ứng dụng phân tích trong các ngành công nghiệp khác nhau.

Nguồn: Tin tức mới nhất - Nguồn, Microsoft

Chia sẻ bài viết này:

Tin tức mới nhất

ADC Airty MEO Boost đã ra mắt

25/2/27 4:30

ADC (Minato-ku, Tokyo) và Airty (Thành phố Osaka, Tỉnh Osaka) đã ra mắt "MEO Boost", một dịch vụ giúp cải thiện thứ hạng tìm kiếm trên Google Maps.

đọc thêm

Giải đấu trường học miễn phí JC Nhật Bản

25/2/27 4:30

Japan JC (Hirakawacho, Chiyoda-ku) sẽ phụ trách một tiểu ban tại Hội nghị Trường học miễn phí toàn quốc lần thứ 15 của JDEC,

đọc thêm

ARISE và KDDI đề xuất các địa điểm tiềm năng để mở cửa hàng AI

25/2/27 4:30

Phân tích ARISE (Shibuya-ku, Tokyo) đã hỗ trợ phát triển Generative AI giúp gợi ý các địa điểm tiềm năng cho các cửa hàng mới của KDDI Retail Data Consulting (Chiyoda-ku, Tokyo).

đọc thêm

GFLOPS AskDona thông báo hỗ trợ cho Claude

25/2/27 4:30

GFLOPS (Shibuya-ku, Tokyo) thông báo rằng chức năng trò chuyện GPT của nền tảng sử dụng RAG doanh nghiệp "AskDona" hiện tương thích với "Claude 3.7 Sonnet" của Anthropic.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

ADC Airty MEO Boost đã ra mắt

25/2/27 4:30

ADC (Minato-ku, Tokyo) và Airty (Thành phố Osaka, Tỉnh Osaka) đã ra mắt "MEO Boost", một dịch vụ giúp cải thiện thứ hạng tìm kiếm trên Google Maps.

đọc thêm

Giải đấu trường học miễn phí JC Nhật Bản

25/2/27 4:30

Japan JC (Hirakawacho, Chiyoda-ku) sẽ phụ trách một tiểu ban tại Hội nghị Trường học miễn phí toàn quốc lần thứ 15 của JDEC,

đọc thêm

ARISE và KDDI đề xuất các địa điểm tiềm năng để mở cửa hàng AI

25/2/27 4:30

Phân tích ARISE (Shibuya-ku, Tokyo) đã hỗ trợ phát triển Generative AI giúp gợi ý các địa điểm tiềm năng cho các cửa hàng mới của KDDI Retail Data Consulting (Chiyoda-ku, Tokyo).

đọc thêm

GFLOPS AskDona thông báo hỗ trợ cho Claude

25/2/27 4:30

GFLOPS (Shibuya-ku, Tokyo) thông báo rằng chức năng trò chuyện GPT của nền tảng sử dụng RAG doanh nghiệp "AskDona" hiện tương thích với "Claude 3.7 Sonnet" của Anthropic.

đọc thêm