Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
%20(1).webp)
Microsoft ra mắt mô hình AI Phi-4 cho các tác vụ đa phương thức
Generatived
25/2/27 4:30
Microsoft đã mở rộng các dịch vụ AI của mình bằng cách giới thiệu các bổ sung mới cho họ mô hình ngôn ngữ nhỏ gọn Phi: Phi-4-multimodal và Phi-4-mini. Mô hình Phi-4-multimodal được điều chỉnh để xử lý đồng thời các đầu vào giọng nói, hình ảnh và văn bản, cho phép tạo các ứng dụng nhận biết ngữ cảnh. Trong khi đó, Phi-4-mini được tối ưu hóa cho các tác vụ dựa trên văn bản, tự hào có độ chính xác cao và khả năng mở rộng trong một định dạng nhỏ gọn hơn. Cả hai mô hình hiện có thể truy cập được đối với các nhà phát triển thông qua Azure AI Foundry, HuggingFace và NVIDIA API Catalog, với mô hình sau cung cấp một nền tảng để thử nghiệm với Phi-4-multimodal.
Mô hình đa phương thức Phi-4 đại diện cho một bước tiến lớn trong AI, kết hợp xử lý giọng nói, thị giác và văn bản thành một kiến trúc thống nhất. Mô hình 5,6 tỷ tham số này sử dụng các kỹ thuật học tập đa phương thức để tạo điều kiện cho tương tác tự nhiên và phản hồi nhận biết ngữ cảnh trên nhiều loại đầu vào. Nó được thiết kế để đạt hiệu quả, cung cấp suy luận độ trễ thấp đồng thời giảm thiểu gánh nặng tính toán, khiến nó phù hợp để triển khai trên thiết bị.
Phi-4-multimodal của Microsoft hoạt động tốt trong việc xử lý cả đầu vào hình ảnh và âm thanh, vượt trội hơn các mô hình tiên tiến khác trong các chuẩn mực nhận dạng giọng nói và dịch thuật. Nó đã giành vị trí hàng đầu trên bảng xếp hạng Huggingface OpenASR và đã cho thấy kết quả đầy hứa hẹn trong việc tóm tắt giọng nói. Mặc dù có kích thước nhỏ, nó cũng duy trì hiệu suất cạnh tranh trong các tác vụ đa phương thức như OCR và lý luận trực quan.
Phi-4-mini, một mô hình có 3,8 tỷ tham số, vượt trội trong các tác vụ dựa trên văn bản, hỗ trợ các chuỗi dài và đạt được độ chính xác cao. Khả năng gọi hàm của nó cho phép nó tương tác với API và nguồn dữ liệu bên ngoài, khiến nó trở nên rất thiết thực. Cả Phi-4-mini và Phi-4-multimodal đều được thiết kế để sử dụng trong các môi trường có tài nguyên điện toán hạn chế, cung cấp các giải pháp tiết kiệm chi phí, nhạy cảm với độ trễ. Chúng cũng dễ dàng tùy chỉnh, khiến chúng phù hợp với nhiều ứng dụng phân tích trong các ngành công nghiệp khác nhau.
Chia sẻ bài viết này:
Tin tức mới nhất
ADC Airty MEO Boost đã ra mắt
25/2/27 4:30
ADC (Minato-ku, Tokyo) và Airty (Thành phố Osaka, Tỉnh Osaka) đã ra mắt "MEO Boost", một dịch vụ giúp cải thiện thứ hạng tìm kiếm trên Google Maps.
Giải đấu trường học miễn phí JC Nhật Bản
25/2/27 4:30
Japan JC (Hirakawacho, Chiyoda-ku) sẽ phụ trách một tiểu ban tại Hội nghị Trường học miễn phí toàn quốc lần thứ 15 của JDEC,
ARISE và KDDI đề xuất các địa điểm tiềm năng để mở cửa hàng AI
25/2/27 4:30
Phân tích ARISE (Shibuya-ku, Tokyo) đã hỗ trợ phát triển Generative AI giúp gợi ý các địa điểm tiềm năng cho các cửa hàng mới của KDDI Retail Data Consulting (Chiyoda-ku, Tokyo).
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
ADC Airty MEO Boost đã ra mắt
25/2/27 4:30
ADC (Minato-ku, Tokyo) và Airty (Thành phố Osaka, Tỉnh Osaka) đã ra mắt "MEO Boost", một dịch vụ giúp cải thiện thứ hạng tìm kiếm trên Google Maps.
Giải đấu trường học miễn phí JC Nhật Bản
25/2/27 4:30
Japan JC (Hirakawacho, Chiyoda-ku) sẽ phụ trách một tiểu ban tại Hội nghị Trường học miễn phí toàn quốc lần thứ 15 của JDEC,
ARISE và KDDI đề xuất các địa điểm tiềm năng để mở cửa hàng AI
25/2/27 4:30
Phân tích ARISE (Shibuya-ku, Tokyo) đã hỗ trợ phát triển Generative AI giúp gợi ý các địa điểm tiềm năng cho các cửa hàng mới của KDDI Retail Data Consulting (Chiyoda-ku, Tokyo).