Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
.webp)
Google AI Edge thông báo phát hành Gemma 3 1B
Generatived
4:30 13/3/25
Gemma 3 1B là sự bổ sung mới nhất cho gia đình Gemma của các mô hình trọng số mở, được thiết kế để tăng cường phân phối các mô hình ngôn ngữ nhỏ (SLM) trên các nền tảng di động và web. Mô hình được tối ưu hóa để tải xuống nhanh và xử lý nhanh, giúp người dùng tập trung khi sử dụng các ứng dụng khác nhau trên các thiết bị khác nhau.
Với kích thước nhỏ gọn 529MB, Gemma 3 1B tự hào có tốc độ xử lý ấn tượng với suy luận LLM trên Google AI Edge có khả năng xử lý một trang nội dung trong vòng chưa đầy một giây. Mô hình này cho phép các ứng dụng tận dụng ngôn ngữ tự nhiên để thúc đẩy tương tác của người dùng và tạo nội dung dựa trên dữ liệu trong ứng dụng, cung cấp cho các nhà phát triển các tùy chọn tùy chỉnh và tinh chỉnh.
Mô hình Gemma 3 1B không chỉ hiệu quả mà còn linh hoạt, hỗ trợ nhiều trường hợp sử dụng khác nhau từ chú thích dữ liệu đến đối thoại trong trò chơi, trả lời thông minh và Hỏi & Đáp về tài liệu. Nó chạy hoàn toàn trên thiết bị, mang lại những lợi ích như khả dụng ngoại tuyến, giảm chi phí, latency thấp hơn và tăng cường quyền riêng tư cho dữ liệu nhạy cảm.
Để bắt đầu với Gemma 3 1B, các nhà phát triển tải xuống ứng dụng demo từ GitHub, chọn đơn vị xử lý mong muốn và tải xuống mô hình từ Hugging Face . Mô hình được hỗ trợ bởi API suy luận LLM của Google AI Edge để xử lý hiệu quả trong thiết bị và có thể được tùy chỉnh bằng các phiên bản tinh chỉnh do cộng đồng tạo ra. Hiệu suất mô hình là kết quả của các quá trình tối ưu hóa mở rộng, bao gồm đào tạo nhận biết lượng tử hóa và cải thiện thời gian tải, và được đảm bảo chạy hiệu quả trên cả CPU và GPU.
Chia sẻ bài viết này:
Tin tức mới nhất
DDN công bố IndustrySync Suite dành cho AI dành riêng cho ngành
4:30 18/3/25
DDN vừa công bố IndustrySync, một bộ giải pháp AI mới được thiết kế riêng cho các ngành dọc cụ thể như dịch vụ tài chính, khoa học đời sống và lái xe tự động.
ISG công bố khảo sát thị trường dịch vụ AI dựa trên tác nhân
4:30 18/3/25
Information Services Group (ISG) đã triển khai một nghiên cứu toàn diện về lĩnh vực dịch vụ AI đang phát triển mạnh mẽ.
Razer hợp tác với World Tech để xác thực game thủ
4:30 18/3/25
Razer đã công bố quan hệ đối tác với World, một đơn vị tiên phong trong các giao thức nhận dạng kỹ thuật số, nhằm cải thiện trải nghiệm chơi game bằng cách đảm bảo người
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
DDN công bố IndustrySync Suite dành cho AI dành riêng cho ngành
4:30 18/3/25
DDN vừa công bố IndustrySync, một bộ giải pháp AI mới được thiết kế riêng cho các ngành dọc cụ thể như dịch vụ tài chính, khoa học đời sống và lái xe tự động.
ISG công bố khảo sát thị trường dịch vụ AI dựa trên tác nhân
4:30 18/3/25
Information Services Group (ISG) đã triển khai một nghiên cứu toàn diện về lĩnh vực dịch vụ AI đang phát triển mạnh mẽ.
Razer hợp tác với World Tech để xác thực game thủ
4:30 18/3/25
Razer đã công bố quan hệ đối tác với World, một đơn vị tiên phong trong các giao thức nhận dạng kỹ thuật số, nhằm cải thiện trải nghiệm chơi game bằng cách đảm bảo người