top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Google Cloud ra mắt mô hình AI Gemma 3

Generatived

4:30 13/3/25

Việc giới thiệu Gemma 3 đánh dấu một bước tiến lớn trong không gian AI, cung cấp cho các nhà phát triển một bộ mô hình ưu tiên cả tốc độ và tính di động. Các mô hình này được thiết kế để giúp tạo các ứng dụng AI tinh vi ở quy mô lớn dễ dàng hơn. Khi được tích hợp với Cloud Run, nó giúp các nhà phát triển triển khai khối lượng công việc không có máy chủ kết hợp các mô hình AI một cách dễ dàng, cải thiện hiệu quả và trải nghiệm của người dùng.

Gemma 3 nổi bật với hiệu suất vượt trội và tự hào có dấu chân bộ nhớ nhỏ hơn, lý tưởng cho khối lượng công việc suy luận tiết kiệm chi phí. Các đánh giá sơ bộ đã chỉ ra rằng nó vượt trội hơn các đối thủ cạnh tranh như Llama-405B, DeepSeek-V3 và o3-mini, thừa nhận tỷ lệ hiệu suất trên kích thước vượt trội của nó. Họ mô hình này cho phép các nhà phát triển tạo các ứng dụng có khả năng suy luận văn bản và hình ảnh nâng cao có khả năng phân tích hình ảnh, văn bản và video ngắn. Ngoài ra, cửa sổ ngữ cảnh lớn của Gemma 3 với 128k mã thông báo cho phép nó xử lý thông tin rộng hơn, chẳng hạn như toàn bộ tiểu thuyết, cho phép thực hiện các tác vụ AI phức tạp hơn.

Gemma 3 và Cloud Run hoạt động cùng nhau để mang lại trải nghiệm suy luận không máy chủ liền mạch. Cloud Run, nền tảng không máy chủ Google được quản lý hoàn toàn của Google Cloud, cho phép các nhà phát triển tận dụng thời gian chạy container mà không cần phải quản lý cơ sở hạ tầng. Thiết lập này không chỉ tối ưu hóa chi phí và hiệu suất bằng các mô hình không mở rộng quy mô trong thời gian không hoạt động và mở rộng quy mô động theo nhu cầu mà còn đảm bảo các nhà phát triển chỉ phải trả tiền cho các tài nguyên họ sử dụng. Với lợi ích bổ sung là tăng tốc GPU, dịch vụ Cloud Run có thể khởi chạy các phiên bản chỉ trong năm giây và cung cấp kết quả suy luận AI trong vòng chưa đầy 30 giây. Khả năng triển khai nhanh chóng này rất quan trọng đối với các ứng dụng yêu cầu trải nghiệm người dùng phản hồi. Ngoài ra, chi phí sử dụng GPU trên Cloud Run đã được giảm, giúp tối ưu hóa hơn nữa hiệu quả về chi phí khi triển khai các mô hình AI.

Chia sẻ bài viết này:

Tin tức mới nhất
DDN công bố IndustrySync Suite dành cho AI dành riêng cho ngành

DDN công bố IndustrySync Suite dành cho AI dành riêng cho ngành

4:30 18/3/25

DDN vừa công bố IndustrySync, một bộ giải pháp AI mới được thiết kế riêng cho các ngành dọc cụ thể như dịch vụ tài chính, khoa học đời sống và lái xe tự động.

ISG công bố khảo sát thị trường dịch vụ AI dựa trên tác nhân

ISG công bố khảo sát thị trường dịch vụ AI dựa trên tác nhân

4:30 18/3/25

Information Services Group (ISG) đã triển khai một nghiên cứu toàn diện về lĩnh vực dịch vụ AI đang phát triển mạnh mẽ.

Razer hợp tác với World Tech để xác thực game thủ

Razer hợp tác với World Tech để xác thực game thủ

4:30 18/3/25

Razer đã công bố quan hệ đối tác với World, một đơn vị tiên phong trong các giao thức nhận dạng kỹ thuật số, nhằm cải thiện trải nghiệm chơi game bằng cách đảm bảo người

Talkdesk ra mắt tác nhân AI để nâng cao khả năng tự phục vụ của khách hàng

Talkdesk ra mắt tác nhân AI để nâng cao khả năng tự phục vụ của khách hàng

4:30 18/3/25

Talkdesk đã giới thiệu công nghệ trải nghiệm khách hàng mới hỗ trợ AI giúp nâng cao khả năng tự phục vụ qua đàm thoại thông qua tự động hóa AI tinh vi.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
DDN công bố IndustrySync Suite dành cho AI dành riêng cho ngành

DDN công bố IndustrySync Suite dành cho AI dành riêng cho ngành

4:30 18/3/25

DDN vừa công bố IndustrySync, một bộ giải pháp AI mới được thiết kế riêng cho các ngành dọc cụ thể như dịch vụ tài chính, khoa học đời sống và lái xe tự động.

ISG công bố khảo sát thị trường dịch vụ AI dựa trên tác nhân

ISG công bố khảo sát thị trường dịch vụ AI dựa trên tác nhân

4:30 18/3/25

Information Services Group (ISG) đã triển khai một nghiên cứu toàn diện về lĩnh vực dịch vụ AI đang phát triển mạnh mẽ.

Razer hợp tác với World Tech để xác thực game thủ

Razer hợp tác với World Tech để xác thực game thủ

4:30 18/3/25

Razer đã công bố quan hệ đối tác với World, một đơn vị tiên phong trong các giao thức nhận dạng kỹ thuật số, nhằm cải thiện trải nghiệm chơi game bằng cách đảm bảo người

Talkdesk ra mắt tác nhân AI để nâng cao khả năng tự phục vụ của khách hàng

Talkdesk ra mắt tác nhân AI để nâng cao khả năng tự phục vụ của khách hàng

4:30 18/3/25

Talkdesk đã giới thiệu công nghệ trải nghiệm khách hàng mới hỗ trợ AI giúp nâng cao khả năng tự phục vụ qua đàm thoại thông qua tự động hóa AI tinh vi.

bottom of page