top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA công bố vi dịch vụ suy luận NIM cho AI

Generatived

24/7/11 6:29

Kiến trúc microservice đang thay đổi cuộc chơi về trí tuệ nhân tạo bằng cách cho phép phát triển ứng dụng linh hoạt và hiệu quả hơn. Cách tiếp cận này cho phép bạn tạo các ứng dụng được tạo thành từ các dịch vụ nhỏ, độc lập giao tiếp thông qua API. Điều này tạo điều kiện thuận lợi cho việc phát triển đồng thời, cải thiện chất lượng mã và đơn giản hóa việc giải quyết vấn đề bằng cách cho phép các nhà phát triển tập trung vào việc cải thiện các dịch vụ cụ thể.

Trong lĩnh vực Generative AI, microservice đã được chứng minh là có lợi thế đặc biệt nhờ khả năng mở rộng cũng như khả năng phát triển và tối ưu hóa độc lập các thành phần khác nhau của ứng dụng AI. Kiến trúc này hỗ trợ các nhu cầu tính toán khắt khe của các mô hình AI, đồng thời cho phép tích hợp và cập nhật liền mạch các công nghệ AI mới, giữ cho các ứng dụng luôn ở trạng thái tiên tiến mà không làm gián đoạn chức năng tổng thể.

NVIDIA đã giới thiệu dịch vụ vi mô suy luận NIM, cung cấp một vùng chứa được tối ưu hóa để triển khai các mô hình AI trên nhiều nền tảng khác nhau. Những vùng chứa này đơn giản hóa việc tích hợp các khả năng AI vào ứng dụng của bạn bằng cách cung cấp các mô hình được đào tạo trước và các thành phần thời gian chạy cần thiết. Cách tiếp cận của NIM cho phép các nhà phát triển tránh sự phức tạp của việc chuẩn bị dữ liệu và đào tạo mô hình, đồng thời tập trung vào phát triển ứng dụng với khả năng tối ưu hóa hiệu suất được đảm bảo và hỗ trợ cho các API tiêu chuẩn.

Đối với các nhà phát triển muốn xây dựng các ứng dụng AI tổng hợp cấp doanh nghiệp, máy trạm NVIDIA với NIM cung cấp các giải pháp giải quyết các mối lo ngại như quyền riêng tư, bảo mật và độ trễ dữ liệu. Mô hình Meta Llama 3 8B, hiện có dưới dạng NIM, cho phép các nhà phát triển chạy cục bộ các dự án AI nâng cao trên hệ thống RTX. Cách tiếp cận cục bộ này đối với các hệ thống tăng cường và tạo tìm kiếm (RAG) đảm bảo quyền riêng tư dữ liệu và phản hồi thời gian thực hiệu suất cao, điều này rất cần thiết cho các ứng dụng như chatbot và trợ lý ảo. Ngoài ra, thiết lập RAG lai của NVIDIA kết hợp tài nguyên cục bộ và đám mây để cung cấp cho các nhà phát triển khả năng phân bổ tài nguyên cân bằng và linh hoạt cho các ứng dụng AI của họ. nước xốt:

Chia sẻ bài viết này:

Tin tức mới nhất
NTT DATA công bố Báo cáo áp dụng GenAI toàn cầu năm 2025

NTT DATA công bố Báo cáo áp dụng GenAI toàn cầu năm 2025

24/11/15 4:30

NTT DATA vừa công bố kết quả từ một cuộc khảo sát toàn diện cho thấy các nhà lãnh đạo đang chuyển trọng tâm từ giai đoạn thăm dò sang triển khai chiến lược Generative AI (GenAI) để cải thiện hiệu suất kinh doanh và văn hóa tổ chức.

Quỹ Châu Á công bố Hội thảo phát triển sự nghiệp STEM cho phụ nữ

Quỹ Châu Á công bố Hội thảo phát triển sự nghiệp STEM cho phụ nữ

24/11/15 4:30

Vào ngày 21 tháng 11, một sự kiện trực tuyến mang tên " STEM ConnectHER: Hội thảo Generative AI x Bản thân x Sự nghiệp & STEM x Gender CAFE" sẽ được tổ chức

Accenture mở trung tâm AI tiên tiến tại Kyoto

Accenture mở trung tâm AI tiên tiến tại Kyoto

24/11/15 4:30

Accenture vừa công bố Trung tâm AI tiên tiến Kyoto, một cơ sở được thiết kế để giúp khách hàng chuyển đổi doanh nghiệp của mình bằng các kỹ thuật AI tiên tiến, bao gồm cả AI tạo sinh.

Khảo sát của Revenue Intelligence tiết lộ sự khác biệt trong đánh giá AI

Khảo sát của Revenue Intelligence tiết lộ sự khác biệt trong đánh giá AI

24/11/15 4:30

Một cuộc khảo sát gần đây của một công ty tình báo doanh thu hàng đầu đã tiết lộ sự khác biệt trong quan điểm giữa các CIO và lãnh đạo CNTT khi đánh giá sự thành công của các dự án AI.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
NTT DATA công bố Báo cáo áp dụng GenAI toàn cầu năm 2025

NTT DATA công bố Báo cáo áp dụng GenAI toàn cầu năm 2025

24/11/15 4:30

NTT DATA vừa công bố kết quả từ một cuộc khảo sát toàn diện cho thấy các nhà lãnh đạo đang chuyển trọng tâm từ giai đoạn thăm dò sang triển khai chiến lược Generative AI (GenAI) để cải thiện hiệu suất kinh doanh và văn hóa tổ chức.

Quỹ Châu Á công bố Hội thảo phát triển sự nghiệp STEM cho phụ nữ

Quỹ Châu Á công bố Hội thảo phát triển sự nghiệp STEM cho phụ nữ

24/11/15 4:30

Vào ngày 21 tháng 11, một sự kiện trực tuyến mang tên " STEM ConnectHER: Hội thảo Generative AI x Bản thân x Sự nghiệp & STEM x Gender CAFE" sẽ được tổ chức

Accenture mở trung tâm AI tiên tiến tại Kyoto

Accenture mở trung tâm AI tiên tiến tại Kyoto

24/11/15 4:30

Accenture vừa công bố Trung tâm AI tiên tiến Kyoto, một cơ sở được thiết kế để giúp khách hàng chuyển đổi doanh nghiệp của mình bằng các kỹ thuật AI tiên tiến, bao gồm cả AI tạo sinh.

Khảo sát của Revenue Intelligence tiết lộ sự khác biệt trong đánh giá AI

Khảo sát của Revenue Intelligence tiết lộ sự khác biệt trong đánh giá AI

24/11/15 4:30

Một cuộc khảo sát gần đây của một công ty tình báo doanh thu hàng đầu đã tiết lộ sự khác biệt trong quan điểm giữa các CIO và lãnh đạo CNTT khi đánh giá sự thành công của các dự án AI.

bottom of page