Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA giới thiệu Dynamo để tăng cường suy luận AI

Generatived

4:30 19/3/25

Tại GTC 2025, NVIDIA đã công bố NVIDIA Dynamo, một khuôn khổ phục vụ suy luận nguồn mở mới được thiết kế để thúc đẩy việc triển khai các mô hình suy luận và AI tạo sinh trong các môi trường phân tán quy mô lớn. Khuôn khổ này làm tăng đáng kể số lượng yêu cầu được xử lý, đạt được cải tiến lên đến 30 lần khi sử dụng mô hình DeepSeek-R1 trên NVIDIA Blackwell. NVIDIA Dynamo tích hợp với nhiều công cụ nguồn mở, bao gồm PyTorch và NVIDIA TensorRT-LLM, để giúp các nhà phát triển và nhà nghiên cứu đẩy nhanh các ứng dụng AI.

Khung này giới thiệu một số cải tiến nhằm tối ưu hóa hiệu suất và hiệu quả của GPU, bao gồm việc tách biệt các giai đoạn suy luận trước khi điền và giải mã, lập lịch GPU động để đáp ứng nhu cầu thay đổi và định tuyến yêu cầu thông minh giúp giảm nhu cầu tính toán lại bộ đệm KV. Ngoài ra, NVIDIA Dynamo cải thiện tốc độ truyền dữ liệu giữa các GPU và cho phép dỡ bộ đệm KV để cải thiện thông lượng hệ thống. Hiện có trên GitHub, NVIDIA Dynamo cũng cung cấp các khả năng cấp doanh nghiệp thông qua NVIDIA AI Enterprise cho các tổ chức yêu cầu hỗ trợ và tính ổn định nâng cao.

Kiến trúc của NVIDIA Dynamo được thiết kế để cho phép mở rộng hiệu quả về mặt chi phí các mô hình AI tạo sinh, từ các thiết lập GPU đơn lẻ đến các hệ thống có hàng nghìn GPU. Các thành phần chính của khung làm việc cùng nhau để quản lý hiệu quả các tài nguyên và đảm bảo thông lượng cao và latency thấp trong môi trường phân tán. NVIDIA Dynamo giải quyết các thách thức của việc triển khai các mô hình AI phức tạp trong sản xuất bằng cách tách rời các giai đoạn suy luận khác nhau và phân bổ động các tài nguyên GPU.

Việc phát hành NVIDIA Dynamo đánh dấu một bước tiến lớn trong các dịch vụ suy luận AI, dựa trên di sản của máy chủ suy luận NVIDIA Triton. Với thiết kế mô-đun và khả năng suy luận phân tán, NVIDIA Dynamo cung cấp khả năng mở rộng và hiệu suất được cải thiện trong các triển khai đa nút và sẵn sàng hỗ trợ thế hệ ứng dụng AI tiếp theo. Các nhà phát triển và nhà nghiên cứu AI được khuyến khích tham gia cộng đồng NVIDIA Dynamo trên GitHub và đóng góp vào quá trình phát triển liên tục.

Nguồn: Blog nhà phát triển NVIDIA

Chia sẻ bài viết này:

Tin tức mới nhất

NVIDIA NeMo Microservices Enhance AI

4:30 19/3/25

NVIDIA đã giới thiệu dịch vụ vi mô NeMo, một giải pháp toàn diện nhằm mục đích giúp các tác nhân AI thích ứng và hiệu quả hơn.

đọc thêm

Đánh giá hiệu suất AI với NVIDIA DGX Cloud Benchmark

4:30 19/3/25

NVIDIA đã giới thiệu DGX Cloud Benchmarking, một bộ công cụ toàn diện được thiết kế để đánh giá hiệu suất của khối lượng công việc AI trên nhiều nền tảng.

đọc thêm

NVIDIA và QuEra công bố bộ giải mã lượng tử AI mới

4:30 19/3/25

NVIDIA đã công bố một bước tiến lớn trong điện toán lượng tử tại GTC 25, tiết lộ bộ giải mã AI mới được phát triển với sự hợp tác của QuEra.

đọc thêm

NVIDIA NeMo Curator ra mắt đường ống video tăng tốc GPU mới

4:30 19/3/25

Nhóm NVIDIA NeMo Curator đã giới thiệu một đường truyền phát trực tuyến tăng tốc bằng GPU mới để quản lý video, được thiết kế để xử lý lượng dữ liệu khổng lồ do các ứng dụng AI tạo ra.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

NVIDIA NeMo Microservices Enhance AI

4:30 19/3/25

NVIDIA đã giới thiệu dịch vụ vi mô NeMo, một giải pháp toàn diện nhằm mục đích giúp các tác nhân AI thích ứng và hiệu quả hơn.

đọc thêm

Đánh giá hiệu suất AI với NVIDIA DGX Cloud Benchmark

4:30 19/3/25

NVIDIA đã giới thiệu DGX Cloud Benchmarking, một bộ công cụ toàn diện được thiết kế để đánh giá hiệu suất của khối lượng công việc AI trên nhiều nền tảng.

đọc thêm

NVIDIA và QuEra công bố bộ giải mã lượng tử AI mới

4:30 19/3/25

NVIDIA đã công bố một bước tiến lớn trong điện toán lượng tử tại GTC 25, tiết lộ bộ giải mã AI mới được phát triển với sự hợp tác của QuEra.

đọc thêm

NVIDIA NeMo Curator ra mắt đường ống video tăng tốc GPU mới

4:30 19/3/25

Nhóm NVIDIA NeMo Curator đã giới thiệu một đường truyền phát trực tuyến tăng tốc bằng GPU mới để quản lý video, được thiết kế để xử lý lượng dữ liệu khổng lồ do các ứng dụng AI tạo ra.

đọc thêm