top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA TensorRT-LLM giới thiệu tính năng điền trước chunked hiệu quả

Generatived

24/11/18 4:30

NVIDIA đã giới thiệu một tính năng mới trong TensorRT-LLM giúp tăng cường khả năng sử dụng GPU và hợp lý hóa quy trình triển khai cho các nhà phát triển. Tính năng này, được gọi là chunked prefill, giải quyết các thách thức về tính toán do các giai đoạn prefill và decode inference truyền thống đặt ra. Bằng cách chia các token đầu vào thành các phần nhỏ hơn, hệ thống có thể xử lý bộ đệm KV hiệu quả hơn, cho phép xử lý đồng thời nhiều yêu cầu và ngăn ngừa tình trạng tắc nghẽn trong giai đoạn prefill.

Phương pháp điền trước theo khối không chỉ tăng hiệu suất GPU mà còn cho phép các hệ thống quản lý ngữ cảnh dài hơn và mức độ đồng thời cao hơn mà không làm tăng nhu cầu bộ nhớ. Điều này đặc biệt có lợi vì nó tách biệt mức tiêu thụ bộ nhớ khỏi độ dài ngữ cảnh của các yêu cầu đến, cho phép xử lý độ dài ngữ cảnh lớn hơn hiệu quả hơn.

Hơn nữa, NVIDIA đã có những bước tiến trong việc đơn giản hóa quy trình tạo engine với việc triển khai tính năng định cỡ khối động. Tính năng này tự động đề xuất kích thước khối tối ưu dựa trên số liệu sử dụng GPU, loại bỏ nhu cầu các nhà phát triển phải chỉ định thủ công độ dài đầu vào tối đa. Do đó, kích thước bộ đệm kích hoạt hiện được xác định bởi kích thước khối được cấu hình, dẫn đến việc sử dụng bộ nhớ hiệu quả hơn trong quá trình thực thi.

Việc giới thiệu chunked prefill trong TensorRT-LLM đánh dấu sự cải thiện đáng kể về hiệu suất và khả năng sử dụng hệ thống. Bằng cách tạo điều kiện song song hóa tốt hơn giữa các giai đoạn prefill và giải mã và giảm thời gian hoàn thành truy vấn, NVIDIA đang nâng cao trải nghiệm của người dùng. Các nhà phát triển quan tâm đến việc tận dụng tính năng này có thể tìm thêm thông tin và bắt đầu thông qua tài liệu GitHub của NVIDIA, luôn cập nhật các bản cập nhật hiệu suất suy luận AI mới nhất.

Chia sẻ bài viết này:

Tin tức mới nhất
NVIDIA công bố mô hình học sâu dự đoán khí hậu nâng cao

NVIDIA công bố mô hình học sâu dự đoán khí hậu nâng cao

24/11/15 4:30

Dale Duran của Đại học Washington đã trình bày một mô hình học sâu cải tiến giúp tăng cường dự đoán khí hậu và thời tiết bằng cách tích hợp dữ liệu khí quyển và đại dương.

NVIDIA giới thiệu AI Cloud cho sự phát triển an toàn, riêng tư

NVIDIA giới thiệu AI Cloud cho sự phát triển an toàn, riêng tư

24/11/15 4:30

Một cách tiếp cận sáng tạo để phát triển AI đã được giới thiệu, với nền tảng đám mây và thị trường AI mới tập trung vào quyền riêng tư và kiểm soát dữ liệu người dùng.

NVIDIA ra mắt Sahabat-AI để thúc đẩy tăng trưởng AI ở Indonesia

NVIDIA ra mắt Sahabat-AI để thúc đẩy tăng trưởng AI ở Indonesia

24/11/15 4:30

Các nhà lãnh đạo công nghệ của Indonesia đã bắt tay vào nỗ lực đáng kể nhằm tăng cường năng lực AI của đất nước, tập trung vào phát triển AI có chủ quyền cho cộng đồng nói tiếng Indonesia đông đảo của đất nước.

Amazon mở rộng dòng sản phẩm Fire TV, giới thiệu dòng Omni

Amazon mở rộng dòng sản phẩm Fire TV, giới thiệu dòng Omni

24/11/15 4:30

Amazon vừa công bố việc mở rộng dòng sản phẩm Fire TV, giới thiệu dòng Omni Mini-LED mới và cập nhật dòng 4 Series, cũng như ra mắt dòng Soundbar Plus.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
NVIDIA công bố mô hình học sâu dự đoán khí hậu nâng cao

NVIDIA công bố mô hình học sâu dự đoán khí hậu nâng cao

24/11/15 4:30

Dale Duran của Đại học Washington đã trình bày một mô hình học sâu cải tiến giúp tăng cường dự đoán khí hậu và thời tiết bằng cách tích hợp dữ liệu khí quyển và đại dương.

NVIDIA giới thiệu AI Cloud cho sự phát triển an toàn, riêng tư

NVIDIA giới thiệu AI Cloud cho sự phát triển an toàn, riêng tư

24/11/15 4:30

Một cách tiếp cận sáng tạo để phát triển AI đã được giới thiệu, với nền tảng đám mây và thị trường AI mới tập trung vào quyền riêng tư và kiểm soát dữ liệu người dùng.

NVIDIA ra mắt Sahabat-AI để thúc đẩy tăng trưởng AI ở Indonesia

NVIDIA ra mắt Sahabat-AI để thúc đẩy tăng trưởng AI ở Indonesia

24/11/15 4:30

Các nhà lãnh đạo công nghệ của Indonesia đã bắt tay vào nỗ lực đáng kể nhằm tăng cường năng lực AI của đất nước, tập trung vào phát triển AI có chủ quyền cho cộng đồng nói tiếng Indonesia đông đảo của đất nước.

Amazon mở rộng dòng sản phẩm Fire TV, giới thiệu dòng Omni

Amazon mở rộng dòng sản phẩm Fire TV, giới thiệu dòng Omni

24/11/15 4:30

Amazon vừa công bố việc mở rộng dòng sản phẩm Fire TV, giới thiệu dòng Omni Mini-LED mới và cập nhật dòng 4 Series, cũng như ra mắt dòng Soundbar Plus.

bottom of page