Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

NVIDIA TensorRT-LLM giới thiệu tính năng điền trước chunked hiệu quả

Generatived

24/11/18 4:30

NVIDIA đã giới thiệu một tính năng mới trong TensorRT-LLM giúp tăng cường khả năng sử dụng GPU và hợp lý hóa quy trình triển khai cho các nhà phát triển. Tính năng này, được gọi là chunked prefill, giải quyết các thách thức về tính toán do các giai đoạn prefill và decode inference truyền thống đặt ra. Bằng cách chia các token đầu vào thành các phần nhỏ hơn, hệ thống có thể xử lý bộ đệm KV hiệu quả hơn, cho phép xử lý đồng thời nhiều yêu cầu và ngăn ngừa tình trạng tắc nghẽn trong giai đoạn prefill.

Phương pháp điền trước theo khối không chỉ tăng hiệu suất GPU mà còn cho phép các hệ thống quản lý ngữ cảnh dài hơn và mức độ đồng thời cao hơn mà không làm tăng nhu cầu bộ nhớ. Điều này đặc biệt có lợi vì nó tách biệt mức tiêu thụ bộ nhớ khỏi độ dài ngữ cảnh của các yêu cầu đến, cho phép xử lý độ dài ngữ cảnh lớn hơn hiệu quả hơn.

Hơn nữa, NVIDIA đã có những bước tiến trong việc đơn giản hóa quy trình tạo engine với việc triển khai tính năng định cỡ khối động. Tính năng này tự động đề xuất kích thước khối tối ưu dựa trên số liệu sử dụng GPU, loại bỏ nhu cầu các nhà phát triển phải chỉ định thủ công độ dài đầu vào tối đa. Do đó, kích thước bộ đệm kích hoạt hiện được xác định bởi kích thước khối được cấu hình, dẫn đến việc sử dụng bộ nhớ hiệu quả hơn trong quá trình thực thi.

Việc giới thiệu chunked prefill trong TensorRT-LLM đánh dấu sự cải thiện đáng kể về hiệu suất và khả năng sử dụng hệ thống. Bằng cách tạo điều kiện song song hóa tốt hơn giữa các giai đoạn prefill và giải mã và giảm thời gian hoàn thành truy vấn, NVIDIA đang nâng cao trải nghiệm của người dùng. Các nhà phát triển quan tâm đến việc tận dụng tính năng này có thể tìm thêm thông tin và bắt đầu thông qua tài liệu GitHub của NVIDIA, luôn cập nhật các bản cập nhật hiệu suất suy luận AI mới nhất.

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

ChapsVision mua lại Sinequa để mở rộng xử lý dữ liệu AI

24/11/19 4:30

ChapsVision, một công ty xử lý dữ liệu hàng đầu hỗ trợ bởi AI, gần đây đã mở rộng danh mục đầu tư của mình bằng cách mua lại Sinequa, một công ty công nghệ tìm kiếm doanh nghiệp hỗ trợ bởi AI nổi tiếng.

đọc thêm

Dell Tech tăng cường cơ sở hạ tầng AI với việc ra mắt máy chủ PowerEdge

24/11/19 4:30

Dell Technologies đã công bố những cải tiến đối với cơ sở hạ tầng AI của mình, bao gồm máy chủ Dell PowerEdge XE mới và các bản cập nhật cho Dell Data Lakehouse.

đọc thêm

CommBox bảo đảm 15 triệu đô la để mở rộng trải nghiệm khách hàng AI

24/11/19 4:30

CommBox, nhà cung cấp hàng đầu các giải pháp trải nghiệm khách hàng hỗ trợ bởi AI, gần đây đã nhận được khoản đầu tư 15 triệu đô la từ PSG Equity.

đọc thêm

FiscalNote hợp tác với ProRata.ai để phân phối nội dung

24/11/19 4:30

FiscalNote đã ký thỏa thuận cấp phép với công ty tìm kiếm AI ProRata.ai để cung cấp nội dung chính sách và chính trị được tuyển chọn từ nền tảng RollCall.com của công ty.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

ChapsVision mua lại Sinequa để mở rộng xử lý dữ liệu AI

24/11/19 4:30

ChapsVision, một công ty xử lý dữ liệu hàng đầu hỗ trợ bởi AI, gần đây đã mở rộng danh mục đầu tư của mình bằng cách mua lại Sinequa, một công ty công nghệ tìm kiếm doanh nghiệp hỗ trợ bởi AI nổi tiếng.

đọc thêm

Dell Tech tăng cường cơ sở hạ tầng AI với việc ra mắt máy chủ PowerEdge

24/11/19 4:30

Dell Technologies đã công bố những cải tiến đối với cơ sở hạ tầng AI của mình, bao gồm máy chủ Dell PowerEdge XE mới và các bản cập nhật cho Dell Data Lakehouse.

đọc thêm

CommBox bảo đảm 15 triệu đô la để mở rộng trải nghiệm khách hàng AI

24/11/19 4:30

CommBox, nhà cung cấp hàng đầu các giải pháp trải nghiệm khách hàng hỗ trợ bởi AI, gần đây đã nhận được khoản đầu tư 15 triệu đô la từ PSG Equity.

đọc thêm

FiscalNote hợp tác với ProRata.ai để phân phối nội dung

24/11/19 4:30

FiscalNote đã ký thỏa thuận cấp phép với công ty tìm kiếm AI ProRata.ai để cung cấp nội dung chính sách và chính trị được tuyển chọn từ nền tảng RollCall.com của công ty.

đọc thêm