top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

NVIDIA thể hiện sự dẫn đầu về hiệu suất suy luận AI vượt trội

Generatived

24/8/29 2:00

Khi nhu cầu về AI tổng hợp và các dịch vụ thời gian thực tăng vọt, NVIDIA thể hiện khả năng của mình với điểm chuẩn MLPerf Inference v4.1 mới nhất. Nền tảng của công ty mang lại hiệu suất cao nhất trong tất cả các thử nghiệm của trung tâm dữ liệu, với nền tảng NVIDIA Blackwell sắp ra mắt vượt trội hơn GPU NVIDIA H100 Tensor Core tới gấp 4 lần trên khối lượng công việc Llama 2 70B. Bước nhảy vọt về hiệu quả này là nhờ Transformer Engine và FP4 Tensor Core tiên tiến của nền tảng.

GPU H200 Tensor Core của NVIDIA cũng hoạt động tốt, cho kết quả tốt trong tất cả các điểm chuẩn của trung tâm dữ liệu, bao gồm cả Mixtral 8x7B Mixture of Experts (MoE) LLM mới. Các mô hình MoE ngày càng trở nên phổ biến vì chúng có thể xử lý nhiều truy vấn và nhiệm vụ trong một lần triển khai, đồng thời có thể đạt được tốc độ và hiệu quả bằng cách chỉ kích hoạt một số chuyên gia được chọn cho mỗi suy luận.

Sự phát triển nhanh chóng của các mô hình ngôn ngữ quy mô lớn (LLM) đòi hỏi sức mạnh tính toán tăng lên để quản lý nhu cầu suy luận đồng thời đáp ứng các yêu cầu về độ trễ thời gian thực. Công nghệ NVLink và NVSwitch của NVIDIA cho phép liên lạc GPU băng thông cao cần thiết cho suy luận mô hình quy mô lớn, thời gian thực. Nền tảng Blackwell sẽ mở rộng các khả năng này để hỗ trợ các miền NVLink lớn hơn với tối đa 72 GPU. Ngoài ra, 10 đối tác của NVIDIA đã đóng góp các bản đệ trình Suy luận MLPerf, chứng tỏ việc áp dụng rộng rãi nền tảng NVIDIA.

NVIDIA tiếp tục cải tiến phần mềm của mình, mang lại những cải tiến hiệu suất đáng kể sau mỗi bản cập nhật. GPU NVIDIA H200 đã cải thiện 27% hiệu suất suy luận AI tổng quát kể từ vòng trước. Máy chủ suy luận NVIDIA Triton, một thành phần chính của Nền tảng AI NVIDIA, cho phép các tổ chức hợp lý hóa việc triển khai các mô hình AI và giảm chi phí sở hữu. Trong các điểm chuẩn mới nhất, Triton phù hợp với hiệu suất của các sản phẩm kim loại trần của NVIDIA, cung cấp cho doanh nghiệp một máy chủ suy luận AI mạnh mẽ mà không phải hy sinh thông lượng.

Ở biên, nền tảng Jetson của NVIDIA chuyển đổi dữ liệu cảm biến thành thông tin chuyên sâu theo thời gian thực để có thể chạy nhiều mô hình khác nhau như LLM và bộ chuyển đổi tầm nhìn. Mô-đun Jetson AGX Orin mang lại những cải tiến đáng kể về thông lượng và độ trễ, cho phép các nhà phát triển tạo ra các ứng dụng linh hoạt tương tác với ngôn ngữ con người. Các nền tảng của NVIDIA đã chứng tỏ tính linh hoạt và hiệu suất dẫn đầu từ trung tâm dữ liệu đến điện toán biên. Các hệ thống hỗ trợ GPU H200 hiện có sẵn từ nhiều nhà cung cấp khác nhau bao gồm CoreWeave, ASUS, Dell Technologies, HPE, QTC và Supermicro.

Chia sẻ bài viết này:

Tin tức mới nhất
Visier công bố thành công của sáng kiến Workforce AI Edge

Visier công bố thành công của sáng kiến Workforce AI Edge

24/11/15 4:30

Visier báo cáo kết quả kinh doanh khả quan trong quý 3 của năm tài chính, nhấn mạnh nhu cầu ngày càng tăng đối với các giải pháp AI dành cho lực lượng lao động.

Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI

Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI

24/11/15 4:30

Webware.ai đã ra mắt Rivi, một công cụ tiếp thị và bán hàng mới sử dụng AI được thiết kế riêng để tăng cường sự hiện diện kỹ thuật số của các doanh nghiệp dịch vụ vừa và nhỏ.

Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới

Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới

24/11/15 4:30

Các công ty đang dần từ bỏ cách tiếp cận thận trọng "chờ đợi và quan sát" đang thấy ở nhiều công ty và đang chủ động hơn trong việc tích hợp AI vào bán lẻ.

Mô hình tăng cường AI của Google Cloud đã ra mắt

Mô hình tăng cường AI của Google Cloud đã ra mắt

24/11/15 4:30

Google Cloud (Hoa Kỳ) thông báo rằng nền tảng Vertex AI của họ cung cấp quyền truy cập vào hơn 160 mô hình đa dạng, cho phép khách hàng xây dựng các giải pháp phù hợp với nhu cầu của họ.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Visier công bố thành công của sáng kiến Workforce AI Edge

Visier công bố thành công của sáng kiến Workforce AI Edge

24/11/15 4:30

Visier báo cáo kết quả kinh doanh khả quan trong quý 3 của năm tài chính, nhấn mạnh nhu cầu ngày càng tăng đối với các giải pháp AI dành cho lực lượng lao động.

Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI

Webware Tech ra mắt Rivi, một công ty tiếp thị được điều khiển bằng AI

24/11/15 4:30

Webware.ai đã ra mắt Rivi, một công cụ tiếp thị và bán hàng mới sử dụng AI được thiết kế riêng để tăng cường sự hiện diện kỹ thuật số của các doanh nghiệp dịch vụ vừa và nhỏ.

Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới

Zimmerman Agency Ra Mắt Ba Công Cụ AI Mới

24/11/15 4:30

Các công ty đang dần từ bỏ cách tiếp cận thận trọng "chờ đợi và quan sát" đang thấy ở nhiều công ty và đang chủ động hơn trong việc tích hợp AI vào bán lẻ.

Mô hình tăng cường AI của Google Cloud đã ra mắt

Mô hình tăng cường AI của Google Cloud đã ra mắt

24/11/15 4:30

Google Cloud (Hoa Kỳ) thông báo rằng nền tảng Vertex AI của họ cung cấp quyền truy cập vào hơn 160 mô hình đa dạng, cho phép khách hàng xây dựng các giải pháp phù hợp với nhu cầu của họ.

bottom of page