top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Groq lại phá kỷ lục hiệu suất LLM với hệ thống LPU™

Generatived

23/8/31 17:00

Groq, nhà cung cấp giải pháp AI, đã công bố những cải tiến đáng kể về hiệu suất suy luận cho mô hình ngôn ngữ quy mô lớn (LLM), Llama-2 70B. Chỉ trong ba tuần, công ty đã có thể tăng hơn gấp đôi hiệu suất của mình, chạy với tốc độ hơn 240 mã thông báo mỗi giây (T/s) cho mỗi người dùng trên hệ thống LPU™. Thành tích này đạt được sau khi Groq lần đầu tiên đạt 100T/s trên mỗi người dùng với Llama-2 70B, đặt ra câu hỏi về tiềm năng cải thiện hiệu suất hơn nữa của silicon 14nm thế hệ đầu tiên được sản xuất tại Mỹ.

Khách hàng của Groq đang xuất bản các bản demo riêng tư, mở ra một thế giới mới về các trường hợp sử dụng LLM có độ trễ thấp có thể có trong các ngành tương ứng của họ. Ví dụ: LLM có thể được sử dụng để giám sát lượng lớn dữ liệu văn bản từ các diễn đàn trực tuyến và phương tiện truyền thông xã hội để nhanh chóng phát hiện các cuộc tấn công mạng và vi phạm an ninh tiềm ẩn. Độ trễ cực thấp của các mô hình này rất quan trọng cho việc phân tích và phản hồi theo thời gian thực, đóng vai trò quan trọng trong việc bảo vệ thông tin nhạy cảm, cơ sở hạ tầng quan trọng và an ninh quốc gia.



LLM cũng có khả năng cách mạng hóa việc ứng phó khẩn cấp tại địa phương trong các thảm họa thiên nhiên. Bằng cách phân tích dữ liệu thời gian thực từ phương tiện truyền thông xã hội, các cuộc gọi khẩn cấp và dự báo thời tiết, các mô hình này xác định các khu vực cần hỗ trợ khẩn cấp, dự đoán các mối đe dọa và cung cấp thông tin chính xác cho những người ứng phó đầu tiên và các cộng đồng bị ảnh hưởng có thể đưa ra hướng dẫn.

Chia sẻ bài viết này:

Tin tức mới nhất
NVIDIA ra mắt đội tàu robot AI khổng lồ

NVIDIA ra mắt đội tàu robot AI khổng lồ

25/1/8 4:30

Tại CES, NVIDIA đã công bố OmniverseBlueprint "Mega", nhằm mục đích tăng cường phát triển, thử nghiệm và tối ưu hóa AI vật lý và đội tàu robot trong bản sao kỹ thuật số.

NVIDIA Launchables đơn giản hóa thiết lập cho quy trình phát triển AI

NVIDIA Launchables đơn giản hóa thiết lập cho quy trình phát triển AI

25/1/8 4:30

Hôm nay, NVIDIA đã công bố NVIDIA Launchables, một bộ môi trường điện toán GPU được cấu hình sẵn, được thiết kế để đơn giản hóa quy trình thiết lập và triển khai cho quy trình phát triển AI.

Google Cloud công bố tích hợp quảng cáo cho Gemini 1.5 Pro

Google Cloud công bố tích hợp quảng cáo cho Gemini 1.5 Pro

25/1/8 4:30

Với sự bùng nổ về nhu cầu xem video trực tuyến, 1,8 tỷ người đăng ký dịch vụ phát trực tuyến và 92% người dùng Internet xem video mỗi tháng, các nhà quảng cáo có cơ hội duy nhất để thu hút khán giả.

IDC cho biết công cụ truy vấn AI sẽ giải phóng tiềm năng dữ liệu

IDC cho biết công cụ truy vấn AI sẽ giải phóng tiềm năng dữ liệu

25/1/8 4:30

Sự tăng trưởng theo cấp số nhân của dữ liệu doanh nghiệp đặt ra thách thức lớn cho các tổ chức đang tìm cách tận dụng hiệu quả trí tuệ nhân tạo (AI).

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
NVIDIA ra mắt đội tàu robot AI khổng lồ

NVIDIA ra mắt đội tàu robot AI khổng lồ

25/1/8 4:30

Tại CES, NVIDIA đã công bố OmniverseBlueprint "Mega", nhằm mục đích tăng cường phát triển, thử nghiệm và tối ưu hóa AI vật lý và đội tàu robot trong bản sao kỹ thuật số.

NVIDIA Launchables đơn giản hóa thiết lập cho quy trình phát triển AI

NVIDIA Launchables đơn giản hóa thiết lập cho quy trình phát triển AI

25/1/8 4:30

Hôm nay, NVIDIA đã công bố NVIDIA Launchables, một bộ môi trường điện toán GPU được cấu hình sẵn, được thiết kế để đơn giản hóa quy trình thiết lập và triển khai cho quy trình phát triển AI.

Google Cloud công bố tích hợp quảng cáo cho Gemini 1.5 Pro

Google Cloud công bố tích hợp quảng cáo cho Gemini 1.5 Pro

25/1/8 4:30

Với sự bùng nổ về nhu cầu xem video trực tuyến, 1,8 tỷ người đăng ký dịch vụ phát trực tuyến và 92% người dùng Internet xem video mỗi tháng, các nhà quảng cáo có cơ hội duy nhất để thu hút khán giả.

IDC cho biết công cụ truy vấn AI sẽ giải phóng tiềm năng dữ liệu

IDC cho biết công cụ truy vấn AI sẽ giải phóng tiềm năng dữ liệu

25/1/8 4:30

Sự tăng trưởng theo cấp số nhân của dữ liệu doanh nghiệp đặt ra thách thức lớn cho các tổ chức đang tìm cách tận dụng hiệu quả trí tuệ nhân tạo (AI).

bottom of page