Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Groq lại phá kỷ lục hiệu suất LLM với hệ thống LPU™

Generatived

23/8/31 17:00

Groq, nhà cung cấp giải pháp AI, đã công bố những cải tiến đáng kể về hiệu suất suy luận cho mô hình ngôn ngữ quy mô lớn (LLM), Llama-2 70B. Chỉ trong ba tuần, công ty đã có thể tăng hơn gấp đôi hiệu suất của mình, chạy với tốc độ hơn 240 mã thông báo mỗi giây (T/s) cho mỗi người dùng trên hệ thống LPU™. Thành tích này đạt được sau khi Groq lần đầu tiên đạt 100T/s trên mỗi người dùng với Llama-2 70B, đặt ra câu hỏi về tiềm năng cải thiện hiệu suất hơn nữa của silicon 14nm thế hệ đầu tiên được sản xuất tại Mỹ.

Khách hàng của Groq đang xuất bản các bản demo riêng tư, mở ra một thế giới mới về các trường hợp sử dụng LLM có độ trễ thấp có thể có trong các ngành tương ứng của họ. Ví dụ: LLM có thể được sử dụng để giám sát lượng lớn dữ liệu văn bản từ các diễn đàn trực tuyến và phương tiện truyền thông xã hội để nhanh chóng phát hiện các cuộc tấn công mạng và vi phạm an ninh tiềm ẩn. Độ trễ cực thấp của các mô hình này rất quan trọng cho việc phân tích và phản hồi theo thời gian thực, đóng vai trò quan trọng trong việc bảo vệ thông tin nhạy cảm, cơ sở hạ tầng quan trọng và an ninh quốc gia.

LLM cũng có khả năng cách mạng hóa việc ứng phó khẩn cấp tại địa phương trong các thảm họa thiên nhiên. Bằng cách phân tích dữ liệu thời gian thực từ phương tiện truyền thông xã hội, các cuộc gọi khẩn cấp và dự báo thời tiết, các mô hình này xác định các khu vực cần hỗ trợ khẩn cấp, dự đoán các mối đe dọa và cung cấp thông tin chính xác cho những người ứng phó đầu tiên và các cộng đồng bị ảnh hưởng có thể đưa ra hướng dẫn.

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

NVIDIA công bố mô hình AI Llama Nemotron Agentic

25/1/8 4:30

Agent AI đang nổi lên như một công nghệ mang tính cách mạng với khả năng cho phép các hệ thống AI hoạt động tự động và giải quyết các mục tiêu phức tạp.

đọc thêm

Gemini cải thiện độ chính xác của mô hình bằng cách tinh chỉnh có giám sát

25/1/8 4:30

Mô hình nền tảng của Gemini đã trở thành một công cụ thiết yếu cho nhiều ứng dụng kinh doanh, nhưng thường cần phải điều chỉnh để thực hiện các nhiệm vụ cụ thể một cách tối ưu.

đọc thêm

Microsoft công bố khoản đầu tư 3 tỷ đô la vào AI tại Ấn Độ

25/1/8 4:30

Chủ tịch kiêm Tổng giám đốc điều hành Microsoft Satya Nadella đã công bố khoản đầu tư đáng kể trị giá 3 tỷ đô la vào cơ sở hạ tầng đám mây và AI tại Ấn Độ trong hai năm tới.

đọc thêm

Meta thắt chặt ngôn ngữ và thay đổi chính sách kiểm duyệt nội dung

25/1/8 4:30

Meta vừa thông báo rằng họ sẽ thay đổi cách tiếp cận kiểm duyệt nội dung nhằm tăng cường quyền tự do ngôn luận trên nền tảng của mình.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

NVIDIA công bố mô hình AI Llama Nemotron Agentic

25/1/8 4:30

Agent AI đang nổi lên như một công nghệ mang tính cách mạng với khả năng cho phép các hệ thống AI hoạt động tự động và giải quyết các mục tiêu phức tạp.

đọc thêm

Gemini cải thiện độ chính xác của mô hình bằng cách tinh chỉnh có giám sát

25/1/8 4:30

Mô hình nền tảng của Gemini đã trở thành một công cụ thiết yếu cho nhiều ứng dụng kinh doanh, nhưng thường cần phải điều chỉnh để thực hiện các nhiệm vụ cụ thể một cách tối ưu.

đọc thêm

Microsoft công bố khoản đầu tư 3 tỷ đô la vào AI tại Ấn Độ

25/1/8 4:30

Chủ tịch kiêm Tổng giám đốc điều hành Microsoft Satya Nadella đã công bố khoản đầu tư đáng kể trị giá 3 tỷ đô la vào cơ sở hạ tầng đám mây và AI tại Ấn Độ trong hai năm tới.

đọc thêm

Meta thắt chặt ngôn ngữ và thay đổi chính sách kiểm duyệt nội dung

25/1/8 4:30

Meta vừa thông báo rằng họ sẽ thay đổi cách tiếp cận kiểm duyệt nội dung nhằm tăng cường quyền tự do ngôn luận trên nền tảng của mình.

đọc thêm