Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

SambaNova công bố Fast DeepSeek-R1 AI trên đám mây

Generatived

25/2/14 4:45

Công ty Generative AI SambaNova thông báo rằng mô hình DeepSeek-R1 671B của họ hiện đang chạy trên nền tảng đám mây của mình, mang lại hiệu suất đáng kinh ngạc là 198 token mỗi giây. Hiệu suất này là vô song trong ngành, cung cấp cho các nhà phát triển và doanh nghiệp một giải pháp hiệu quả và tiết kiệm chi phí hơn cho suy luận AI ở quy mô lớn. Tốc độ cao này là nhờ chip SN40L RDU của công ty, dự kiến sẽ cải thiện hơn nữa để nhanh hơn gấp 5 lần so với một giá đỡ GPU hiện đại vào cuối năm nay.

Tổng giám đốc điều hành của công ty, Rodrigo Liang, nhấn mạnh tầm quan trọng của việc có thể chạy toàn bộ mô hình DeepSeek-R1, không chỉ là phiên bản đơn giản hóa, ở tốc độ cao như vậy. Sự tiến bộ này đặc biệt quan trọng đối với các mô hình suy luận đòi hỏi một số lượng lớn mã thông báo để tạo ra đầu ra tốt. Tiến sĩ Andrew Ng, một nhân vật nổi tiếng trong lĩnh vực AI, cũng nhấn mạnh tác động mang tính chuyển đổi mà công nghệ của SambaNova sẽ có đối với khả năng xử lý các mô hình suy luận phức tạp của các nhà phát triển.

Các chuẩn mực độc lập của Artificial Analysis đã xác nhận rằng việc triển khai DeepSeek-R1 trên đám mây của SambaNova là tốc độ đầu ra nhanh nhất được ghi nhận cho mô hình này. Đồng sáng lập Artificial Analysis George Cameron lưu ý rằng đầu ra nhanh là quan trọng đối với các mô hình suy luận sử dụng các mã thông báo này để cải thiện chất lượng phản hồi. Công việc của SambaNova nhằm mục đích thúc đẩy việc sử dụng các mô hình suy luận trong các tình huống mà latency là yếu tố chính.

SambaNova đã tận dụng kiến trúc luồng dữ liệu độc đáo và thiết kế bộ nhớ ba tầng để giải quyết thách thức về chi phí suy luận cao liên quan đến DeepSeek-R1. Cách tiếp cận này đã giảm đáng kể các yêu cầu về phần cứng để chạy mô hình từ 40 giá GPU xuống còn một giá RDU của SambaNova. Công ty đang chuẩn bị mở rộng đáng kể năng lực, hứa hẹn sẽ cung cấp gấp hơn 100 lần năng lực toàn cầu hiện tại của DeepSeek-R1 vào cuối năm nay, định vị RDU là giải pháp doanh nghiệp hiệu quả nhất cho các mô hình suy luận.

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

Hội thảo Magic về ứng dụng Generative AI

25/2/20 4:45

Magicemi (Tokyo) vừa thông báo sẽ tổ chức hội thảo về phát triển ứng dụng Generative AI nội bộ.

đọc thêm

Bản đồ chiếu sáng AI Zero to One Start 2025

25/2/20 4:45

Zeroichi Start (Chuo-ku, Tokyo) đã phát hành "Bản đồ hỗn loạn công cụ viết AI năm 2025" như một phần của dự án "AI Writer" của mình.

đọc thêm

Mở rộng đối thoại với khách hàng với Totonoel và sử dụng AI

25/2/20 4:45

Totonoel Nhật Bản (Funabashi, Tỉnh Chiba) đã sử dụng AI để tăng đáng kể số lượng khách hàng mà các chuyên gia tư vấn của công ty chịu trách nhiệm từ mức trung bình 15,3 lên 28,9.

đọc thêm

Phiên họp nghiên cứu ChatGPT hoạt động chéo đã được tổ chức

25/2/20 4:45

Cross Operation Group (Chiyoda-ku, Tokyo) sẽ tổ chức buổi hội thảo nghiên cứu về cách tạo lời nhắc với mục đích sử dụng ChatGPT cho mục đích kinh doanh.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Hội thảo Magic về ứng dụng Generative AI

25/2/20 4:45

Magicemi (Tokyo) vừa thông báo sẽ tổ chức hội thảo về phát triển ứng dụng Generative AI nội bộ.

đọc thêm

Bản đồ chiếu sáng AI Zero to One Start 2025

25/2/20 4:45

Zeroichi Start (Chuo-ku, Tokyo) đã phát hành "Bản đồ hỗn loạn công cụ viết AI năm 2025" như một phần của dự án "AI Writer" của mình.

đọc thêm

Mở rộng đối thoại với khách hàng với Totonoel và sử dụng AI

25/2/20 4:45

Totonoel Nhật Bản (Funabashi, Tỉnh Chiba) đã sử dụng AI để tăng đáng kể số lượng khách hàng mà các chuyên gia tư vấn của công ty chịu trách nhiệm từ mức trung bình 15,3 lên 28,9.

đọc thêm

Phiên họp nghiên cứu ChatGPT hoạt động chéo đã được tổ chức

25/2/20 4:45

Cross Operation Group (Chiyoda-ku, Tokyo) sẽ tổ chức buổi hội thảo nghiên cứu về cách tạo lời nhắc với mục đích sử dụng ChatGPT cho mục đích kinh doanh.

đọc thêm