top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

SambaNova công bố Fast DeepSeek-R1 AI trên đám mây

Generatived

25/2/14 4:45

Công ty Generative AI SambaNova thông báo rằng mô hình DeepSeek-R1 671B của họ hiện đang chạy trên nền tảng đám mây của mình, mang lại hiệu suất đáng kinh ngạc là 198 token mỗi giây. Hiệu suất này là vô song trong ngành, cung cấp cho các nhà phát triển và doanh nghiệp một giải pháp hiệu quả và tiết kiệm chi phí hơn cho suy luận AI ở quy mô lớn. Tốc độ cao này là nhờ chip SN40L RDU của công ty, dự kiến ​​sẽ cải thiện hơn nữa để nhanh hơn gấp 5 lần so với một giá đỡ GPU hiện đại vào cuối năm nay.

Tổng giám đốc điều hành của công ty, Rodrigo Liang, nhấn mạnh tầm quan trọng của việc có thể chạy toàn bộ mô hình DeepSeek-R1, không chỉ là phiên bản đơn giản hóa, ở tốc độ cao như vậy. Sự tiến bộ này đặc biệt quan trọng đối với các mô hình suy luận đòi hỏi một số lượng lớn mã thông báo để tạo ra đầu ra tốt. Tiến sĩ Andrew Ng, một nhân vật nổi tiếng trong lĩnh vực AI, cũng nhấn mạnh tác động mang tính chuyển đổi mà công nghệ của SambaNova sẽ có đối với khả năng xử lý các mô hình suy luận phức tạp của các nhà phát triển.

Các chuẩn mực độc lập của Artificial Analysis đã xác nhận rằng việc triển khai DeepSeek-R1 trên đám mây của SambaNova là tốc độ đầu ra nhanh nhất được ghi nhận cho mô hình này. Đồng sáng lập Artificial Analysis George Cameron lưu ý rằng đầu ra nhanh là quan trọng đối với các mô hình suy luận sử dụng các mã thông báo này để cải thiện chất lượng phản hồi. Công việc của SambaNova nhằm mục đích thúc đẩy việc sử dụng các mô hình suy luận trong các tình huống mà latency là yếu tố chính.

SambaNova đã tận dụng kiến ​​trúc luồng dữ liệu độc đáo và thiết kế bộ nhớ ba tầng để giải quyết thách thức về chi phí suy luận cao liên quan đến DeepSeek-R1. Cách tiếp cận này đã giảm đáng kể các yêu cầu về phần cứng để chạy mô hình từ 40 giá GPU xuống còn một giá RDU của SambaNova. Công ty đang chuẩn bị mở rộng đáng kể năng lực, hứa hẹn sẽ cung cấp gấp hơn 100 lần năng lực toàn cầu hiện tại của DeepSeek-R1 vào cuối năm nay, định vị RDU là giải pháp doanh nghiệp hiệu quả nhất cho các mô hình suy luận.

Chia sẻ bài viết này:

Tin tức mới nhất
Hội thảo Magic về ứng dụng Generative AI

Hội thảo Magic về ứng dụng Generative AI

25/2/20 4:45

Magicemi (Tokyo) vừa thông báo sẽ tổ chức hội thảo về phát triển ứng dụng Generative AI nội bộ.

Bản đồ chiếu sáng AI Zero to One Start 2025

Bản đồ chiếu sáng AI Zero to One Start 2025

25/2/20 4:45

Zeroichi Start (Chuo-ku, Tokyo) đã phát hành "Bản đồ hỗn loạn công cụ viết AI năm 2025" như một phần của dự án "AI Writer" của mình.

Mở rộng đối thoại với khách hàng với Totonoel và sử dụng AI

Mở rộng đối thoại với khách hàng với Totonoel và sử dụng AI

25/2/20 4:45

Totonoel Nhật Bản (Funabashi, Tỉnh Chiba) đã sử dụng AI để tăng đáng kể số lượng khách hàng mà các chuyên gia tư vấn của công ty chịu trách nhiệm từ mức trung bình 15,3 lên 28,9.

Phiên họp nghiên cứu ChatGPT hoạt động chéo đã được tổ chức

Phiên họp nghiên cứu ChatGPT hoạt động chéo đã được tổ chức

25/2/20 4:45

Cross Operation Group (Chiyoda-ku, Tokyo) sẽ tổ chức buổi hội thảo nghiên cứu về cách tạo lời nhắc với mục đích sử dụng ChatGPT cho mục đích kinh doanh.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Hội thảo Magic về ứng dụng Generative AI

Hội thảo Magic về ứng dụng Generative AI

25/2/20 4:45

Magicemi (Tokyo) vừa thông báo sẽ tổ chức hội thảo về phát triển ứng dụng Generative AI nội bộ.

Bản đồ chiếu sáng AI Zero to One Start 2025

Bản đồ chiếu sáng AI Zero to One Start 2025

25/2/20 4:45

Zeroichi Start (Chuo-ku, Tokyo) đã phát hành "Bản đồ hỗn loạn công cụ viết AI năm 2025" như một phần của dự án "AI Writer" của mình.

Mở rộng đối thoại với khách hàng với Totonoel và sử dụng AI

Mở rộng đối thoại với khách hàng với Totonoel và sử dụng AI

25/2/20 4:45

Totonoel Nhật Bản (Funabashi, Tỉnh Chiba) đã sử dụng AI để tăng đáng kể số lượng khách hàng mà các chuyên gia tư vấn của công ty chịu trách nhiệm từ mức trung bình 15,3 lên 28,9.

Phiên họp nghiên cứu ChatGPT hoạt động chéo đã được tổ chức

Phiên họp nghiên cứu ChatGPT hoạt động chéo đã được tổ chức

25/2/20 4:45

Cross Operation Group (Chiyoda-ku, Tokyo) sẽ tổ chức buổi hội thảo nghiên cứu về cách tạo lời nhắc với mục đích sử dụng ChatGPT cho mục đích kinh doanh.

bottom of page