Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

Google Cloud công bố Trillium TPU, A3 Ultra VM

Generatived

25/1/17 4:30

Cuối năm 2024 chứng kiến sự ra mắt của một loạt các tiến bộ trong cơ sở hạ tầng AI, bao gồm việc phát hành Trillium, TPU thế hệ thứ sáu và A3 Ultra VM với GPU NVIDIA H200. Những phát triển này cũng giới thiệu hỗ trợ cho các cụm nút được mở rộng trong Google Kubernetes Engine và phát hành Parallelstore, một hệ thống tệp phân tán được thiết kế cho điện toán hiệu suất cao và khối lượng công việc AI. Những công cụ này dự kiến sẽ cải thiện khả năng tạo ra các giải pháp AI của các nhà phát triển.

Google cũng giới thiệu siêu máy tính AI, một hệ thống toàn diện kết hợp phần cứng được tối ưu hóa, phần mềm mở và mô hình tiêu thụ linh hoạt. Cách tiếp cận này cho phép các nhà phát triển lựa chọn các thành phần cơ sở hạ tầng khác nhau để phù hợp với yêu cầu khối lượng công việc cụ thể của họ, cung cấp một nền tảng đa năng để phát triển các giải pháp AI trên Google Cloud.

Các bản cập nhật bao gồm tính khả dụng chung của A3 Ultra VM và Hypercompute Clusters để cung cấp năng lượng cho khối lượng công việc phân tán. Được hỗ trợ bởi GPU NVIDIA H200, A3 Ultra VM cung cấp băng thông mạng và bộ nhớ GPU-to-GPU tăng lên, trong khi Hypercompute Clusters cung cấp nền tảng dịch vụ siêu máy tính giúp hợp lý hóa việc triển khai và quản lý số lượng lớn các bộ tăng tốc.

LG Research đã bắt đầu tận dụng các dịch vụ mới này và Jiyeon Jung, kỹ sư cơ sở hạ tầng AI cấp cao tại công ty, ca ngợi hiệu suất tăng cường và khả năng mở rộng mà A3 Ultra VM và cụm siêu máy tính mang lại cho các dự án AI của họ. Ông cũng trích dẫn sự dễ dàng trong việc thiết lập và chạy cụm là một cải tiến lớn.

Ngoài ra, Trillium TPU đã được giới thiệu để cải thiện thông lượng suy luận cho các tác nhân AI, với mức tăng gấp 3 lần so với thế hệ trước. Google Cloud cung cấp nhiều cách khác nhau để tận dụng các TPU này, bao gồm Vertex AI và các công cụ khác được thiết kế riêng cho Cloud TPU. Hỗ trợ thử nghiệm cho vLLM trên TPU với PyTorch/XLA 2.5 cũng đã được công bố, cho phép người dùng khám phá các lợi ích về hiệu suất của Cloud TPU trong các thiết lập hiện có của họ.

Nguồn: Thông cáo báo chí

Chia sẻ bài viết này:

Tin tức mới nhất

Sự kiện thử thách 1 tháng phát triển ứng dụng AI của TIMEWELL

25/1/17 4:30

TIMEWELL (Yokohama, Tỉnh Kanagawa) sẽ tổ chức sự kiện dành cho người mới bắt đầu lập trình với chủ đề "Người mới bắt đầu lập trình có thể học phát triển ứng dụng trong một tháng không?"

đọc thêm

Đồng tổ chức Hội thảo AI về lập kế hoạch hạt giống

25/1/17 4:30

Seed Planning (Bunkyo-ku, Tokyo) sẽ đồng tổ chức một loạt hội thảo trực tuyến với Hiệp hội thúc đẩy Generative AI (Chiyoda-ku, Tokyo) thông qua "Digital Administration",

đọc thêm

Triển khai tác nhân AI đám mây khách hàng

25/1/17 4:30

Customer Cloud (Shinjuku-ku, Tokyo) đã bắt đầu cung cấp dịch vụ tư vấn miễn phí liên quan đến việc triển khai chức năng nhiệm vụ của ChatGPT cho doanh nghiệp.

đọc thêm

Algomatic ra mắt AI dành riêng cho bán hàng "Apodori"

25/1/17 4:30

Algomatic (Minato-ku, Tokyo) thông báo rằng họ sẽ bắt đầu cung cấp loạt tác nhân AI chuyên bán hàng mang tên "Neo Sales" vào ngày 16 tháng 1 năm 2025 và sẽ phát hành "Apodori" là phần đầu tiên.

đọc thêm

Chia sẻ bài viết này:

Danh mục

Trình nâng cao hình ảnh AI

Trình tạo mã AI

Quản lý tác vụ AI

Không có mã/mã thấp

Trình tạo thiết kế đồ họa AI

Trình tạo minh họa/nghệ thuật AI

Tất cả công cụ

Tin tức

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI sáng tạo

Hướng dẫn ứng dụng AI cơ bản

Hồ sơ công ty

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Ngôn ngữ

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Hãy theo dõi chúng tôi

Ngôn ngữ

Danh mục

Tất cả công cụ

Quản lý tác vụ AI

Trình tạo thiết kế đồ họa AI

Không có mã/mã thấp

Trình tạo mã AI

Trình nâng cao hình ảnh AI

Trình tạo minh họa/nghệ thuật AI

AI và luật/hệ thống/kinh tế/xã hội

Các công ty/sản phẩm/công nghệ AI

AI công nghệ lớn

OpenAI/ChatGPT

AI thế hệ sáng tạo

AI thế hệ dựa trên văn bản

AI sáng tạo của Nhật Bản

Cơ bản về AI tạo ra

Hướng dẫn ứng dụng AI cơ bản

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Tin tức mới nhất

Sự kiện thử thách 1 tháng phát triển ứng dụng AI của TIMEWELL

25/1/17 4:30

TIMEWELL (Yokohama, Tỉnh Kanagawa) sẽ tổ chức sự kiện dành cho người mới bắt đầu lập trình với chủ đề "Người mới bắt đầu lập trình có thể học phát triển ứng dụng trong một tháng không?"

đọc thêm

Đồng tổ chức Hội thảo AI về lập kế hoạch hạt giống

25/1/17 4:30

Seed Planning (Bunkyo-ku, Tokyo) sẽ đồng tổ chức một loạt hội thảo trực tuyến với Hiệp hội thúc đẩy Generative AI (Chiyoda-ku, Tokyo) thông qua "Digital Administration",

đọc thêm

Triển khai tác nhân AI đám mây khách hàng

25/1/17 4:30

Customer Cloud (Shinjuku-ku, Tokyo) đã bắt đầu cung cấp dịch vụ tư vấn miễn phí liên quan đến việc triển khai chức năng nhiệm vụ của ChatGPT cho doanh nghiệp.

đọc thêm

Algomatic ra mắt AI dành riêng cho bán hàng "Apodori"

25/1/17 4:30

Algomatic (Minato-ku, Tokyo) thông báo rằng họ sẽ bắt đầu cung cấp loạt tác nhân AI chuyên bán hàng mang tên "Neo Sales" vào ngày 16 tháng 1 năm 2025 và sẽ phát hành "Apodori" là phần đầu tiên.

đọc thêm