Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
Google Cloud công bố Trillium TPU, A3 Ultra VM
Generatived
25/1/17 4:30
Cuối năm 2024 chứng kiến sự ra mắt của một loạt các tiến bộ trong cơ sở hạ tầng AI, bao gồm việc phát hành Trillium, TPU thế hệ thứ sáu và A3 Ultra VM với GPU NVIDIA H200. Những phát triển này cũng giới thiệu hỗ trợ cho các cụm nút được mở rộng trong Google Kubernetes Engine và phát hành Parallelstore, một hệ thống tệp phân tán được thiết kế cho điện toán hiệu suất cao và khối lượng công việc AI. Những công cụ này dự kiến sẽ cải thiện khả năng tạo ra các giải pháp AI của các nhà phát triển.
Google cũng giới thiệu siêu máy tính AI, một hệ thống toàn diện kết hợp phần cứng được tối ưu hóa, phần mềm mở và mô hình tiêu thụ linh hoạt. Cách tiếp cận này cho phép các nhà phát triển lựa chọn các thành phần cơ sở hạ tầng khác nhau để phù hợp với yêu cầu khối lượng công việc cụ thể của họ, cung cấp một nền tảng đa năng để phát triển các giải pháp AI trên Google Cloud.
Các bản cập nhật bao gồm tính khả dụng chung của A3 Ultra VM và Hypercompute Clusters để cung cấp năng lượng cho khối lượng công việc phân tán. Được hỗ trợ bởi GPU NVIDIA H200, A3 Ultra VM cung cấp băng thông mạng và bộ nhớ GPU-to-GPU tăng lên, trong khi Hypercompute Clusters cung cấp nền tảng dịch vụ siêu máy tính giúp hợp lý hóa việc triển khai và quản lý số lượng lớn các bộ tăng tốc.
LG Research đã bắt đầu tận dụng các dịch vụ mới này và Jiyeon Jung, kỹ sư cơ sở hạ tầng AI cấp cao tại công ty, ca ngợi hiệu suất tăng cường và khả năng mở rộng mà A3 Ultra VM và cụm siêu máy tính mang lại cho các dự án AI của họ. Ông cũng trích dẫn sự dễ dàng trong việc thiết lập và chạy cụm là một cải tiến lớn.
Ngoài ra, Trillium TPU đã được giới thiệu để cải thiện thông lượng suy luận cho các tác nhân AI, với mức tăng gấp 3 lần so với thế hệ trước. Google Cloud cung cấp nhiều cách khác nhau để tận dụng các TPU này, bao gồm Vertex AI và các công cụ khác được thiết kế riêng cho Cloud TPU. Hỗ trợ thử nghiệm cho vLLM trên TPU với PyTorch/XLA 2.5 cũng đã được công bố, cho phép người dùng khám phá các lợi ích về hiệu suất của Cloud TPU trong các thiết lập hiện có của họ.
Chia sẻ bài viết này:
Tin tức mới nhất
Sự kiện thử thách 1 tháng phát triển ứng dụng AI của TIMEWELL
25/1/17 4:30
TIMEWELL (Yokohama, Tỉnh Kanagawa) sẽ tổ chức sự kiện dành cho người mới bắt đầu lập trình với chủ đề "Người mới bắt đầu lập trình có thể học phát triển ứng dụng trong một tháng không?"
Đồng tổ chức Hội thảo AI về lập kế hoạch hạt giống
25/1/17 4:30
Seed Planning (Bunkyo-ku, Tokyo) sẽ đồng tổ chức một loạt hội thảo trực tuyến với Hiệp hội thúc đẩy Generative AI (Chiyoda-ku, Tokyo) thông qua "Digital Administration",
Triển khai tác nhân AI đám mây khách hàng
25/1/17 4:30
Customer Cloud (Shinjuku-ku, Tokyo) đã bắt đầu cung cấp dịch vụ tư vấn miễn phí liên quan đến việc triển khai chức năng nhiệm vụ của ChatGPT cho doanh nghiệp.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Sự kiện thử thách 1 tháng phát triển ứng dụng AI của TIMEWELL
25/1/17 4:30
TIMEWELL (Yokohama, Tỉnh Kanagawa) sẽ tổ chức sự kiện dành cho người mới bắt đầu lập trình với chủ đề "Người mới bắt đầu lập trình có thể học phát triển ứng dụng trong một tháng không?"
Đồng tổ chức Hội thảo AI về lập kế hoạch hạt giống
25/1/17 4:30
Seed Planning (Bunkyo-ku, Tokyo) sẽ đồng tổ chức một loạt hội thảo trực tuyến với Hiệp hội thúc đẩy Generative AI (Chiyoda-ku, Tokyo) thông qua "Digital Administration",
Triển khai tác nhân AI đám mây khách hàng
25/1/17 4:30
Customer Cloud (Shinjuku-ku, Tokyo) đã bắt đầu cung cấp dịch vụ tư vấn miễn phí liên quan đến việc triển khai chức năng nhiệm vụ của ChatGPT cho doanh nghiệp.