top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Pembaruan hiperkomputer Google AI

Generatived

24/11/7 4:30

Google (AS) mengumumkan pembaruan besar pada lapisan perangkat lunak hiperkomputer AI-nya. Menyediakan pusat pusat untuk meningkatkan kinerja pelatihan dan inferensi, meningkatkan ketahanan, dan mengelola sumber daya. Sumber daya hiperkomputer AI baru di GitHub kini mencakup implementasi referensi seperti MaxText dan MaxDiffusion, serta alat orkestrasi XPK.

Bekerja sama dengan NVIDIA (AS), MaxText mendukung A3 Mega VM. Hal ini menggandakan bandwidth jaringan GPU-ke-GPU, sehingga mempercepat pelatihan model bahasa besar. Pelatihan presisi campuran FP8 juga meningkatkan pemanfaatan perangkat keras. Google menunjukkan bahwa pelatihan FP8 dengan AQT secara signifikan meningkatkan pemanfaatan model FLOP yang efektif.

Google juga menyediakan referensi implementasi dan kernel untuk MoE (Mixture of Experts). Hal ini memungkinkan Anda menyesuaikan jumlah pakar dan meningkatkan fleksibilitas dan performa model. Kami juga melakukan open source pada kernel Pallas yang dioptimalkan di Cloud TPU untuk lebih mempercepat pelatihan model MoE.

Memperkenalkan resep pemantauan referensi untuk memfasilitasi pemantauan pelatihan skala besar. Membantu memaksimalkan pemanfaatan sumber daya dan meningkatkan kinerja ML melalui dasbor Cloud Monitoring. Selain itu, SparseCore untuk Cloud TPU v5p kini tersedia secara umum, sehingga meningkatkan performa model Rekomendasi secara signifikan. Performa inferensi LLM juga meningkat dua kali lipat dengan fitur baru JetStream.

Chia sẻ bài viết này:

Tin tức mới nhất
UNICOM Engineering ra mắt máy chủ nhúng XE9680-IR

UNICOM Engineering ra mắt máy chủ nhúng XE9680-IR

24/11/14 4:30

UNICOM Engineering đã giới thiệu nền tảng máy chủ mới, XE9680-IR, được thiết kế để tăng hiệu quả và tính bền vững trong các trung tâm dữ liệu.

SoftBank và Fujitsu cùng phát triển AI-RAN

SoftBank và Fujitsu cùng phát triển AI-RAN

24/11/14 4:30

SoftBank (Tokyo) và Fujitsu(Tokyo) thông báo rằng họ sẽ tiến hành hoạt động R&D chung để thương mại hóa "AI-RAN", một công nghệ mới tích hợp AI và RAN.

NVIDIA và SoftBank ra mắt siêu máy tính AI của Nhật Bản

NVIDIA và SoftBank ra mắt siêu máy tính AI của Nhật Bản

24/11/14 4:30

Hội nghị thượng đỉnh AI Nhật Bản của NVIDIA đánh dấu một thông báo quan trọng về tương lai của Nhật Bản trong lĩnh vực trí tuệ nhân tạo.

NVIDIA dự đoán tác động của AI lên các ngành công nghiệp toàn cầu

NVIDIA dự đoán tác động của AI lên các ngành công nghiệp toàn cầu

24/11/14 4:30

Kỷ nguyên số đã mang đến lượng dữ liệu chưa từng có, ước tính lên tới con số đáng kinh ngạc là 120 zettabyte.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
UNICOM Engineering ra mắt máy chủ nhúng XE9680-IR

UNICOM Engineering ra mắt máy chủ nhúng XE9680-IR

24/11/14 4:30

UNICOM Engineering đã giới thiệu nền tảng máy chủ mới, XE9680-IR, được thiết kế để tăng hiệu quả và tính bền vững trong các trung tâm dữ liệu.

SoftBank và Fujitsu cùng phát triển AI-RAN

SoftBank và Fujitsu cùng phát triển AI-RAN

24/11/14 4:30

SoftBank (Tokyo) và Fujitsu(Tokyo) thông báo rằng họ sẽ tiến hành hoạt động R&D chung để thương mại hóa "AI-RAN", một công nghệ mới tích hợp AI và RAN.

NVIDIA và SoftBank ra mắt siêu máy tính AI của Nhật Bản

NVIDIA và SoftBank ra mắt siêu máy tính AI của Nhật Bản

24/11/14 4:30

Hội nghị thượng đỉnh AI Nhật Bản của NVIDIA đánh dấu một thông báo quan trọng về tương lai của Nhật Bản trong lĩnh vực trí tuệ nhân tạo.

NVIDIA dự đoán tác động của AI lên các ngành công nghiệp toàn cầu

NVIDIA dự đoán tác động của AI lên các ngành công nghiệp toàn cầu

24/11/14 4:30

Kỷ nguyên số đã mang đến lượng dữ liệu chưa từng có, ước tính lên tới con số đáng kinh ngạc là 120 zettabyte.

bottom of page