Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
Chip tăng tốc AI sẽ thống trị thị trường vào năm 2024: TrendForce dự đoán
Generatived
23/8/3 17:00
Vào ngày 1 tháng 8 năm 2023, TrendForce đưa ra dự đoán rằng những thay đổi lớn sẽ xảy ra trên thị trường bộ nhớ băng thông cao (HBM) và định hình bối cảnh công nghệ và AI vào năm 2024.
HBM2e hiện được sử dụng trong NVIDIA A100/A800, AMD MI200 và chip tăng tốc cây nhà lá vườn của các nhà cung cấp dịch vụ đám mây. Tuy nhiên, nhu cầu về máy gia tốc AI ngày càng tăng và sản phẩm HBM3e dự kiến sẽ được giới thiệu vào năm 2024. HBM3 và HBM3e sẽ trở thành xu hướng chủ đạo vào năm tới. Google, AWS và các CSP khác đang gia tăng sự cạnh tranh thông qua các công cụ tăng tốc AI của riêng họ.
Mặc dù các thế hệ HBM khác nhau có tốc độ khác nhau, TrendForce chia HBM3 thành hai loại: HBM3 5,6 đến 6,4 Gbps và HBM3e 8 Gbps (HBM3P, HBM3A, HBM3+ hoặc HBM3 Gen2).
SK Hynix, Samsung và Micron có nhiều dự án phát triển HBM khác nhau. SK Hynix và Samsung đã ra mắt HBM3 và có kế hoạch lấy mẫu HBM3e vào quý 1 năm 2024. Micron đang tập trung vào HBM3e.
HBM3e có khuôn nguyên khối 24GB và một HBM3e duy nhất có dung lượng 24GB. Nhà sản xuất lớn đặt mục tiêu sản xuất mẫu HBM3e vào quý 1 năm 2024 và sản xuất hàng loạt vào nửa cuối năm 2024.
CSP sẽ phát triển chip AI để giảm sự phụ thuộc vào NVIDIA và AMD. NVIDIA dẫn đầu về chip tăng tốc máy chủ AI, nhưng các CSP đang tìm kiếm giải pháp thay thế do chi phí cao. Google và AWS đang phát triển các chip Google TPU, AWS Trainium và Inferentia được định cấu hình để sử dụng công nghệ HBM3 hoặc HBM3e. Các CSP khác ở Bắc Mỹ và Trung Quốc cũng đang xem xét các diễn biến liên quan, cho thấy sự cạnh tranh ngày càng gia tăng trên thị trường chip tăng tốc AI.
Chia sẻ bài viết này:
Tin tức mới nhất
UNICOM Engineering ra mắt máy chủ nhúng XE9680-IR
24/11/14 4:30
UNICOM Engineering đã giới thiệu nền tảng máy chủ mới, XE9680-IR, được thiết kế để tăng hiệu quả và tính bền vững trong các trung tâm dữ liệu.
SoftBank và Fujitsu cùng phát triển AI-RAN
24/11/14 4:30
SoftBank (Tokyo) và Fujitsu(Tokyo) thông báo rằng họ sẽ tiến hành hoạt động R&D chung để thương mại hóa "AI-RAN", một công nghệ mới tích hợp AI và RAN.
NVIDIA và SoftBank ra mắt siêu máy tính AI của Nhật Bản
24/11/14 4:30
Hội nghị thượng đỉnh AI Nhật Bản của NVIDIA đánh dấu một thông báo quan trọng về tương lai của Nhật Bản trong lĩnh vực trí tuệ nhân tạo.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
UNICOM Engineering ra mắt máy chủ nhúng XE9680-IR
24/11/14 4:30
UNICOM Engineering đã giới thiệu nền tảng máy chủ mới, XE9680-IR, được thiết kế để tăng hiệu quả và tính bền vững trong các trung tâm dữ liệu.
SoftBank và Fujitsu cùng phát triển AI-RAN
24/11/14 4:30
SoftBank (Tokyo) và Fujitsu(Tokyo) thông báo rằng họ sẽ tiến hành hoạt động R&D chung để thương mại hóa "AI-RAN", một công nghệ mới tích hợp AI và RAN.
NVIDIA và SoftBank ra mắt siêu máy tính AI của Nhật Bản
24/11/14 4:30
Hội nghị thượng đỉnh AI Nhật Bản của NVIDIA đánh dấu một thông báo quan trọng về tương lai của Nhật Bản trong lĩnh vực trí tuệ nhân tạo.