Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
Mengevaluasi Kinerja AI dengan Benchmark NVIDIA DGX Cloud
Generatived
19/3/25, 04.30
NVIDIA telah memperkenalkan DGX Cloud Benchmarking, rangkaian alat komprehensif yang dirancang untuk mengevaluasi kinerja beban kerja AI pada berbagai platform. Pendekatan pembandingan baru ini tidak hanya mempertimbangkan perangkat keras seperti GPU, tetapi juga dampak perangkat lunak infrastruktur, platform cloud, dan konfigurasi aplikasi. Tujuannya adalah untuk melampaui metrik tradisional yang mungkin tidak sepenuhnya menangkap kompleksitas sistem AI untuk mengukur kinerja dan total biaya kepemilikan beban kerja AI di dunia nyata dengan lebih akurat. Rangkaian pembandingan perusahaan ini bertujuan untuk memanfaatkan pengalaman NVIDIA dalam mengevaluasi perangkat keras dan infrastrukturnya sendiri guna menyediakan cara standar untuk mengevaluasi kinerja platform. Dengan melihat faktor-faktor seperti jumlah GPU, presisi data, dan kerangka kerja perangkat lunak, organisasi dapat lebih memahami trade-off yang terlibat dalam penskalaan operasi AI. Misalnya, peningkatan jumlah GPU dalam kluster pelatihan telah terbukti secara signifikan mengurangi waktu pelatihan, tetapi tanpa peningkatan biaya yang sesuai. DGX Cloud Benchmarking NVIDIA juga menyoroti pentingnya presisi dalam melatih model AI. Menggunakan presisi FP8 alih-alih BF16 meningkatkan throughput dan efisiensi biaya. Namun, rentang dinamis FP8 yang sempit memerlukan teknik khusus untuk mempertahankan stabilitas numerik. Alat pembanding ini menyediakan praktik terbaik dan hasil dasar untuk membantu organisasi memaksimalkan kinerja dengan presisi FP8.
Selain itu, pilihan kerangka kerja AI dapat berdampak signifikan pada kecepatan dan biaya pelatihan. Tolok ukur NVIDIA menunjukkan bahwa memilih kerangka kerja yang terus dioptimalkan dapat meningkatkan kinerja secara signifikan. Perusahaan menyediakan panduan ahli untuk membantu tim mengoptimalkan konfigurasi kerangka kerja dan memanfaatkan pengoptimalan perangkat lunak terbaru secara maksimal.
DGX Cloud Benchmarking NVIDIA siap mendukung kemajuan pesat industri AI dengan memperbarui alat secara berkala untuk mencerminkan model baru, platform perangkat keras, dan penyempurnaan perangkat lunak. Evolusi berkelanjutan ini dimaksudkan untuk memberi pengguna wawasan kinerja terbaru dan paling relevan, yang penting dalam bidang di mana teknologi berkembang dengan sangat cepat.
Bagikan artikel ini:
Tin tức mới nhất
NVIDIA Llama Nemotron Meningkatkan Kemampuan Inferensi AI
19/3/25, 04.30
NVIDIA hari ini mengumumkan NVIDIA Llama Nemotron, serangkaian model AI baru yang dirancang untuk meningkatkan kemampuan inferensi agen AI.
NVIDIA AgentIQ Memperlancar Pengembangan Agen AI
19/3/25, 04.30
NVIDIA memperkenalkan AgentIQ, pustaka sumber terbuka yang dirancang untuk memudahkan pembuatan aplikasi AI dengan menghubungkan dan mengoptimalkan tim agen AI.
NVIDIA Memperkenalkan Dynamo untuk Mendukung Inferensi AI
19/3/25, 04.30
Di GTC 2025, NVIDIA mengumumkan NVIDIA Dynamo, kerangka kerja penyajian inferensi sumber terbuka baru yang dirancang
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
NVIDIA Llama Nemotron Meningkatkan Kemampuan Inferensi AI
19/3/25, 04.30
NVIDIA hari ini mengumumkan NVIDIA Llama Nemotron, serangkaian model AI baru yang dirancang untuk meningkatkan kemampuan inferensi agen AI.
NVIDIA AgentIQ Memperlancar Pengembangan Agen AI
19/3/25, 04.30
NVIDIA memperkenalkan AgentIQ, pustaka sumber terbuka yang dirancang untuk memudahkan pembuatan aplikasi AI dengan menghubungkan dan mengoptimalkan tim agen AI.
NVIDIA Memperkenalkan Dynamo untuk Mendukung Inferensi AI
19/3/25, 04.30
Di GTC 2025, NVIDIA mengumumkan NVIDIA Dynamo, kerangka kerja penyajian inferensi sumber terbuka baru yang dirancang