Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1).webp)
Mengevaluasi Kinerja AI dengan Benchmark NVIDIA DGX Cloud
Generatived
19/3/25, 04.30
NVIDIA telah memperkenalkan DGX Cloud Benchmarking, rangkaian alat komprehensif yang dirancang untuk mengevaluasi kinerja beban kerja AI pada berbagai platform. Pendekatan pembandingan baru ini tidak hanya mempertimbangkan perangkat keras seperti GPU, tetapi juga dampak perangkat lunak infrastruktur, platform cloud, dan konfigurasi aplikasi. Tujuannya adalah untuk melampaui metrik tradisional yang mungkin tidak sepenuhnya menangkap kompleksitas sistem AI untuk mengukur kinerja dan total biaya kepemilikan beban kerja AI di dunia nyata dengan lebih akurat. Rangkaian pembandingan perusahaan ini bertujuan untuk memanfaatkan pengalaman NVIDIA dalam mengevaluasi perangkat keras dan infrastrukturnya sendiri guna menyediakan cara standar untuk mengevaluasi kinerja platform. Dengan melihat faktor-faktor seperti jumlah GPU, presisi data, dan kerangka kerja perangkat lunak, organisasi dapat lebih memahami trade-off yang terlibat dalam penskalaan operasi AI. Misalnya, peningkatan jumlah GPU dalam kluster pelatihan telah terbukti secara signifikan mengurangi waktu pelatihan, tetapi tanpa peningkatan biaya yang sesuai. DGX Cloud Benchmarking NVIDIA juga menyoroti pentingnya presisi dalam melatih model AI. Menggunakan presisi FP8 alih-alih BF16 meningkatkan throughput dan efisiensi biaya. Namun, rentang dinamis FP8 yang sempit memerlukan teknik khusus untuk mempertahankan stabilitas numerik. Alat pembanding ini menyediakan praktik terbaik dan hasil dasar untuk membantu organisasi memaksimalkan kinerja dengan presisi FP8.
Selain itu, pilihan kerangka kerja AI dapat berdampak signifikan pada kecepatan dan biaya pelatihan. Tolok ukur NVIDIA menunjukkan bahwa memilih kerangka kerja yang terus dioptimalkan dapat meningkatkan kinerja secara signifikan. Perusahaan menyediakan panduan ahli untuk membantu tim mengoptimalkan konfigurasi kerangka kerja dan memanfaatkan pengoptimalan perangkat lunak terbaru secara maksimal.
DGX Cloud Benchmarking NVIDIA siap mendukung kemajuan pesat industri AI dengan memperbarui alat secara berkala untuk mencerminkan model baru, platform perangkat keras, dan penyempurnaan perangkat lunak. Evolusi berkelanjutan ini dimaksudkan untuk memberi pengguna wawasan kinerja terbaru dan paling relevan, yang penting dalam bidang di mana teknologi berkembang dengan sangat cepat.
Bagikan artikel ini:
Tin tức mới nhất
NVIDIA BioNeMo Mempercepat Penelitian Medis di GKE
19/3/25, 04.30
Integrasi kecerdasan buatan ke dalam bidang penelitian medis menjanjikan percepatan signifikan dalam pengembangan perawatan baru.
Gemini Code Assist merilis alat pengkodean AI gratis
19/3/25, 04.30
Gemini Code Assist baru-baru ini meluncurkan asisten pengkodean AI gratis untuk pengembang perorangan, memperluas akses ke teknologi yang dulunya terbatas pada perusahaan besar.
Impact Tech Bermitra dengan Lovisa untuk Pertumbuhan Berbasis AI
19/3/25, 04.30
Impact Analytics™ telah mengumumkan kemitraan strategis dengan merek perhiasan mode Australia Lovisa.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
NVIDIA BioNeMo Mempercepat Penelitian Medis di GKE
19/3/25, 04.30
Integrasi kecerdasan buatan ke dalam bidang penelitian medis menjanjikan percepatan signifikan dalam pengembangan perawatan baru.
Gemini Code Assist merilis alat pengkodean AI gratis
19/3/25, 04.30
Gemini Code Assist baru-baru ini meluncurkan asisten pengkodean AI gratis untuk pengembang perorangan, memperluas akses ke teknologi yang dulunya terbatas pada perusahaan besar.
Impact Tech Bermitra dengan Lovisa untuk Pertumbuhan Berbasis AI
19/3/25, 04.30
Impact Analytics™ telah mengumumkan kemitraan strategis dengan merek perhiasan mode Australia Lovisa.