Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
NVIDIA merilis alat XGBoost untuk menangani kumpulan data besar secara efisien
Generatived
23/9/8 9:31
Ilmuwan data sering kali ditugaskan untuk melatih model besar pada kumpulan data yang luas. XGBoost, kerangka kerja peningkatan gradien yang kuat, adalah alat yang populer karena kecepatan dan kinerjanya pada data tabel besar. Secara teori, penggunaan beberapa GPU akan meningkatkan daya komputasi secara signifikan dan mempercepat pelatihan model. Namun, banyak pengguna merasa kesulitan untuk memanfaatkan fungsi ini melalui Dask XGBoost, pustaka Python open source yang fleksibel untuk komputasi paralel. Pelatihan Dask XGBoost sering kali melibatkan penanganan kesalahan kehabisan memori (OOM) di berbagai tahap, termasuk memuat data pelatihan, mengonversi DataFrame dari format XGBoost ke DMatrix, dan selama pelatihan model sebenarnya. Mengatasi masalah memori ini memang sulit, namun potensi manfaat dari pelatihan multi-GPU menjadikannya bermanfaat. Artikel ini menjelaskan cara mengoptimalkan Dask XGBoost dengan banyak GPU dan mengelola kesalahan memori. Melatih XGBoost pada kumpulan data besar menghadirkan berbagai tantangan. Misalnya, kumpulan data Tantangan Klasifikasi Produk Otto Group, yang memiliki 180 juta baris dan 152 kolom dan total 110 GB saat dimuat ke dalam memori, digunakan untuk mendemonstrasikan masalah OOM dan solusinya. Masalah yang dibahas termasuk menginstal RAPIDS versi terbaru dan versi XGBoost yang benar, mengatur variabel lingkungan, menangani kesalahan OOM, dan memanfaatkan UCX-py untuk percepatan lebih lanjut. XGBoost di saluran Rapidsai dibangun dengan plugin RMM yang diaktifkan untuk memberikan kinerja optimal saat melakukan pelatihan multi-GPU.
Bagikan artikel ini:
Berita terkini
Perluasan dukungan pembuatan dokumen AI Persol BP Design
25/1/16 5:00
Persol Business Process Design (Minato-ku, Tokyo) telah menambahkan versi beta dari fitur baru yang disebut "HanashiAI" ke layanan organisasi otomatis file bertenaga AI "AUTOMETA."
Faber Mielca SEO/SEM, Pemimpin Penghargaan ITreview
25/1/16 5:00
Platform SEO/SEM "Mielca SEO/SEM" milik Faber Company (Minato-ku, Tokyo) telah dipilih sebagai "Pemimpin" dalam "ITreview Grid Award 2025 Winter" milik ITcloud.
Laboratorium Matsuo dan Explaza menjalin aliansi modal
25/1/16 5:00
Laboratorium Matsuo (Bunkyo-ku, Tokyo) telah mengumumkan aliansi modal dan bisnis dengan Explaza (Minato-ku, Tokyo).
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Profil perusahaan
Berita terkini
Perluasan dukungan pembuatan dokumen AI Persol BP Design
25/1/16 5:00
Persol Business Process Design (Minato-ku, Tokyo) telah menambahkan versi beta dari fitur baru yang disebut "HanashiAI" ke layanan organisasi otomatis file bertenaga AI "AUTOMETA."
Faber Mielca SEO/SEM, Pemimpin Penghargaan ITreview
25/1/16 5:00
Platform SEO/SEM "Mielca SEO/SEM" milik Faber Company (Minato-ku, Tokyo) telah dipilih sebagai "Pemimpin" dalam "ITreview Grid Award 2025 Winter" milik ITcloud.
Laboratorium Matsuo dan Explaza menjalin aliansi modal
25/1/16 5:00
Laboratorium Matsuo (Bunkyo-ku, Tokyo) telah mengumumkan aliansi modal dan bisnis dengan Explaza (Minato-ku, Tokyo).