top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

NVIDIA merilis alat XGBoost untuk menangani kumpulan data besar secara efisien

Generatived

23/9/8 9:31

Ilmuwan data sering kali ditugaskan untuk melatih model besar pada kumpulan data yang luas. XGBoost, kerangka kerja peningkatan gradien yang kuat, adalah alat yang populer karena kecepatan dan kinerjanya pada data tabel besar. Secara teori, penggunaan beberapa GPU akan meningkatkan daya komputasi secara signifikan dan mempercepat pelatihan model. Namun, banyak pengguna merasa kesulitan untuk memanfaatkan fungsi ini melalui Dask XGBoost, pustaka Python open source yang fleksibel untuk komputasi paralel. Pelatihan Dask XGBoost sering kali melibatkan penanganan kesalahan kehabisan memori (OOM) di berbagai tahap, termasuk memuat data pelatihan, mengonversi DataFrame dari format XGBoost ke DMatrix, dan selama pelatihan model sebenarnya. Mengatasi masalah memori ini memang sulit, namun potensi manfaat dari pelatihan multi-GPU menjadikannya bermanfaat. Artikel ini menjelaskan cara mengoptimalkan Dask XGBoost dengan banyak GPU dan mengelola kesalahan memori. Melatih XGBoost pada kumpulan data besar menghadirkan berbagai tantangan. Misalnya, kumpulan data Tantangan Klasifikasi Produk Otto Group, yang memiliki 180 juta baris dan 152 kolom dan total 110 GB saat dimuat ke dalam memori, digunakan untuk mendemonstrasikan masalah OOM dan solusinya. Masalah yang dibahas termasuk menginstal RAPIDS versi terbaru dan versi XGBoost yang benar, mengatur variabel lingkungan, menangani kesalahan OOM, dan memanfaatkan UCX-py untuk percepatan lebih lanjut. XGBoost di saluran Rapidsai dibangun dengan plugin RMM yang diaktifkan untuk memberikan kinerja optimal saat melakukan pelatihan multi-GPU.

Bagikan artikel ini:

Berita terkini
Perusahaan teknologi merilis white paper tentang rencana investasi CEO AI

Perusahaan teknologi merilis white paper tentang rencana investasi CEO AI

25/1/17 4:30

Survei global terkini terhadap perusahaan teknologi terkemuka, yang dilakukan bekerja sama dengan WSJ Intelligence, mengungkap prioritas strategis para CEO untuk investasi teknologi.

Guardant Health dan ConcertAI Akan Menyediakan Sumber Data Kanker Terintegrasi Baru

Guardant Health dan ConcertAI Akan Menyediakan Sumber Data Kanker Terintegrasi Baru

25/1/17 4:30

Guardant Health, Inc. dan ConcertAI telah mengumumkan kolaborasi untuk menyediakan perusahaan biofarmasi dengan sumber daya data dunia nyata (RWD) multimoda baru.

MangoBoost Mengumumkan Mango LLMBoost untuk Efisiensi AI

MangoBoost Mengumumkan Mango LLMBoost untuk Efisiensi AI

25/1/17 4:30

MangoBoost telah meluncurkan Mango LLMBoost™, perangkat lunak pengoptimalan sistem baru yang ditujukan untuk meningkatkan kinerja pusat data AI.

SentinelOne Meningkatkan Purple AI dengan Dukungan Multibahasa

SentinelOne Meningkatkan Purple AI dengan Dukungan Multibahasa

25/1/17 4:30

SentinelOne telah mengumumkan peningkatan pada analis keamanan Purple AI-nya.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Perusahaan teknologi merilis white paper tentang rencana investasi CEO AI

Perusahaan teknologi merilis white paper tentang rencana investasi CEO AI

25/1/17 4:30

Survei global terkini terhadap perusahaan teknologi terkemuka, yang dilakukan bekerja sama dengan WSJ Intelligence, mengungkap prioritas strategis para CEO untuk investasi teknologi.

Guardant Health dan ConcertAI Akan Menyediakan Sumber Data Kanker Terintegrasi Baru

Guardant Health dan ConcertAI Akan Menyediakan Sumber Data Kanker Terintegrasi Baru

25/1/17 4:30

Guardant Health, Inc. dan ConcertAI telah mengumumkan kolaborasi untuk menyediakan perusahaan biofarmasi dengan sumber daya data dunia nyata (RWD) multimoda baru.

MangoBoost Mengumumkan Mango LLMBoost untuk Efisiensi AI

MangoBoost Mengumumkan Mango LLMBoost untuk Efisiensi AI

25/1/17 4:30

MangoBoost telah meluncurkan Mango LLMBoost™, perangkat lunak pengoptimalan sistem baru yang ditujukan untuk meningkatkan kinerja pusat data AI.

SentinelOne Meningkatkan Purple AI dengan Dukungan Multibahasa

SentinelOne Meningkatkan Purple AI dengan Dukungan Multibahasa

25/1/17 4:30

SentinelOne telah mengumumkan peningkatan pada analis keamanan Purple AI-nya.

bottom of page