top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

NVIDIA、大規模データセットを効率的に扱えるXGBoostツールを発表

Generatived

23/9/8 9:31

データサイエンティストは、多くの場合、広範なデータセットで大規模なモデルをトレーニングするというタスクに取り組んでいる。堅牢な勾配ブースティング フレームワークであるXGBoostは、大規模な表形式データに対する速度とパフォーマンスにより人気のあるツールだ。理論的には、複数のGPUを使用すると計算能力が大幅に向上し、モデルのトレーニングが高速化されるはずだ。ただし、多くのユーザーは、並列コンピューティング用の柔軟なオープンソースPythonライブラリーであるDask XGBoostを通じてこの機能を活用するのが難しいと感じている。Dask XGBoostのトレーニングでは、トレーニングデータのロード、DataFrameのXGBoostのDMatrix形式への変換、および実際のモデルのトレーニング中など、さまざまな段階でメモリー不足(OOM)エラーの処理が行われることがよくある。これらのメモリーの問題に対処するのは困難だが、マルチGPUトレーニングの潜在的な利点により、やりがいがある。この記事では、複数のGPUでDask XGBoostを最適化し、メモリーエラーを管理する方法について説明する。大規模なデータセットでXGBoostをトレーニングすると、さまざまな課題が生じる。例えば、1億8,000万行と152列があり、メモリーにロードされると合計110 GBになるOtto Group製品分類チャレンジデータセットは、OOM問題とその解決方法を示すために使用される。取り扱う問題には、最新バージョンのRAPIDSと正しいバージョンのXGBoostを使用したインストール、環境変数の設定、OOMエラーの処理、さらなる高速化のためのUCX-pyの利用などが含まれる。RapidsaiチャネルのXGBoostは、RMMプラグインを有効にして構築されており、マルチGPUトレーニングに関して最適なパフォーマンスを提供する。

この記事を共有:

最新のニュース
ShoProドラキッズAI学習導入発表

ShoProドラキッズAI学習導入発表

25/1/15 4:30

ShoPro(東京)は、運営する幼児教室「ドラキッズ」にソニー・グローバルエデュケーションの「LOGIQ LABO」を導入する。

SHIFT生成AI業務活用支援サービス

SHIFT生成AI業務活用支援サービス

25/1/15 4:30

SHIFT(東京都港区)は、生成AIの業務活用を支援する「生成AIオペレーション品質向上サービス」の提供を開始すると発表した。

SEプラス ITフェスティバル開催

SEプラス ITフェスティバル開催

25/1/15 4:30

SEプラス(東京都千代田区)は、2025年2月26日に”SEcollege IT Festival 2025 in TOKYO 〜学び、つなぐ、IT〜”を開催する。

LayerXバクラク松本運輸導入成功

LayerXバクラク松本運輸導入成功

25/1/15 4:30

LayerX(東京都中央区)は、同社の業務効率化クラウドサービス「バクラク」シリーズが松本運輸倉庫(兵庫県尼崎市)に導入されたと発表した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived AI Logo

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

言語

最新のニュース
ShoProドラキッズAI学習導入発表

ShoProドラキッズAI学習導入発表

25/1/15 4:30

ShoPro(東京)は、運営する幼児教室「ドラキッズ」にソニー・グローバルエデュケーションの「LOGIQ LABO」を導入する。

SHIFT生成AI業務活用支援サービス

SHIFT生成AI業務活用支援サービス

25/1/15 4:30

SHIFT(東京都港区)は、生成AIの業務活用を支援する「生成AIオペレーション品質向上サービス」の提供を開始すると発表した。

SEプラス ITフェスティバル開催

SEプラス ITフェスティバル開催

25/1/15 4:30

SEプラス(東京都千代田区)は、2025年2月26日に”SEcollege IT Festival 2025 in TOKYO 〜学び、つなぐ、IT〜”を開催する。

LayerXバクラク松本運輸導入成功

LayerXバクラク松本運輸導入成功

25/1/15 4:30

LayerX(東京都中央区)は、同社の業務効率化クラウドサービス「バクラク」シリーズが松本運輸倉庫(兵庫県尼崎市)に導入されたと発表した。

bottom of page