GMOインターネット株式会社は、生成AI向けGPUクラウドサービス「GMO GPUクラウド」において、GPUサーバのリソースを可視化できるモニタリングダッシュボード機能の提供を開始した。
同機能は、オープンソースのデータ可視化プラットフォーム「Grafana」を活用し、GPUサーバのリソース使用状況や、ジョブ管理システム「Slurm」のジョブ実行状況を直感的に可視化する。複数のジョブやワークロードの利用傾向をモニタリングすることで、GPUリソースの効率的な利用を支援する。
モニタリングダッシュボードでは、「パーティションにおける実行中ジョブ数」「パーティションにおける待機中ジョブ数」「ユーザ別の実行中ジョブ数」「ユーザ別の待機中ジョブ数」といった項目を一画面上で確認することができる。
活用シーンとしては、ジョブが実行されている時間帯を可視化し、実行が集中している時間があれば分散するよう調整したり、一定時間内におけるGPU利用率を確認し、パラメータを調整することでリソース効率を最適化したりといった例が挙げられている。
無料メルマガ会員に登録しませんか?
膨大な記事を効率よくチェック!
IoTに関する様々な情報を取材し、皆様にお届けいたします。

