NECと大阪大学、混雑状況によりスーパーコンピュータ「OCTOPUS」の負荷をMicrosoft Azureに移す技術を実装

国立大学法人大阪大学の大規模計算機システム(以下、スーパーコンピュータ)OCTOPUSは、研究者の需要増大により、計算要求から計算完了までの待ち時間が定常的に長時間になるという問題が深刻になりつつあった。これに対応するため、IaaS型クラウドサービスを利用した解決法が望まれていたが、これまでスーパーコンピュータと民間のクラウドサービスの同時利用は、利用者の管理、計算の管理等に相違があったため運用的な視点で困難であった。

そこで、大阪大学のサイバーメディアセンター(以下、CMC)伊達進准教授らの研究グループは、日本電気株式会社(以下、NEC)と日本マイクロソフト株式会社と共に、スーパーコンピュータ環境で利用者の計算需要が急激に増加した場合に、パブリッククラウドに計算要求や計算負荷を移すクラウドバースティングを実装した。

クラウドバースティングとは、IaaSで用いられる概念のことである。コンピューティングリソースの需要が極端に高まったピーク時(バースト)に、処理をクラウド上のリソースに迅速に切り替えることを可能にするものだ。内部リソースで需要を満たすのが難しいときや、企業ネットワーク内の容量が上限に達したときなどに行われる。

今回、スケジューラと呼ばれるジョブ管理機能、クラウドサービス制御機能の新たな開発を大阪大学とNECで行うことで、大幅なシステム変更・開発を必要とせず、OCTOPUSとMicrosoftのクラウドサービスAzureとの、クラウドバースティング環境が実現できました。これにより、OCTOPUSの負荷をAzure上に構築した計算機資源にオフロードする。

今後、2019年の内にOCTOPUSの利用者である研究者を対象に実証実験を行い、今回構築したOCTOPUS-Azureクラウドバースティング環境での検証を通じて、将来の本格運用に向けた技術課題の抽出を行う。また、医療データなどの取り扱いを想定したオンプレミス環境(※1)とパブリッククラウド環境間でのセキュアなデータ共有(※2)についても検証を行う。

同研究成果により、OCTOPUSのクラウドバースティング拡張が可能になると、利用者の待ち時間の縮減、ジョブスループット(※3)の向上が期待される。さらに、大型計算機を使った研究分野で計算機リソースの問題で解決できなかった事象を解析できるようになり、クラウド上の計算機資源を利用することで、これまでとは違ったアプローチで研究することも可能になるとした。

※1 自組織内で使用・利用・運用する情報システムの環境。
※2 医療データなど持出しがナイーブなデータを計算機センターで扱えるようにするためのデータストレージのセキュアな取扱い方法。計算処理を実行する時だけ、処理に必要な計算機、ネットワーク接続、データストレージを準備し、処理実行後はそれらを元通りセキュアに分割された状態に戻す。これにより、セキュリティ・レベルを高める事ができる。
※3 ある一定期間の間に実行できるジョブ数のこと。ジョブスループットが大きければ大きいほど、たくさんの利用者からの計算要求を処理できる。

Previous

オムロン、250kgまで搬送可能な自動搬送モバイルロボット「LD-250」を発売

エイムネクスト、部品・製品の識別や簡易検査を実現するAIソリューションを提供

Next