社会の不確実性が高まる中、多くの企業では、日々発生する現場のデータを活用したビジネスの意思決定の迅速化やデータ分析の詳細化などの取り組みが活発化している。そのため近年では、複数拠点のデータを統合できるデータ利活用基盤をクラウドを利用して構築するケースも増えており、そのデータ利活用基盤には、大量のデータを高速に処理できるための性能と、大量のデータを蓄積するためのクラウドストレージの利用コストを抑えることが求められている。
株式会社日立製作所では、大量データの複雑な分析の高速化に適した「非順序型実行原理」を実装した超高速データベースエンジン「Hitachi Advanced Data Binder」(以下、HADB)を製造・流通、金融、社会、公共分野などに導入するとともに、発生データのリアルタイムでの取り込みやアマゾン ウェブ サービス(AWS)などのクラウド対応など、順次強化してきた。
このほど日立は、高速かつ低コストなデータ利活用基盤をAWS上で構築可能なHADBのベストプラクティス構成(検証済みのシステム構成)の提供を開始した。
HADBのベストプラクティス構成は、HADBをAWS上で利用するための環境として、性能面とコスト面のバランスを踏まえた実機検証済みの構成群である。具体的には、Amazon Elastic Compute Cloud(Amazon EC2)のインスタンス選定方法や、Amazon Simple Storage Service(Amazon S3)(※1)、Amazon Elastic Block Store(Amazon EBS)(※2)のボリューム構成・設定をDBデータの容量別にパターン化しており、このベストプラクティス構成を活用することで、システム検討の期間を短縮する。
同構成では、安価なAmazon S3にDBデータを格納するとともに、処理性能を向上させるために高速なAmazon EBSをDBデータのキャッシュとして利用する。これにより、AWSのクラウドストレージのコストを抑えた上で、高速なデータ処理を可能にした。
例えば、DB容量20TBをAmazon S3に格納し、キャッシュとしてAmazon EBSを2TB利用するHADBベストプラクティス構成において、DB容量を全てAmazon EBSに格納する構成と比べ、クラウドストレージの利用コストが下がり、AWS利用料を約2割低減する。これにより、AWS利用料にHADBライセンス料を合算した場合でも、同規模の一般的なデータ分析用DBサービスと比較して、約2割のコスト低減が見込めるという。
日立は、このベストプラクティス構成において、製造業などで用いられる4M(※3)の構成要素から製造工程をモデル化したベンチマークである4mbenchによる評価を実施し、クラウド上の一般的なデータ分析用DBサービスと比較して、7倍以上の処理速度を達成できることを確認した。
同ベストプラクティス構成を活用することで、データ利活用基盤のシステム検討期間を短縮できるうえ、クラウドの一般的なDBサービスよりも、利用料金を低減する。これにより、製造・流通のトレーサビリティなど、多種多様で大量なデータを多角的に分析するための高速なデータ利活用基盤を低コストで利用可能だ。
なお、Microsoft Azureに対応したHADBのベストプラクティス構成も今後提供する計画としている。
※1 Amazon S3:AWSが提供するクラウドストレージサービスの1つ。安価で耐久性が高く、大量のデータ保存に適する。
※2 Amazon EBS:AWSが提供するクラウドストレージサービスの1つ。特に処理速度を高速化したいデータの保存に適する。
※3 4M:Man(人)、Machine(機械)、Method(方法)、Material(材料)の4つの要素からなるフレームワーク。製品の品質管理などに活用する。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。