東芝デジタルソリューションズのスケールアウト型分散データベース「GridDB」と日立のデータ統合・分析基盤「Pentaho」、動作検証を実施

急速なデジタル化が進む現代では、センサー機器、アクチュエーター、建物、車、電子機器などから発生するさまざまなIoTデータを、サーバーやクラウドに接続して利活用を目指すケースが増えているが、実際には膨大なデータを適切に収集・保管できず、有効活用できないケースがある。これらの膨大なIoTデータを収集・保管し、データを容易に抽出・ブレンドし、さまざまなビジネスデータと組み合わせることで、新たな知見を導き出すことが重要だ。

このような中、東芝デジタルソリューションズ株式会社が提供するスケールアウト型分散データベース「GridDB」と、株式会社日立製作所(以下、日立)が提供するデータ統合・分析基盤「Pentaho」との間で、同社の協力のもと、日立が動作検証を実施し、「GridDB」が「Pentaho」のデータソースとして利用可能であることを確認した。

同社では、スケールアウト型分散データベース「GridDB」を開発し、2013年5月から提供している。IoTやビッグデータに適した、「IoT指向のデータモデル」「高い性能」「高い拡張性」「高い信頼性と可用性」を特長とし、膨大な時系列データを効率よく蓄積し、性能をスケーラブルに発揮する。

一方、日立は、データの抽出・変換・出力といったデータ統合機能に特に強みを持つデータ統合・分析基盤「Pentaho」を2015年10月から提供している。「Pentaho」は、業務システムのデータやセンサーデータ、SNSデータといったさまざまなデータのフォーマットを迅速かつ容易に統一でき、データの不備や欠損を補完するクレンジング機能のほか、データ統合に必要な機能をコーディングレスで提供する。

今回の共同検証では、「GridDB」を「Pentaho」のデータソースとして利用し、「GridDB」のデータを「Pentaho」のデータ統合機能であるPentaho Data Integrationにより抽出し、データ加工のうえ、再度「GridDB」に出力できることを検証した。IoTデータ(センサー、ログ、履歴、株価など)を取り扱うには、分・秒周期、さらにそれ以下の周期で発生する膨大な時系列データを、一貫性や整合性を保った状態で収集・蓄積する必要がある。

今回の検証では、この膨大な時系列データの管理に強みを持つ「GridDB」から「Pentaho」への入力および「Pentaho」から「GridDB」への出力が正常に処理できることを確認した。ドラッグ&ドロップの視覚的な操作でデータ抽出・加工・出力することが可能な「Pentaho」と組み合わせることで、さまざまなIoTデータをより簡便にデータ加工し、「GridDB」に保存するための前工程処理の時間と工数を低減する。

なお、両社は、今後、データを分析・可視化するデータ分析機能Pentaho Business Analyticsについても動作検証を行なう。

Previous

NTTデータ、四国アライアンスと共同でビジネスマッチング事業におけるAI活用実証実験を開始

IDC、2019年度情報セキュリティ対策投資額は前年度と変わらない企業が6割と発表

Next