急速なデジタル化が進む現代では、センサー機器、アクチュエーター、建物、車、電子機器などから発生するさまざまなIoTデータを、サーバーやクラウドに接続して利活用を目指すケースが増えているが、実際には膨大なデータを適切に収集・保管できず、有効活用できないケースがある。これらの膨大なIoTデータを収集・保管し、データを容易に抽出・ブレンドし、さまざまなビジネスデータと組み合わせることで、新たな知見を導き出すことが重要だ。
このような中、東芝デジタルソリューションズ株式会社が提供するスケールアウト型分散データベース「GridDB」と、株式会社日立製作所(以下、日立)が提供するデータ統合・分析基盤「Pentaho」との間で、同社の協力のもと、日立が動作検証を実施し、「GridDB」が「Pentaho」のデータソースとして利用可能であることを確認した。
同社では、スケールアウト型分散データベース「GridDB」を開発し、2013年5月から提供している。IoTやビッグデータに適した、「IoT指向のデータモデル」「高い性能」「高い拡張性」「高い信頼性と可用性」を特長とし、膨大な時系列データを効率よく蓄積し、性能をスケーラブルに発揮する。
一方、日立は、データの抽出・変換・出力といったデータ統合機能に特に強みを持つデータ統合・分析基盤「Pentaho」を2015年10月から提供している。「Pentaho」は、業務システムのデータやセンサーデータ、SNSデータといったさまざまなデータのフォーマットを迅速かつ容易に統一でき、データの不備や欠損を補完するクレンジング機能のほか、データ統合に必要な機能をコーディングレスで提供する。
今回の共同検証では、「GridDB」を「Pentaho」のデータソースとして利用し、「GridDB」のデータを「Pentaho」のデータ統合機能であるPentaho Data Integrationにより抽出し、データ加工のうえ、再度「GridDB」に出力できることを検証した。IoTデータ(センサー、ログ、履歴、株価など)を取り扱うには、分・秒周期、さらにそれ以下の周期で発生する膨大な時系列データを、一貫性や整合性を保った状態で収集・蓄積する必要がある。
今回の検証では、この膨大な時系列データの管理に強みを持つ「GridDB」から「Pentaho」への入力および「Pentaho」から「GridDB」への出力が正常に処理できることを確認した。ドラッグ&ドロップの視覚的な操作でデータ抽出・加工・出力することが可能な「Pentaho」と組み合わせることで、さまざまなIoTデータをより簡便にデータ加工し、「GridDB」に保存するための前工程処理の時間と工数を低減する。
なお、両社は、今後、データを分析・可視化するデータ分析機能Pentaho Business Analyticsについても動作検証を行なう。
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。