時系列データを扱う大変さ

更新日:1月12日



こんにちは、小田原です。

前回に引き続き、時系列データについて紐解いていきます。

前回の記事:「時系列データってなんだ?

今回は、「時系列データを扱う大変さ」についてお話します。



▶時系列データを扱うのは大変!

 

時系列データを計測して蓄積し、利用するには非常に手間がかかります。


どういうことか、例え話で理解してみましょう。


部屋をエアコンで暖めることを想像してください。

ここでの時系列データは「電力」と「室温」の2つとしましょう。


人は感覚的に2つのデータの時間的な相関を感じ取れるので、以下のように察することができます。


人の感覚を基準にすると時系列データを扱うことは、そんなに難しくない気がしますね。


では、これを人の感覚ではなく、コンピュータシステムで「電力を消費→室温が上がる」という電力と室温の相関関係を確認するとしましょう。

人の感覚で判断するよりも、定量的で正確な判断ができます。


下の図でその作業を見てみます。


作業が多いですね。数値化、グラフ化までそれなりの時間が必要です。


また、図の「よくある悩み」の通り、それぞれのステップでさまざまな問題に直面しそうです。

それに最後の数値化ができたとしても、1日単位で作業を繰り返す場合は非常に面倒だと感じます。


そうなると、「この作業を自動化できないのか?」という疑問や要望が出てきます。




▶自動化はまだ難しい

 

現時点では、一気通貫で自動化することは難しいです。

有名なデータ分析プラットフォームの「DataRobot」では、データ分析自動化サービスを提供しています。


こちらのサービスを利用する場合でも、分析に適したデータを前もって準備する必要があり、データ計測・蓄積・管理はサービスから切り離されています。


そして、自社で時系列データを管理するにしても難易度が高いため、自動化はなかなか実現しません。 (「難易度が高い」については、次回以降の記事でお話します。)

弊社製品の時系列データベース「CLOUDSHIP」は個々の時系列データの垣根を取り去って、任意の用途で時系列データを柔軟に扱えるよう管理します。

他のアプリケーションとも連携が可能なため、システムを自動化する一助となるでしょう。

また、「RealBoard」を活用することによって、CLOUDSHIPに蓄積した生のデータを即座に可視化できます。

多様な可視化が可能なため、「必要なデータが問題なく取得できているか」、「取得したデータは果たして仮説通り有益なデータなのか」を早期に判断できます。

詳しく知りたい方は↓

CLOUDSHIP&RealBoardの紹介

RealBoardの操作説明動画

次回は、「時系列データを取り扱うときに意識すべき7つのポイント」について、お話します。


お楽しみに。


閲覧数:74回

最新記事

すべて表示