Time Series Datamining

研究概要

センサデータのような時間に従って記録された数値から知識を発見することを目的としています.
例えば図のように,株価の値動きからその後の予測を行ったり,体温や血液成分量データから患者の状態を予測したり,
気温や湿度から天候を予測するにはどうすればいいかを考えています.

研究事例

たとえば日射量,気温,湿度から太陽光パネルの発電電力を予測するためのルール抽出方法について研究しています.
例えば下図は日射量のデータです.



得られたルールは下記のような,人間が見て分かるようにIF-THEN形式で表現します.



作成したソフトウェア事例

いくつかの作成したソフトウェアについて紹介します.

Time series data Searcher

時系列データにたいして視覚的,直感的に検索します.
時系列データを日付と値を含んだCSV形式で入力できます.
GUIによって直感的な操作が可能になっています.

クエリダイアログでは検索したい時系列データのパタンをポインティングデバイスによって視覚的に記述可能です.
パタンマッチングはDynamic Time Warpingによって行っています.
このため各種設定値はダイアログによって変更可能です.

結果ダイアログでは検索結果にヒットした開始時間がリストアップされ,各種GUI操作によって視覚的にその形を確認可能です.
また,ここで検索にヒットした時系列データの部分のみをCSV形式でエクスポート可能です.

Time series data Analyzer

時系列データを検索,解析するためのツールです.
独自のインタフェースとクエリ言語によって柔軟なデータの検索が可能です.
さらに,Wekaのエンジンを使って検索したデータから機械学習が行えます.
また,Javaで作成されているため,プラットフォームに依存しにくいツールです.

メインウィンドウでは,時系列データとしてCSVファイルに対応しています.
はじめにCSVファイルを読み込んだ時点で自動的にデータベースを作成するため,
次回以降はそのデータベースファイルを指定することで処理が簡略化されます.

クエリダイアログでは視覚的に検索パタンを指定できます.
またいくつもの検索パタンを記述し,それらの組み合わせを指定することもできます.

検索結果表示画面では,検索結果が表示されます.
左側には時系列データ全体を示しており,中央部分には現在表示しているデータの形が表示されます.
また,ステータスバーには検索ヒット数が表示されています.

未来予測決定木画面は検索で手に入れた時系列データを基にして未来予測を行った結果です.
未来予測にはプラグインとしてWekaを使っています.