目次 1. はじめに センサーと設置場所 不要なデータの除去 データ前処理 A) 機械学習ための時系列データ前処理 B) 2 つ部分時系列の距離計算 クラスタリングでの異常検知 A

Similar documents
Microsoft PowerPoint - 統計科学研究所_R_重回帰分析_変数選択_2.ppt

Microsoft PowerPoint - ad11-09.pptx

データセンターの効率的な資源活用のためのデータ収集・照会システムの設計

0 21 カラー反射率 slope aspect 図 2.9: 復元結果例 2.4 画像生成技術としての計算フォトグラフィ 3 次元情報を復元することにより, 画像生成 ( レンダリング ) に応用することが可能である. 近年, コンピュータにより, カメラで直接得られない画像を生成する技術分野が生

多変量解析 ~ 重回帰分析 ~ 2006 年 4 月 21 日 ( 金 ) 南慶典

Microsoft Word - 操作マニュアル-Excel-2.doc

Microsoft Word - lec_student-chp3_1-representative

0 スペクトル 時系列データの前処理 法 平滑化 ( スムージング ) と微分 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

計算機シミュレーション

Łñ“’‘‚2004

プリント


RMS(Root Mean Square value 実効値 ) 実効値は AC の電圧と電流両方の値を規定する 最も一般的で便利な値です AC 波形の実効値はその波形から得られる パワーのレベルを示すものであり AC 信号の最も重要な属性となります 実効値の計算は AC の電流波形と それによって

Kumamoto University Center for Multimedia and Information Technologies Lab. 熊本大学アプリケーション実験 ~ 実環境における無線 LAN 受信電波強度を用いた位置推定手法の検討 ~ InKIAI 宮崎県美郷

Microsoft PowerPoint - 統計科学研究所_R_主成分分析.ppt

0 部分的最小二乗回帰 Partial Least Squares Regression PLS 明治大学理 学部応用化学科 データ化学 学研究室 弘昌

自己紹介 名前 : 竹田卓也 年齢 : 20 歳 ( 大学生 ) 経歴 : 人工知能歴 1ヶ月プログラミング歴 5 年くらい 言語 : PythonとかJavaとかGoとか 趣味 : オンライン オフラインゲーム 2

PowerPoint プレゼンテーション

2. 時系列分析 プラットフォームの使用法 JMP の 時系列分析 プラットフォームでは 一変量の時系列に対する分析を行うことができます この章では JMP のサンプルデ ータを用いて このプラットフォームの使用法をご説明します JMP のメニューバーより [ ヘルプ ] > [ サンプルデータ ]

パソコンシミュレータの現状

Microsoft PowerPoint - R-stat-intro_04.ppt [互換モード]

板バネの元は固定にします x[0] は常に0です : > x[0]:=t->0; (1.2) 初期値の設定をします 以降 for 文処理のため 空集合を生成しておきます : > init:={}: 30 番目 ( 端 ) 以外については 初期高さおよび初速は全て 0 にします 初期高さを x[j]

DVIOUT

画像類似度測定の初歩的な手法の検証

RCDIGITAL

周期時系列の統計解析 (3) 移動平均とフーリエ変換 nino 2017 年 12 月 18 日 移動平均は, 周期時系列における特定の周期成分の消去や不規則変動 ( ノイズ ) の低減に汎用されている統計手法である. ここでは, 周期時系列をコサイン関数で近似し, その移動平均により周期成分の振幅

Microsoft PowerPoint - 測量学.ppt [互換モード]

tokyo_t3.pdf

1. 気温と産業の関係 2. 気温と販売数の関係の分析 過去の気温データをダウンロードする 時系列グラフを描く 気温と販売の関係を調べる 散布図を描く 定量的な関係を求める 気温から販売数を推定する 2 週間先の気温予測を取得し 活用する 気温以外の要素の影響 3. 予報精度 過去の 1 か月予報

Rの基本操作

Microsoft PowerPoint - 三次元座標測定 ppt

ファイナンスのための数学基礎 第1回 オリエンテーション、ベクトル

受信機時計誤差項の が残ったままであるが これをも消去するのが 重位相差である. 重位相差ある時刻に 衛星 から送られてくる搬送波位相データを 台の受信機 でそれぞれ測定する このとき各受信機で測定された衛星 からの搬送波位相データを Φ Φ とし 同様に衛星 からの搬送波位相データを Φ Φ とす

PowerPoint プレゼンテーション

統計的データ解析

Microsoft PowerPoint ppt

IPSJ SIG Technical Report Vol.2014-IOT-27 No.14 Vol.2014-SPT-11 No /10/10 1,a) 2 zabbix Consideration of a system to support understanding of f

第1章 低下から停滞に転じた鉱工業生産

13章 回帰分析

<4D F736F F D20837E836A837D E82CC88D98FED E12E646F63>

スライド 1

PowerPoint プレゼンテーション

PrimerArray® Analysis Tool Ver.2.2

データ解析

14 化学実験法 II( 吉村 ( 洋 mmol/l の半分だったから さんの測定値は くんの測定値の 4 倍の重みがあり 推定値 としては 0.68 mmol/l その標準偏差は mmol/l 程度ということになる 測定値を 特徴づけるパラメータ t を推定するこの手

WISS 2018 [2 4] [5,6] Query-by-Dancing Query-by- Dancing Cao [1] OpenPose 2 Ghias [7] Query by humming Chen [8] Query by rhythm Jang [9] Query-by-tapp

簿記教育における習熟度別クラス編成 簿記教育における習熟度別クラス編成 濱田峰子 要旨 近年 学生の多様化に伴い きめ細やかな個別対応や対話型授業が可能な少人数の習熟度別クラス編成の重要性が増している そのため 本学では入学時にプレイスメントテストを実施し 国語 数学 英語の 3 教科については習熟

SNC-HM662 EdgeStorage manual J

1.民営化

CAEシミュレーションツールを用いた統計の基礎教育 | (株)日科技研

SAP11_03

Microsoft Word - 1 color Normalization Document _Agilent version_ .doc

Microsoft Word - 頻度解析プログラム概要

Microsoft PowerPoint - pr_12_template-bs.pptx

初めてのプログラミング

Microsoft Word - ピーク分離.docx

1/10 平成 29 年 3 月 24 日午後 1 時 37 分第 5 章ローレンツ変換と回転 第 5 章ローレンツ変換と回転 Ⅰ. 回転 第 3 章光速度不変の原理とローレンツ変換 では 時間の遅れをローレンツ変換 ct 移動 v相対 v相対 ct - x x - ct = c, x c 2 移動

Microsoft Word - thesis.doc

振動学特論火曜 1 限 TA332J 藤井康介 6 章スペクトルの平滑化 スペクトルの平滑化とはギザギザした地震波のフーリエ スペクトルやパワ スペクトルでは正確にスペクトルの山がどこにあるかはよく分からない このようなスペクトルから不純なものを取り去って 本当の性質を浮き彫

Microsoft PowerPoint pptx

横浜市環境科学研究所

経営統計学

目次 1. はじめに Excel シートからグラフの選択 グラフの各部の名称 成績の複合グラフを作成 各生徒の 3 科目の合計点を求める 合計点から全体の平均を求める 標準偏差を求める...

AI技術の紹介とセンサーデータ解析への応用

< F55542D303996E291E894AD8CA9365F834E E95AA90CD836D815B>

DataConverterユーザーズマニュアル

1. 多変量解析の基本的な概念 1. 多変量解析の基本的な概念 1.1 多変量解析の目的 人間のデータは多変量データが多いので多変量解析が有用 特性概括評価特性概括評価 症 例 主 治 医 の 主 観 症 例 主 治 医 の 主 観 単変量解析 客観的規準のある要約多変量解析 要約値 客観的規準のな

ボルツマンマシンの高速化

PowerPoint プレゼンテーション

「運用ログを活用したアノマリ事象の検知と活用に関する研究」

memo

NGSデータ解析入門Webセミナー

Microsoft PowerPoint - 時系列解析(10)_講義用.pptx

製品開発の現場では 各種のセンサーや測定環境を利用したデータ解析が行われ シミュレーションや動作検証等に役立てられています しかし 日々収集されるデータ量は増加し 解析も複雑化しており データ解析の負荷は徐々に重くなっています 例えば自動車の車両計測データを解析する場合 取得したデータをそのまま解析

Microsoft PowerPoint - 資料04 重回帰分析.ppt

OpRisk VaR3.2 Presentation

PowerPoint Presentation

Microsoft PowerPoint - R-stat-intro_12.ppt [互換モード]

PowerPoint プレゼンテーション

Transcription:

IoT センサーデータの分析 平成 30 年 3 月 一般社団法人広島県中小企業診断協会 ニューロビジネス研究会

目次 1. はじめに...- 1-2. センサーと設置場所...- 1-3. 不要なデータの除去...- 1-4. データ前処理...- 4 - A) 機械学習ための時系列データ前処理...- 4 - B) 2 つ部分時系列の距離計算...- 5-5. クラスタリングでの異常検知...- 6 - A) ユークリッド距離ベースでの分類結果...- 6 - B) 動的時間伸縮法ベースで分類した結果...- 7 - a. Whole Data Scale...- 7 - b. Short Time Series Scale...- 9-6. オートエンコーダによる復元データ...- 10 - A) オートエンコーダモデル...- 10 - B) 復元データの結果...- 11 - C) 復元データの評価...- 11-7. エンコーダーしたデータの分類...- 13 - A) エンコーダーしたデータの取り出し...- 13 - B) エンコーダーしたデータの分類結果...- 14-8. LSTM モデルによるデータ予測...- 16 - A) LSTM モデルとデータ前処理...- 16 - a. モデル...- 16 - b. データ前処理...- 17 - B) 予測結果...- 17 - a. 1 秒後の予測...- 17 - b. 5 秒後の予測結果...- 18 - c. 18 秒後の予測結果...- 18-9. まとめ...- 19 - A) 統計的なクラスタリングによる分析...- 19 - B) オートエンコーダによる復元データ...- 19 - C) LSTM モデルによるデータ予測...- 20 - 参考文献...- 20 -

1. はじめに近年 センサー機器の性能向上やクラウドプラットフォーム等の発達により センサーデータを様々な産業で活用する環境が急速に整備され 安価なセンサーを用いてデータを取得することも出来るようになってきた 蓄積されたデータは 活用されなければ価値を生み出さないが 目的を明確にしてデータ分析を行うことで データにはその価値を最大にする可能性を秘めている 企業において とりわけ中小企業では センサーから得られたデータを分析することで何が分かり どのように事業に活かせるのかが明瞭でないため センサー導入からデータ活用に進んでいないところが多いのではないかと考えられる この様な状況から 広島県中小企業診断協会におけるニューロビジネス研究会では 広島県内の中小企業の協力を得て 安価なセンサーを試験的に取り付け 取得したデータを用いてデータの分析を実施した データの分析として 先ずは統計的なクラスタリングを用い 更にニューラルネットワークを用いたディープラーニングによるデータの異常検知と時系列データの予測を行った 2. センサーと設置場所センサーは 図 1 に示す ALPS 社製 IoT Smart Module を用い 地磁気と加速度の 6 軸 UV 照度 湿度 温度 気圧を 1 秒間隔で取得した 本センサーの特徴は 低消費電力通信の Bluetooth で通信を行う 小型かつ安価 ( 税別 9,800 円 ) なセンサーネットワークである 図 1: ALPS 社製センサー (IoT Smart Module) 本センサーは 広島県大竹市にあるゴム プラスチックを製造する広合化学株式会社 のブロー成型機の稼動部に取り付けた 3. 不要なデータの除去 今回取得したデータは 2018 年 1 月 22 日から 2018 年 2 月 8 日までの期間のブロー成 型機の稼動データで 16 個の CSV 形式のファイルに分割されて記録されている - 1 -

図 2:IoT データファイル このデータのサンプリングは1 秒で Time, Index, Battery, Mag_X[uT], Mag_Y[uT], Mag_Z[uT], Acc_X[G], Acc_Y[G], Acc_Z[G], UV-A[mW/cm2], AmbientLight[Lx], Humidity[%RH], Temperature[degC], Pressure[hPa] の 14 個の時系列数値データを含んでいる 各データファイルには 勤務日 ( 平日 ) に記録された有効なデータファイルと稼動していない週末のデータファイルが含まれている 14 個の時系列データの中には ブロー成型機の稼動に直接影響がないと考えられるデータも含まれており ime, Index, Battery, UV-A[nW/cm2], AmbientLight[Lx], Humidity[%RH], Temperature[degC], Pressure[hPa] という 8 種類のデータは除去した - 2 -

図 2:IoT データの 11 時系列のグラフ 残りの 6 種類のデータ Mag_X[uT], Mag_Y[uT], Mag_Z[uT], Acc_X[G], Acc_Y[G], Acc_Z[G] を用いて分析を行った 機械の稼働時間 (8AM~7PM 残業ありの日は 8AM~9PM) の間は データとして有効な情報を持っているが 稼動していない時間は分析データから取り除いた - 3 -

図 3: 運行時間と休暇時間にある磁場と加速度のデータ 4. データ前処理 A) 機械学習ための時系列データ前処理機械学習アルゴリズムで学習するため この時系列データをスライディングウィンドウで分割した ブロー成型機による製品の作成サイクルが 18 秒なので スライディングウィンドウの分割幅は 18 秒に設定した - 4 -

図 4 には 時系列データをスライディングウィンドウで小さな部分時系列に分割した 例を示す Input: A long time series Output: A set of shorter time series 図 4: 時系列データの分割例 B) 2 つ部分時系列の距離計算機械学習では 区分けされた時系列を部分時系列と呼ぶ 機械学習アルゴリズムで学習する前に部分時系列ごとの互いの距離を計算した 部分時系列の互い距離を計算するため ユークリッド距離と動的時間伸縮法 (DTW) を使用した 時系列データにある部分時系列の互い距離を計算し 距離行列を算出した 図 5 は 部分時系列 Q と C のユークリッド距離の計算方法を表す 図 5: 時系列のユークリッド距離の方程式と計算方法 ユークリッド距離は他の複雑なアプローチ [6] に比べて 有利な点が多くある しかし [2] の研究により ユークリッド距離は 同じ長さの部分時系列でしか利用しない 異常とノイズは取り扱わない shifting, uniform amplitude scaling, uniform time scaling, uniform biscaling, time warping and non-uniform amplitude scaling の 6 つのシグナル変換により影響を受けやすい [3] などの欠点もある 一方 動的時間伸縮法(DTW) はユークリッド距離より適用領域が広いと言われている ([2]) 参考文献 [1] には DTW について詳しく説明されて - 5 -

いる 図 6 は DTW 距離の方程式と計算方法を表す 図 6: 時系列 Q と C の DTW 距離の計算方法 行列の各 w k = (i, j) k は Q の点 i th と C の点 j th のユークリッド距離である 5. クラスタリングでの異常検知距離行列を計算した後 SVM one-class clustering アルゴリズムを利用し 類以な部分時系列を 1 つのグループとし 残りの部分時系列は異常としてみなした A) ユークリッド距離ベースでの分類結果図 7 には ユークリッド距離ベースで 2018 年 01 月 22 日のデータを分類した結果を表す 図 7: ユークリッド距離で 2018 年 01 月 22 日のデータを分類した結果 図 8 には クラスタリングアルゴリズムを利用した異常検知の例を表す 左側はクラス タリングアルゴリズムで異常が 3 ヶ所検知されている 右側はその異常を時系列で表した ものである - 6 -

Normal 図 8: ユークリッド距離で分類して 検知された異常 B) 動的時間伸縮法ベースで分類した結果 ノーマライズされた時系列データは DTW 距離で行列距離を計算した 今回のデータは whole-data scale と short time series scale の 2 つ方法で正規化した a. Whole Data Scale - 図 4 と同様に 時系列データを各部分時系列に区分ける前に 時系列データは次 の方程式により正規化した = X min (X) max() min () - 図 9 には whole data scale で正規化されたデータを DTW 距離で分類した結果 を表す この結果は DTW ベースで分類した結果と呼ぶ - 7 -

図 9: whole data scale + DTW 距離の分類結果 - DTW ベースとユークリッドベースで分類した結果を比べると 双方で検知され た異常 ( 外れ値 ) は同じになった ( 図 10) Euclidean Distance Normal Normal Outliers DTW Distance - 8 -

Euclidean Distance Normal Outliers Normal Outliers DTW Distance 図 10: ユークリッドベースと動的時間伸縮法ベースで検知された異常 ( 外れ値 ) b. Short Time Series Scale - 標準偏差 (standard deviation scale) は次の方程式により正規化する = TS mean(ts) () ただし TS は部分時系列で 時系列データから区分けした - short time series scale で正規化したデータを用いて DTW ベースで分類した結 果を図 11 に表す このアプローチによる分類では 正常と異常 ( 外れ値 ) の分離 は明確にならなかった - 9 -

図 11: short time scale で正規化されたデータを DTW 距離で分類した結果 (2018 年 01 月 22 日のデータ ) 6. オートエンコーダによる復元データ A) オートエンコーダモデル Tensorflow のディープラーニングライブラリを利用して オートエンコーダモデルを構成した このモデルはエンコーダーとデコーダーの 2 つ部分があり エンコーダーはインプット層 128-neuron 層 64-neuron 層 32-neuron 層の 4 層で構成した デコーダーは 32-neuron 層 64-neuron 層 128-neuron 層 アウトプット層の 4 層で構成した オートエンコーダモデルを学習するため IoT データの時系列をインプットとしてモデルに入力して それからモデルのアウトプットとインプットを比較した インプットとアウトプットの差は損失と呼ばれ オートエンコーダモデルの重みとバイアスを更新するために利用した Input Output 図 12: 時系列データのオートエンコーダモデル - 10 -

B) 復元データの結果 図 13: オートエンコーダモデルの結果 青い線はインプットで 赤い線はアウトプットである オートエンコーダモデルの復元データの結果を図 13 に表す オートエンコーダモデルは磁場データ (Mag_X[uT], Mag_Y[uT], Mag_Z[uT]) に対して 復元データの再現性が良く アウトプットデータ ( 赤い線 ) とインプットデータ ( 青い線 ) がほぼ重なっている しかし 加速度のデータ (Acc_x[G], Acc_y[G], Acc_z[G]) については モデルの復元性が良くなかった その原因は 加速度が変位の 2 階微分のため 今回のサンプリング間隔では時間変動が大きく データがランダムになったからと考えられる C) 復元データの評価オートエンコーダモデルのインプットとアウトプットの差を評価するため Different Average (DA) 値を定義する オートエンコーダのインプット時系列 A とアウトプット時系列 B に対して A と B の DA 値は次により定義される!"#$(%) (, ) = &'( - 11 -

(,) = Diff(A,B) -./0h() オートエンコーダモデルでは インプットの長さとアウトプットの長さは等しい IoT データの DA 値は図 14 に表す ちなみに オートエンコーダを学習する前 インプットデ ータは [0, 1] 範囲に正規化した 図 14 から 2018 年 01 月 31 日の DA 値が最小値である事が わかった 理由は 2018 年 01 月 31 日のデータの中に大幅な変動があり 正規化したデー タの値が小さくなったためと考えられる その他の日の DA 値は 0.012 から 0.019 の範囲 で推移している 図 15 は DA 値が最小値であった 2018 年 01 月 31 日の時系列データを示しており 地 磁気の 3 成分 Mag_X[uT], Mag_Y[uT], Mag_Z[uT] の値が 500,000 で大きく変化している 広 合化学の方にこの状況についてヒアリングしたところ この日にセンサーの位置を変更し たそうなので 急激に地磁気の取る値が変化したと考えられる 図 14:IoT データの DA 値 - 12 -

図 15:2018 年 01 月 31 日のデータグラフにより 大幅な変動があるので ノーマライズされたデータの値は 小さくなった そのため DA 値は他の日より小さい 7. エンコーダーしたデータの分類 A) エンコーダーしたデータの取り出しオートエンコーダモデルを学習した後 32-neuron 層からエンコーダーしたデータを取り出した それから そのデータをクラスタリングアルゴリズムで分類した エンコーダーしたデータを分類するため 部分時系列の距離手法としてユークリッド距離を使用した エンコーダーしたデータは時系列データではないため データ分類時に DTW 距離を使用しなかった - 13 -

Input Output Extract Encoded Data from this Layer 図 16: オートエンコーダモデルの中間層から取り出したデータを分類する B) エンコーダーしたデータの分類結果 IoT データの全データでオートエンコーダモデルを学習して それからエンコーダーしたデータを分類した結果を図 17 と図 18 に示す 各図において 右側にある色づけされた数値範囲は 図 4の時系列の区分けにおける 時系列データ中の指数を表す 部分時系列の指数 0 は勤務開始時間で 最大値の指数は勤務終わりの時間である 図 17:1 月のデータをエンコーダーされたデータの分類結果 図 18 に表した 2 月のデータの分類結果は 1 月の結果と異なっていることがわかる 図 17 では 部分時系列は時間に変化する傾向があるが 図 18 では全体的に分散する傾向 がある また 2018 年 2 月 2 日と 2018 年 2 月 6 日の結果には 他の時系列から外れた部分 - 14 -

時系列がある事がわかった 外れた部分を拡大して調べると その部分時系列は 0 に近い指数のデータであった 図 19 に 2018 年 02 月 02 日の外れ値付近の地磁気と加速度の 6 軸の時系列データを示す 横軸の時系列指数が 55,250 から 56,750 の間で データが変則的であることがわかる 広合化学のヒアリングによると この日はインバータの故障で異常温度になったため機械を一時停止し 試運転を行ったとのことなので その期間が 2018 年 02 月 02 日の外れ値として現れたと考えられる 図 18:2 月のデータをエンコーダーされたデータの分類結果 - 15 -

Outliers 図 19:2018 年 02 月 02 日の外れ値付近の時系列データ 8. LSTM モデルによるデータ予測 A) LSTM モデルとデータ前処理 a. モデルモデルを構成するため Tensorflow のディープランニングライブラリを利用した まず 18 個のインプットと 1 個のアウトプットの LSTM モデルを構成した これは過去のデータから1 秒後の値を予測するモデルである 図 20:LSTM モデル - 16 -

b. データ前処理全データのうち 8 割を教師用データに 2 割をテスト用データに分割した LSTM モデルによる教師データの前処理ため 時系列データを部分時系列に分割した 分割の方法は 図 21 に示す この分割は LSTM モデルのインプットになる部分時系列の長さ input_len と モデルにより予測する部分時系列の長さ pred_len という 2 つのパラメータからなる 図 21 は input_len = 36 pred_len = 18 の場合である Input: A long time series Output: A set of shorter time series 図 21:LSTM モデルのデータ前処理例 B) 予測結果 a. 1 秒後の予測 LSTM モデルでの IoT データの1 秒後の予測結果を図 22 に示す このモデルは図 22 の右下拡大図に表示されたように インプットに対しては正しく 1 秒後の値が予測できた しかし 異常な時系列など 図 22 の左下拡大図に表示された複雑な時系列インプットに対しては このモデルでは予測が困難であった 図 22:LSTM モデルでの 1 秒後の予測結果 - 17 -

b. 5 秒後の予測結果数秒後を予測できる LSTM モデルで input_len = 18, pred_len = 5 を設定して 5 秒後を予測した この LSTM モデルは 図 23 の右下拡大図で示されたように循環性の波形のピークは時系列に対して捉えることができた 一方 図 23 の左下拡大図に表される複雑なパターンの時系列に対しては大きな振動波形は捉えられなかった 図 23:LSTM モデルでの 5 秒後の予測結果 c. 18 秒後の予測結果 pred_len = 18 と予測時間を設定し インプット時系列の長さ input_len = 36 と input_len = 54 の 2 種類を設定した それぞれ 予測結果を図 24 と図 25 に示す しかし 2 つモデルの両方は 異常な時系列 ( 外れ ) に対して 図 24 と図 25 の左側のように予測ができなかった その理由は 訓練データの中に異常な部分時系列が無かったからである また 訓練データの中に異常なデータの個数が少なすぎる場合でも 同様な問題が起こることが多い これは不均衡データを用いた機械学習の問題と呼ばれている - 18 -

図 24:36 秒のインプットで 18 秒後予測する LSTM モデルの予測結果例 図 25:54 秒のインプットで 18 秒後予測する LSTM モデルの予測結果例 9. まとめ A) 統計的なクラスタリングによる分析 SVM one-class clustering アルゴリズムを用いた統計的なクラスタリングによる分析で は 地磁気データの外れ値から時系列の異常波形を検知することができた B) オートエンコーダによる復元データニューラルネットワークを用いたオートエンコーダにより 地磁気と加速度の時系列データを復元した 地磁気の復元性は高かったが 加速度の復元性は低かった これは 加速度が変位の 2 階微分のため 今回のサンプリング間隔 1 秒では長く 時間変動が大きく データがランダムになったからと考えられる - 19 -

C) LSTM モデルによるデータ予測ニューラルネットワークを用いた LSTM モデルにより 時系列データの予測を行った 1 秒先の予測は 正常なデータに対してピークの波形部分を正しく捉えることができたが 異常値と検知された複雑な波形は正しく予測できなかった 予測時間を長くした 5 秒や 18 秒先の予測においても 同様な傾向を示した ニューロビジネス研究会では 広島県大竹市にあるゴム プラスチックを製造する広合化学株式会社のブロー成型機の稼動部に安価なセンサーを試験的に取り付け 取得したデータの分析を行った 試験的に取り付けたセンサーから取得したデータの中で 比較的安定な波形を示す地磁気データに関しては 異常値の検知が可能で データの復元性も高く 正常な時系列データに対するピーク波形を予測することができた 一方で 加速度のようなランダムなデータに対しては 復元性と予測は困難であった 動きの激しいブロー成型機で 復元性と予測精度を高めるためには サンプリング時間の短縮や データ取得に最適なセンサー位置を探すなどの検討が必要になると考えられる 今回の結果より センサーからより多くの異常値を蓄積したデータを分析することで 機器の故障検知を更に高め 機器の予防保全に活用することが可能と考えられる また 異常値を検知し得る相関性の高いデータ種別を更に用いることで データの復元性と時系列予測も実用的になり 中小企業において IoT センサーを用いたデータ分析は 有効な手段になると考えられる 以上 参考文献 [1] A Description of Dynamic Time Warping (DTW) measurement http://web.science.mq.edu.au/~cassidy/comp449/html/ch11s02.html [2] Keogh, Ratanamahatana (2002). Exact indexing of dynamic time warping. In proceedings of the 26th Int'l Conference on Very Large Data Bases. Hong Kong. pp 406-417. [3] Perng, Wang, Zhang, Parker (2000). Landmarks: a newmodel for similarity-based pattern querying in time series databases. Proc.2000 ICDE, pp. 33 42. [4] Shieh and Keogh (2008). isax: Indexing and Mining Terabyte Sized Time Series. SIGKDD, pp 623-631. - 20 -