高次元ビッグデータ 解析・可視化ツール
toorPIA(トピア)とは?
▋ toorPIA(トピア)の特徴
▶︎ SQC手法(多変量解析など)、AI(機械学習)に並ぶ新たなデータ解析手法
▶︎ 目的変数、評価軸が定まらず、解析手順が明確でない段階でも、データをありのままの状態でMAP化(0次解析)
▶︎ MAPから得られる俯瞰的情報(データの疎密、外れ値、全体形状など)により、大きな傾向や着目すべきエリアを顕在化
▶︎ 注目するエリアを簡単な操作で探査、特定の条件を満たすデータ特徴量の絞り込みが可能
▶︎ 必要に応じて集団を切り出し、重みを変えた再MAP化や、多変量解析・機械学習への適用も可能
▶︎ 独立したツールとして利用できる他、APIを用いて他システムへの組み込みも可能
▋ toorPIA の特徴がわかる顕著な例
▶︎ 1個のセンサーだけで 多軸ロボットアームの各軸(サーボ)の動作を監視
▶︎ 課 題
-
多軸のロボットアームの筐体(台座)に設置した1個の振動センサーから得られる振動データから、それぞれの軸(サーボモータ)の動作を分離することは困難
-
既存手法の多くは、軸ごとにセンサーが必要となるので、追加施工が困難
▶︎ toorPIAを用いると
-
FFT の結果の1000を超える次元の周波数データ全体を直接そのまま解析し、類似度にもとづき2次元マップ化
-
このマップ上で各軸毎の動作状態が分離できる
-
1個の振動センサーを台座に追加するだけで、個々の軸(モーター)毎に動作安定性等の状態診断が可能
▋ ビッグデータ解析における課題
▶︎ 近年の情報環境
-
製造現場では IoT の活用により膨大なデータが容易に集まるようになった
-
製品開発の現場には、正しく計画されていないものも含めて、過去からの無数の実験データがある
-
セールスの現場では、POS などIT技術の発展により膨大なデータを容易に入手できるようになった
-
市場開発の現場には、様々なルートから様々なクオリティーの膨大なデータが集まってくる
▶︎ 従来のデータ整理手法の課題
膨大なデータをどう整理すれば有用なアイディアに繋げるか?
多変量解析
-
重回帰分析
〇 目的変数に対する説明変数の寄与率を計算
▲ 説明変数が多すぎると相関がわからなくなる
▲ 説明変数の独立性や高い正規度が必要
-
主成分分析
〇 現象に対し最も影響のある次元を検出する
▲ 他のほとんどの次元は無視される
-
クラスタ分析(階層法)
〇 予め設定した評価指標で似た者同士を集める
▲ 評価軸が決まらないと分類できない
AI(機械学習)
〇 知識を定義する要素(特徴量)を人工知能(AI)が
自ら習得
▲ 評価指標は人が与えなくてはならない
▲ 次元が多いと精度が下がる →「次元の呪い」
<共通の問題>
次元(要素)が多いと非常に困難
先入観を持って分析が必要
データの質(正規度など)が問われる
<データ整理の手法>