11. 情報融合
バランスフュージョン法
• 気象ダイナミクスのモデル化には、最近の観測値を使
• ある結論では、「多くの時系列タスクでは、最近の時
間ステップが数ステップで済む」とされている[2]
• NWP予測を𝑫 𝑇 𝐷
に組み込む
• 𝑫 𝑇 𝐷
にstation IDとtime IDを組み込む
11
(気温) (相対湿度) (風速)
時間毎,測候所毎に平均と分散が大きく異なる
日中3時から翌日15時までの過去の観測値の統計量
[2] Felix A Gers, Douglas Eck, and Jürgen Schmidhuber. 2002. Applying LSTM to time series predictable
through time-window approaches. In Neural Nets WIRN Vietri-01. Springer, 193–200.
12. データの前処理
• 欠損値の取り扱い
• ブロック欠損(1日分のデータがない)
•該当する日のデータを消去
•1188日→1148日
• 局所欠損(局所的な非連続時系列)
•線形補間を行い欠損値を算出
• 連続変数の正規化
• min-max正規化を用いて[0,1]に正規化
• 評価する際は元に戻す
• カテゴリ変数
• Timesteps IDとStation IDが存在する
•ハード符号化よりも性能が良い埋め込み符号化を行う[10]
12
[10] Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg S Corrado, and Jeff Dean. 2013.
Distributed representations of words and phrases and their compositionality.
In Neural Information Processing Systems. 3111–3119.