More Related Content
Similar to Stanの紹介と応用事例(age heapingの統計モデル)
Similar to Stanの紹介と応用事例(age heapingの統計モデル) (20)
Stanの紹介と応用事例(age heapingの統計モデル)
- 4. 類似ソフトとの比較 (評価は主観)
汎用性 × △ ○ ○ ○ ○ ○ ○
バグの入りにくさ × ○ ○ ○ ○ ○ ○ ○
エラーメッセージの
読みやすさ
- ○ × △ △ ○ △ ○
MCMCの速度・質 ◎ ○ ○ ○ ◎ △ △ △
変分ベイズ ◎ - - - ○ - ○ -
マニュアルや
例の充実度
- △ ○ △ ◎ △ ○ ○
開発頻度 - △ × △ ◎ ○ ◎ ○
備考 空間
ベイズ
離散パラ
メータ×
良くも悪くも
Tensorflow
有料
4
- 6. 単回帰の例
• 年功序列の会社における, 年齢と年収の関係
• 説明変数: 年齢𝑋 𝑛 , 応答変数: 年収𝑌 𝑛
• モデル式: 𝑌 𝑛 ~ Normal 𝑎 + 𝑏𝑋 𝑛 , 𝜎
• パラメータ: 𝑎, 𝑏, 𝜎, 事後分布: 𝑝 𝑎, 𝑏, 𝜎|𝑋, 𝑌
6
1
2
3
4
21
X,Y
24,472
24,403
26,454
...
59,1314
data-salary.txtの構成
- 17. モデル式
• 𝐴: 年齢の数 (ここでは0~75歳の76個)
• 𝑎: 年齢インデックス (eg. 𝑎 = 1がゼロ歳)
• 𝑌 𝑎 𝑎 = 1, … , 𝐴: 各年齢の人口データ
• 𝑞 𝑎 𝑎 = 1, … , 𝐴: 真の構成比
• 𝜇 𝑎 𝑎 = 1, … , 𝐴: 流入・流出後の構成比
• 𝑌 ~ Multinomial 総人口, 𝜇
• 𝑞 𝑎 ~ Normal 2 𝑞 𝑎 − 1 − 𝑞 𝑎 − 2 , 𝜎𝑞
17
2階差分の
IGMRF 74, 75歳間
は無視
𝑎 = 3, … , 𝐴 − 1
- 18. (補足) IGMRFの尤度
Håvard Rue et al. (2005) “Gaussian Markov Random Fields” Chapman & Hall/CRC
• 1次元の場合: IGMRFと状態空間モデルは同じ尤度となる.
例: 1階差分の場合の尤度 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 ∝
観測モデルの尤度 ×
1
𝜎𝜇
𝐼−1
2
exp −
1
2
𝑖=2
𝐼
𝜇 𝑖 − 𝜇 𝑖 − 1
𝜎𝜇
2
• 2次元の場合:
例: 1階差分の場合の尤度 𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 ∝
観測モデルの尤度 ×
1
𝜎𝜇
全サイト数−1
2
exp −
1
2
𝑖,𝑗 と
𝑖′,𝑗′ が
隣接
𝜇 𝑖, 𝑗 − 𝜇 𝑖′, 𝑗′
𝜎𝜇
2
18
-1は「全ての𝜇に定数を足しても不変」
という線形制約による精度行列のrank
の減少分に関係する.
一般に線形制約の数は, 𝑑: 次元,
𝑘: 階差 として| 𝑑+𝑘−1 𝐶𝑘−1となるので,
その分がマイナスとなる.
- 19. • 2次元の場合:
例: 2次元正方格子, 2階差分の場合の尤度
𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 ∝ 観測モデルの尤度 ×
1
𝜎𝜇
𝐼×𝐽−3
2
exp −
1
2
𝑖=2
𝐼−1
𝑗=2
𝐽−1
○ ● ○
● ○ ●
○ ● ○
− 4
○ ○ ○
○ ● ○
○ ○ ○
𝜎𝜇
2
または, 観測モデルの尤度 ×
1
𝜎𝜇
𝐼×𝐽−3
2
exp −
1
2
𝑖=2
𝐼−1
𝑗=2
𝐽−1
2
3
○ ● ○
● ○ ●
○ ● ○
+
1
6
● ○ ●
○ ○ ○
● ○ ●
−
10
3
○ ○ ○
○ ● ○
○ ○ ○
𝜎𝜇
2
などが考えられる (いずれもΣの括弧の中は
𝜕2
𝜕𝑥2 +
𝜕2
𝜕𝑦2の差分による近似).
19
- 20. モデル式
• 𝐽: 流出が起こる年齢の数 (𝑗は流出のインデックスとなる)
• 𝐹𝑟𝑜𝑚 𝑗 𝑗 = 1, … , 𝐽: 流出元の年齢インデックス
• 𝑇𝑜 𝑗 𝑗 = 1, … , 𝐽: 流出先の年齢インデックス
• 𝑟 𝑗 𝑗 = 1, … , 𝐽: 𝑞 𝐹𝑟𝑜𝑚 𝑗 のうち, 何割が流出したかを
表すパラメータ(範囲は 0,1 )
• 𝜇は, 𝑞と𝑟から以下の手順で作られる.
1. 𝜇を𝑞で初期化
2. for 𝑗 in 1, … , 𝐽:
𝜇 𝐹𝑟𝑜𝑚 𝑗 = 𝜇 𝐹𝑟𝑜𝑚 𝑗 − 𝑟 𝑗 𝑞 𝐹𝑟𝑜𝑚 𝑗
𝜇 𝑇𝑜 𝑗 = 𝜇 𝑇𝑜 𝑗 + 𝑟 𝑗 𝑞 𝐹𝑟𝑜𝑚 𝑗
20
- 21. モデル式
• 𝑟 𝑗 は何らかの制約がないとうまく推定できない.
そこで, 以下のように縛りを入れる (階層モデル):
• 仮定3: 𝑟 𝑗 ~ Normal 𝜇 𝑟, 𝜎𝑟 𝑇 0,1 𝑗 = 1, … , 𝐽
※他には以下の仮定なども考えられる.
• 仮定3’: logit 𝑟 𝑗 ~ Normal 𝜇 𝑟, 𝜎𝑟 𝑗 = 1, … , 𝐽
21
- 27. 参考文献
• 松浦健太郎 (2016) 『StanとRでベイズ統計モデリング』 共立出版
• MCMCサンプルを{dplyr}で操る
– http://statmodeling.hatenablog.com/entry/using-mcmc-samples-with-dplyr
• 人口ピラミッドのAge Heapingを階層ベイズで補正する
– http://statmodeling.hatenablog.com/entry/age-heaping
• Håvard Rue et al. (2005) “Gaussian Markov Random Fields”
Chapman & Hall/CRC
• IGMRFの尤度におけるrankの減少分に関するメモ
– http://statmodeling.hatenablog.com/entry/IGMRF-likelihood
27