More Related Content
More from Hiroki Iida (17)
色々な確率分布とその応用
- 2. 自己紹介
• 飯田 大貴(イイダ ヒロキ)
• 職歴
• PFI 2016/7~2016/10
• レトリバ 2016/11~
• 多目的最適設計探査
• 多目的最適化
• 最適化結果からのデータマイニング
• 趣味
• 剣道
• アニメ・漫画
© 2017 Retrieva, Inc. 2
- 5. よく紹介されている確率分布
離散分布 連続分布
• 離散一様分布
• 二項分布(ベルヌーイ分布)
• ポアソン分布
• 超幾何分布
• 幾何分布
• 負の二項分布
• 多項分布
• 連続一様分布
• 正規分布
• 指数分布
• ガンマ分布
• ベータ分布
• コーシー分布
• 対数正規分布
• ワイブル分布
• ロジスティック分布
• 多変量正規分布
• χ2分布
• t分布
• F分布
© 2017 Retrieva, Inc. 5
- 6. 今回紹介する確率分布間の関係
© 2017 Retrieva, Inc. 6
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 7. 今回紹介する確率分布間の関係
© 2017 Retrieva, Inc. 7
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 9. イベント発生に関する分布
© 2017 Retrieva, Inc. 9
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 13. 指数分布
• 指数分布がランダムなイベントの発生間隔を表す分布であることの
証明
• 時刻𝑥から𝑥 + Δ𝑥の間にイベントが発生する確率を考える
1. 確率密度の定義:𝑓 𝑥 Δ𝑥
2. 時刻xまでイベントが起こらず、それからの∆𝑥間に発生する確率:
1 − 0
𝑥
𝑓 𝑡 𝑑𝑡 𝜆Δ𝑥
• 上記より、𝑓 𝑥 = 𝜆 − 𝜆 0
𝑥
𝑓 𝑡 𝑑𝑡。両辺を微分して、𝑓′
𝑥 = −𝜆𝑓(𝑥)
• この微分方程式を解くと𝑓 𝑥 = 𝐶𝑒𝑥𝑝(−𝜆𝑥)
• さらに、 0
∞
𝑓(𝑥) 𝑑𝑥 = 1なので、𝐶 = 𝜆。よって、𝑓 𝑥 = 𝜆𝑒𝑥𝑝(−𝜆𝑥)
© 2017 Retrieva, Inc. 13
- 15. ガンマ分布
• ガンマ分布の証明
• 𝑋1, 𝑋2, ⋯ , 𝑋 𝑛が互いに独立な平均1/𝜆の指数分布に従う
• 𝑌 = 𝑋1 + 𝑋2 + ⋯ + 𝑋 𝑛とおく。
• 特性関数の性質より、𝜑 𝑌 = 𝑖=1
𝑛
𝜑 𝑋 𝑖
• 指数関数とガンマ関数の特性関数はそれぞれ以下の通り
• 指数分布:𝜑 𝑋 =
𝜆
𝜆−𝑖𝑡
• ガンマ関数:𝜑 𝑋 =
𝜆
𝜆−𝑖𝑡
n
• よって、ガンマ分布が期間1/𝜆程度で1回発生するランダムなイベン
トがn回起こるまでの時間を表す分布であることがわかる。
© 2017 Retrieva, Inc. 15
- 16. イベント発生系分布から導出できる分布
© 2017 Retrieva, Inc. 16
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 19. 指数分布とワイブル分布の比較
• 危険率:𝑟 𝑥 = lim
∆𝑡→0
𝑃 𝑡 < 𝑇 < 𝑡 + ∆𝑡 𝑇 > 𝑡) =
lim
Δ𝑡→0
𝐹 𝑡+∆𝑡 −𝐹 𝑡
∆𝑡
1
1−F(t)
=
f(t)
1−F(t)
=
d
dx
log 1 − F x を置く。
• 指数分布とワイブル分布の危険率はそれぞれ以下の通り
• 指数分布:𝑟 𝑥 = −𝜆
• ワイブル分布:𝑟 𝑥 = −𝑐𝑥 𝑏
© 2017 Retrieva, Inc. 19
- 20. 2項分布の拡張・ベイズ共役
© 2017 Retrieva, Inc. 20
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 21. ベータ分布
• 2項分布のp変数を変数としたもの。𝐵𝑒(𝛼, 𝛽)とかく。
• 確率密度関数
𝑓 𝑥: 𝛼, 𝛽 =
1
𝐵 𝛼, 𝛽
𝑥 𝛼−1
1 − 𝑥 𝛽−1
• 期待値と分散
𝐸 𝑋 =
𝛼
𝛼 + 𝛽
𝑉 𝑋 =
𝛼𝛽
𝛼 + 𝛽2
𝛼 + 𝛽 + 1
• 𝑓 𝑥: 1, 1 で、区間[0,1]の一様分布となる。
• 2項分布の共役事前分布でもある。
© 2017 Retrieva, Inc. 21
- 22. 多項分布
• 結果がK個のカテゴリーに分類され、それぞれのカテゴリーでの発生確率
が、𝑝1, 𝑝2, ⋯ , 𝑝 𝐾の試行を独立にn回繰り返した時の確率分布。
• 確率密度関数(ただし、各カテゴリーの発生回数を𝑿 = (𝑋1, ⋯ 𝑋 𝐾)とする)
𝑓 𝒙 =
𝑛!
𝑥1! ⋯ 𝑥 𝐾!
𝑝1
𝑥1
⋯ 𝑝 𝐾
𝑥 𝐾
• 期待値と分散と共分散
𝐸 𝑋𝑖 = 𝑛𝑝𝑖, 𝑉 𝑋𝑖 = 𝑛𝑝𝑖 1 − 𝑝𝑖 , 𝐶𝑜𝑣 𝑋𝑖, 𝑋𝑗 = −𝑛𝑝𝑖 𝑝𝑗
• 2項分布を複数化したものと見なせる。
© 2017 Retrieva, Inc. 22
- 24. 正規分布
© 2017 Retrieva, Inc. 24
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 28. 標本の分布
© 2017 Retrieva, Inc. 28
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 29. χ2分布
• 𝑋1, ⋯ 𝑋 𝑘が標準正規分布に従うとき、𝑋 = 𝑋1
2
+ ⋯ + 𝑋 𝐾
2
が従う分布を自由度Kのχ2分布といい、
χ2(k)とかく。
• 確率密度関数
𝑓 𝑥: 𝐾 =
1/2
𝐾
2
Γ
𝐾
2
𝑥
𝐾
2
−1
exp −
𝑥
2
(𝑥 ≥ 0)
𝑓 𝑥 = 0 (𝑥 < 0)
• 期待値と分散
• χ2分布は𝐺𝑎
𝐾
2
,
1
2
である。
• 𝑋 = 𝑛 − 1 𝑠2/𝜎2、𝑠 =
1
𝑛−1 𝑖=1
𝑛
𝑋 − 𝑋 2とすることで、 χ2分布から標本分散の分布を求めること
ができる。
© 2017 Retrieva, Inc. 29
- 30. χ2分布
• 確率密度関数の導出
• χ2(1)を考える。Y~N(0,1)として、X=Y2とすると𝑃 𝑋 ≤ 𝑥 =
𝑃(− 𝑥 ≤ 𝑌 ≤ 𝑥)である。そのため、
𝑓 𝑥 =
𝑑
𝑑𝑥 − 𝑥
𝑥
1
2𝜋
exp −
𝑦2
2
𝑑𝑦 =
1
2𝜋
𝑥−1/2
exp −
𝑥
2
となる。これは、Ga(1/2,1/2)と一致する。また、
𝑋𝑖~𝐺𝑎(𝑎𝑖, 𝑏)のとき、𝑋1 + 𝑋2~𝐺𝑎(𝑎1 + 𝑎2, 𝑏)となるので、 χ2(K)は、
𝐺𝑎
𝐾
2
,
1
2
と一致する。
© 2017 Retrieva, Inc. 30
- 31. t分布
• Uが標準正規分布に従い、Wが自由度nのカイ二乗分布に従うとき、統計量𝑡 =
𝑈/ 𝑊/𝑛がしたがう分布.t(n)と書く。
• 確率密度関数
𝑓 𝑡 =
1
𝑛𝜋𝐵(
𝑝
2
,
1
2
)
1 +
𝑡2
𝑛
−(𝑛+1)/2
• 期待値と分散
𝐸 𝑋 = 0 𝑛 > 1 , 𝑉 𝑋 =
𝑛
𝑛 − 2
(𝑛 > 2)
• t分布は、正規分布𝑁(0,1/ 𝑊)とガンマ分布𝐺𝑎(
𝑛
2
,
1
2
)の混合とすることで得られる。
• t分布は、分散が未知の場合の、正規分布の標本平均の分布になる
© 2017 Retrieva, Inc. 31
- 32. F分布
• Uがχ2(p)に従い、Vが χ2(q)に従っており、UとVが独立とする。
• この時、𝐹 =
𝑈/𝑝
𝑉/𝑞
が従う分布を自由度(p,q)のF分布といい、 F (p,q)と書く
• 確率密度関数
𝑓 𝑥; 𝑝, 𝑞 =
𝑝 𝑝/2 𝑞 𝑞/2
𝐵(
𝑝
2
,
𝑞
2
)
𝑥
𝑝
2−1
𝑝𝑥 + 𝑞 (𝑝+𝑞)/2
• 期待値と分散
𝐸 𝑋 =
𝑞
𝑞 − 2
𝑞 > 2 , 𝑉 𝑋 = 2
𝑞
𝑞 − 2
2
𝑝 + 𝑞 − 2
𝑝 𝑞 − 4
(𝑞 > 4)
© 2017 Retrieva, Inc. 32
- 33. F分布
• 標本分散について、F分布は以下のようにかける。
• 𝑈 = 𝑚 − 1 𝑠1
2
/𝜎1
2
、𝑉= 𝑛 − 1 𝑠2
2
/𝜎2
2
とすると、F =
𝑠1
2
𝑠2
2
𝜎2
2
𝜎1
2となる
• 特に、比べている分布の母分散が等しい時、標本分散の比の標本分布
となる。
© 2017 Retrieva, Inc. 33
- 34. その他
© 2017 Retrieva, Inc. 34
幾何分布
指数分布
負の二項分布
ガンマ分布
複数化
連続化
連続化
複数化
ワイブル
分布
一般化
ポアソン
分布
二項分布
(ベルヌー
イ分布)
反転
反転
無限
無限混合
ベータ分布
ディリクレ
分布
変数変換
複数化
多項分布
複数化
ベイズ共役
変数の変更
ベイズ
共役
反転
χ2分布
特殊化
正規分布
標準
正規分布
T分布
F分布
混合
コーシー
分布
無限
一様
分布
特殊化
- 40. NDBモデル
• モデル式
𝑃𝑟 =
1 +
𝑀
𝐾
−𝐾
Γ 𝐾 + 𝑟
Γ 𝑟 + 1 Γ 𝐾
𝑀
𝑀 + 𝐾
𝑟
• 通常の負の二項分布からの導出
• 負の2項分布
𝑓 𝑥 =
𝑘 + 𝑥 − 1
𝑥
𝑝 𝑘
𝑞 𝑥
• 𝑥 = 𝑟, 𝑘 = 𝐾, 𝑝 =
𝐾
𝑀+𝐾
, 𝑞 =
𝑀
𝑀+𝐾
と置くと上記の式になる。
© 2017 Retrieva, Inc. 40
- 42. NDBモデル
• 確率思考の戦略論を再現してみた。
© 2017 Retrieva, Inc. 42
2週間でパンケーキを食べた回数
(1000世帯)
𝑀 = 0.736, 𝐾 = 0.6016
4半期のうち歯磨き粉を
購入した回数(5240世帯)
𝑀 = 1.46, 𝐾 = 0.78
図書館において1年間で
1冊あたりの貸し出された
回数 (5240世帯)
𝑀 = 0.736, 𝐾 = 0.6016
- 44. ディリクレNDBモデル
• 仮説
1. あるカテゴリーにおける各消費者の購入は、それぞれ独立して起きる。
2. あるカテゴリーにおける購入時のブランド選択は、消費者のそれぞれのブ
ランドに対するプレファレンスによって決まる確率に従い、その時点でど
のブランドが選択されるかはランダムに決まっている。(多項分布してい
る)
3. あるカテゴリーにおける消費者のブランド選択は、プレファレンスの順位
が高ければ高いほど、購入確率がより高くなる傾向にある(ガンマ分布し
ている)
4. あるカテゴリーにおける消費者のブランド選択は、プレファレンスによっ
て定まる確率に従い、それは、カテゴリーの平均購入回数の多い少ないに
関係がない。
© 2017 Retrieva, Inc. 44
- 45. ディリクレNDBモデル
• モデル式
𝑃𝑟 𝑅, 𝑟1, 𝑟2 ⋯ , 𝑟𝑔 =
Γ 𝑆
𝑗=1
𝑔
Γ(𝛼 𝑗)
𝑗=1
𝑔
Γ 𝑟𝑗 + 𝛼𝑗
Γ 𝑆 + 𝑅
1
𝑗=1
𝑔
𝑟𝑗!
Γ 𝑅 + 𝐾
Γ 𝐾
1 +
𝐾
𝑀𝑇
−𝑅
1 +
𝑀𝑇
𝐾
−𝐾
• 導出
𝑃𝑟 𝑅, 𝑟1, 𝑟2 ⋯ , 𝑟𝑔 =
0
∞
Multinomial r p, R 𝐷𝑖𝑟𝑖𝑐ℎ𝑙𝑒𝑡 𝑝 𝛼 dp
0
∞
𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝑅 𝜇𝑇 𝐺𝑎𝑚𝑚𝑎 𝜇 𝐾,
𝑀
𝐾
𝑑𝜇
© 2017 Retrieva, Inc. 45
仮説1 仮説3仮説2
- 46. ディリクレNDBモデル
• それぞれのパラメータについて
• T:期間
• R:期間Tにあるカテゴリーでの購入回数
• ri:期間Tにカテゴリー内のある商品jでの購入回数
• M:平均購入回数
• S:プリファレンスの関数
• 𝛼𝑗 = S ×(商品jの購入頻度に基づくマーケットシェア)
• Sについて
• 𝑅~𝐺𝑎𝑚𝑚𝑎 𝑆, 𝛽 → 𝐸 𝑅 =
𝑆
𝛽
= 𝑀𝑇 → 𝑆 = 𝑀𝑇𝛽
© 2017 Retrieva, Inc. 46