SlideShare a Scribd company logo
1 of 17
Download to read offline
Doing Bayesian Data Analysis
Chapter 12: Bayesian Approaches to Testing
a Point (‘‘Null’’) Hypothesis
東京大学 松尾研究室 修士2年
飯塚修平@tushuhei
2013/08/25 1
この章の内容
1.  パラメタ評価アプローチ (estimation)
–  ひとつの事前確率
–  その値は信頼出来る?
2.  モデル比較アプローチ (model comparison)
–  ふたつの事前確率
–  どちらのモデルが信頼出来る?
3.  それぞれのアプローチの注意点
2013/08/25 2
仮説検定についてベイジアンの立場から考えよう	
  
彼ってどんな性格なの?
どうしようもなく駄目なひとなのか、
とても潔癖で近づきがたいひとなのか、
それとも、その間のどこかなのかな。
導入
•  こういう悩みはつきない
–  これからコイントスで先行を決めるんだけど、このコインで大丈夫なのかな?
–  この新規開発した薬って本当に効くのかな?プラセボじゃないよね?
–  その他諸々の「A と B どっちがいいかな。」
à ベイジアン風に言うと「偏り θ = 0.5」という帰無仮説は棄却されるのか、それ
とも採用されるのか?
•  ベイジアンだと、伝統的統計学より進んだ考え方で検定することが
できる
–  棄却 or 採用よりも 95% HDI を得られる方が情報量が多い
–  事後確率分布を得ることで、パラメタと信頼度の関係を眺めることができる
•  今回取り上げる方法は 2 つ
–  パラメタ評価アプローチ
事後確率の 95% HDI の中に帰無値(null value, 仮説検定したい値)が入るか
–  モデル比較アプローチ
「帰無値しか許さないモデル」 vs 「それ以外の値も広く許すモデル」
2013/08/25 3
パラメタ評価アプローチ
•  基本的な考え方
–  もし帰無値が事後確率の 95% HDI の外にあれば、その帰無値は信頼できる値で
はない。
–  もし帰無値が事後確率の 95% HDI の中にあれば、その帰無値は信頼できる値の
ひとつだと言える。
•  つまり、ひとつの事前確率から事後確率を算出し、帰無値の信頼性
を評価する。
•  実際の例
–  キーボードゲーム(パラメタの値を評価する例)
–  ホットハンド・ジンクス(パラメタの値の差を評価する例)
2013/08/25 4
【例】キーボードゲーム
•  被験者に以下のようなゲームをプレイしてもらう。
•  被験者はディスプレイに表示された単語に対して適切なキーを叩く。
•  正解すると、報酬を得ることができる。ルールは図の通り。
2013/08/25 5
“radio”	
  
“ocean”
ディスプレイ “radio”	
  
“mountain”
キーボード F J F J
報酬 報酬
【例】キーボードゲーム
•  その後被験者に対して、これまでの学習からは正解がわからないテ
ストを与える
–  ディスプレイに “radio” とのみ表示する
–  ディスプレイに ”ocean” と “mountain” の両方を表示する
•  それぞれのテストについて被験者の叩くキーが偏るか?
2013/08/25 6
[Prior] θ = (F が叩かれる回数 /
J が叩かれる回数) とし、一様
分布と仮定する。
[Likelihood] テストの結果
得られた尤度。片方のキー
に偏っている。
[Posterior] 事後確率の 95% HDI に θ = 0.5 が
含まれなかった。すなわち、被験者は 50:50
でキーを選択するのではなく、いずれかに偏っ
ていた。
【例】ホットハンド・ジンクス
•  バスケットボールのジンクス:
シュートに成功した後の方が、失敗した後よりもシュートが決まり
やすくなる。à すなわち θ_AfterSuccess と θ_AfterFailure で違い
があるのか?
•  θ_AfterSuccess - θ_AfterFailure = 0 が 95% HDI 内に入っている。
à ジンクスなんてなかった
2013/08/25 7
相関するパラメタの場合
•  それぞれの場合のθの分布に着目しても、パラメタ間の関係は見えない。
•  相関の正負は、パラメタの差(この場合 θ1 - θ2)の分布の幅に現れる。
–  正の相関à近似直線(line of equality)の幅が狭い
à 0 を 95% HDI に含まず、θ1 と θ2 が異なることを示している。
–  負の相関à近似直線の幅が広い
2013/08/25 8
θ1 とθ2 が相関する場合 θ1 とθ2 が逆相関する場合
95% HDI
0.0279 < (θ1 – θ2) < 0.206
狭い; 0 を HDI に含まない
95% HDI
-0.26 < (θ1 – θ2) < 0.494
広い; 0 を HDI に含む
ROPE の導入
•  Region of Practical Equivalence
•  ROPE を導入することで、実用的な範囲内で帰無値が信頼できるか
否かを判断できるようになる。
–  幅を持たせることで、実用上十分なのに棄却してしまう可能性を減らす。
•  基本的な考え方
–  ROPE 全体が事後確率の 95% HDI の外にあれば、その帰無値は用いることが出
来ない [1]
–  ROPE が事後確率の 95% HDI 全体を完全に含んでいれば、その帰無値は採用で
きる [2]
2013/08/25 9
ROPE 95% HDI 95% HDIROPE
[1] [2]
【例】コインは偏ってるか?
•  理想的なコイン: 表が出る確率 θ = 0.5 ß 帰無値
•  ROPE: θ = [0.45, 0.55]
•  10,000 回コインを投げて 5,200 回表が出た。
•  à 95% HDI = [0.51, 0.53]
•  帰無値は HDI に含まれないが、HDI は十分 ROPE 内に収まっている。
•  実用上、θ = 0.5 として扱って OK
2013/08/25 10
0.45 0.55ROPE 0.51 0.53
95% HDI
0.50
帰無値
モデル比較アプローチ
•  次に、モデル比較として帰無値の信頼性を考える。
•  帰無モデル (null model): M_null
–  帰無値のみを許すモデル
•  対立モデル (alternative model): M_alt
–  パラメタを広い範囲で許すモデル
•  この2つのモデルの比較として、仮説検定問題を捉え直す。
2013/08/25 11
M_null (θ1=θ2) M_alt (一様)
【例】ふたつのコインは同じ?
•  ふたつのコインの表が出る確
率はそれぞれ θ1, θ2
•  M_null: θ1 = θ2 (ふたつのコ
インは同じという帰無仮説)
•  M_alt: 一様分布
•  コイントスの回数 N = 7
•  表が出た回数 z1 = 5, z2 = 2
•  p(D|M_null) = 1.94*10^(-5)
•  p(D|M_alt) = 3.54*10^(-5)
•  p(M_null) = p(M_alt) = 0.5
2013/08/25 12
M_alt がわずかながら勝利
だが、Bayer s Factor の
値は小さい
→棄却は難しい
【例】記憶力を高める BGM は?
•  被験者にある BGM がかかっている部屋の中で 20 個の単語を暗記
してもらう。
•  θ_ij: 被験者 i が BGM j の元で単語を暗記できる割合
–  思い出せる or 思い出せない(二値)なので、ベータ関数で表すことが可能
θ_ij = beta(θ_ij|μ_j, κ_j, (1-μ_j)κ_i)
•  BGM の種類 (平均値)
1.  ヘビメタ (11.85)
2.  バッハ (9.85)
3.  ベートーベン (9.50)
4.  モーツァルト (9.60)
à  何かを覚える時はクラシックよりもヘビメタ!
à  では、この4つのグループに差があると言えるのか?
「差がある」という帰無仮説は棄却されるのか?
2013/08/25 13
【例】記憶力を高める BGM は?
•  まずはパラメタ評価アプローチに戻って、それぞれのグループ間の
パラメタに差があるか仮説検定を行う。
–  ホットハンド・ジンクスの例を参照
•  パラメタ μ_j の差をとって比較すると、各グループを [[1], [2, 3, 4]]
と分けることができる。特にグループ 1 と 3, 4 の間の差が大きい。
2013/08/25 14
【例】記憶力を高める BGM は?
•  モデル比較アプローチでは、以下2つのモデルの比較として問題を
捉え直す。
–  SameMu: 4つのグループ間で差がないとするモデル(帰無モデル)
–  DiffMu: 4つのグループ間で差があるとするモデル(対立モデル)
•  MCMC で見てみると、SameMu の方が勝っている。
à 4つのグループには差がない??
2013/08/25 15
【例】記憶力を高める BGM は?
•  結局、4つのグループは同じなの?違うの?
•  【モデル比較アプローチ】
4つのパラメタをすべてのグループが共有するモデルと、それぞれ
のグループが異なるパラメタを持つモデルの比較では、前者の方が
良かった。が、ベストではない。
•  【パラメタ評価アプローチ】
4つのモデルで異なるパラメタを持たせて比較した結果、[[1], [2, 3,
4]] とグルーピングできた。
•  à グループ 1 と グループ 2, 3, 4 でパラメタを分ける 2-パラメタモ
デルが実は最も優秀である (Ex 12.1 で確認すべし)
2013/08/25 16
彼ってどんな性格なの?
どうしようもなく駄目なひとなのか、
とても潔癖で近づきがたいひとなのか、
それとも、その間のどこかなのかな。
注意点
パラメタ評価アプローチ
•  ROPE と HDI の幅の比は、帰無値が正しい確率を表しているのではない。
パラメタが帰無値に等しい確率を表しているのだ。
•  十分に比が大きい時のみ、この値は意味を持つ。何故なら、データが十分
でないとき、HDI の幅が大きくなってこの比が小さくなる可能性があるか
らだ。
モデル比較アプローチ
•  あくまで帰無モデルの信頼性は相対的なもの。
–  記憶と BGM の例を参照。
•  そのため、対立モデルは十分に吟味された、うまくいきそうなモデルを採
用すべきである。
–  慣習だからといって、何も考えずに一様分布モデルを採用するのは危険。
–  ベストなモデルがその過程で見過ごされてしまう可能性がある。
•  そのためには、事前知識を駆使して妥当なモデルを考えること。
2013/08/25 17

More Related Content

Viewers also liked

Doing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance Testing
Doing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance TestingDoing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance Testing
Doing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance TestingHiroki Takanashi
 
Doing Bayesian Data Analysis; Chapter 14
Doing Bayesian Data Analysis; Chapter 14Doing Bayesian Data Analysis; Chapter 14
Doing Bayesian Data Analysis; Chapter 14春 根上
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...Junki Marui
 
Doing Bayesian Data Analysis, Chapter 5
Doing Bayesian Data Analysis, Chapter 5Doing Bayesian Data Analysis, Chapter 5
Doing Bayesian Data Analysis, Chapter 5春 根上
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...Junki Marui
 
全脳アーキテクチャ勉強会 第1回(松尾)
全脳アーキテクチャ勉強会 第1回(松尾)全脳アーキテクチャ勉強会 第1回(松尾)
全脳アーキテクチャ勉強会 第1回(松尾)Yutaka Matsuo
 

Viewers also liked (9)

Dbda chapter17
Dbda chapter17Dbda chapter17
Dbda chapter17
 
Doing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance Testing
Doing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance TestingDoing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance Testing
Doing Bayesian Data Analysis Chapter 11. Null Hypothesis Significance Testing
 
Doing Bayesian Data Analysis; Chapter 14
Doing Bayesian Data Analysis; Chapter 14Doing Bayesian Data Analysis; Chapter 14
Doing Bayesian Data Analysis; Chapter 14
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 8: Inferring Two Binomial P...
 
Dbda勉強会
Dbda勉強会Dbda勉強会
Dbda勉強会
 
Doing Bayesian Data Analysis, Chapter 5
Doing Bayesian Data Analysis, Chapter 5Doing Bayesian Data Analysis, Chapter 5
Doing Bayesian Data Analysis, Chapter 5
 
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
【DBDA勉強会2013】Doing Bayesian Data Analysis Chapter 16: Metric Predicted Variab...
 
Dbda03
Dbda03Dbda03
Dbda03
 
全脳アーキテクチャ勉強会 第1回(松尾)
全脳アーキテクチャ勉強会 第1回(松尾)全脳アーキテクチャ勉強会 第1回(松尾)
全脳アーキテクチャ勉強会 第1回(松尾)
 

More from Shuhei Iitsuka

Online and offline handwritten chinese character recognition a comprehensive...
Online and offline handwritten chinese character recognition  a comprehensive...Online and offline handwritten chinese character recognition  a comprehensive...
Online and offline handwritten chinese character recognition a comprehensive...Shuhei Iitsuka
 
Inferring win–lose product network from user behavior
Inferring win–lose product network from user behaviorInferring win–lose product network from user behavior
Inferring win–lose product network from user behaviorShuhei Iitsuka
 
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会Shuhei Iitsuka
 
Procedural modeling using autoencoder networks
Procedural modeling using autoencoder networksProcedural modeling using autoencoder networks
Procedural modeling using autoencoder networksShuhei Iitsuka
 
Generating sentences from a continuous space
Generating sentences from a continuous spaceGenerating sentences from a continuous space
Generating sentences from a continuous spaceShuhei Iitsuka
 
ウェブサイト最適化のためのバリエーション自動生成システム
ウェブサイト最適化のためのバリエーション自動生成システムウェブサイト最適化のためのバリエーション自動生成システム
ウェブサイト最適化のためのバリエーション自動生成システムShuhei Iitsuka
 
Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...
Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...
Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...Shuhei Iitsuka
 
Machine learning meets web development
Machine learning meets web developmentMachine learning meets web development
Machine learning meets web developmentShuhei Iitsuka
 
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめるPython と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめるShuhei Iitsuka
 
リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門Shuhei Iitsuka
 
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web DataAsia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web DataShuhei Iitsuka
 
UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話Shuhei Iitsuka
 
ウェブサイトで収益を得る
ウェブサイトで収益を得るウェブサイトで収益を得る
ウェブサイトで収益を得るShuhei Iitsuka
 
HTML で自己紹介ページをつくる
HTML で自己紹介ページをつくるHTML で自己紹介ページをつくる
HTML で自己紹介ページをつくるShuhei Iitsuka
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おうShuhei Iitsuka
 
ウェブサービスの企画とデザイン
ウェブサービスの企画とデザインウェブサービスの企画とデザイン
ウェブサービスの企画とデザインShuhei Iitsuka
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おうShuhei Iitsuka
 
第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会 第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会 Shuhei Iitsuka
 
かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう Shuhei Iitsuka
 
ペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプShuhei Iitsuka
 

More from Shuhei Iitsuka (20)

Online and offline handwritten chinese character recognition a comprehensive...
Online and offline handwritten chinese character recognition  a comprehensive...Online and offline handwritten chinese character recognition  a comprehensive...
Online and offline handwritten chinese character recognition a comprehensive...
 
Inferring win–lose product network from user behavior
Inferring win–lose product network from user behaviorInferring win–lose product network from user behavior
Inferring win–lose product network from user behavior
 
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会
バリエーションの提示がもたらす長期的効果に着目したウェブサイト最適化手法 @第31回人工知能学会全国大会
 
Procedural modeling using autoencoder networks
Procedural modeling using autoencoder networksProcedural modeling using autoencoder networks
Procedural modeling using autoencoder networks
 
Generating sentences from a continuous space
Generating sentences from a continuous spaceGenerating sentences from a continuous space
Generating sentences from a continuous space
 
ウェブサイト最適化のためのバリエーション自動生成システム
ウェブサイト最適化のためのバリエーション自動生成システムウェブサイト最適化のためのバリエーション自動生成システム
ウェブサイト最適化のためのバリエーション自動生成システム
 
Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...
Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...
Improving the Sensitivity of Online Controlled Experiments by Utilizing Pre-E...
 
Machine learning meets web development
Machine learning meets web developmentMachine learning meets web development
Machine learning meets web development
 
Python と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめるPython と Xpath で ウェブからデータをあつめる
Python と Xpath で ウェブからデータをあつめる
 
リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門リミックスからはじめる DTM 入門
リミックスからはじめる DTM 入門
 
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web DataAsia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
Asia Trend Map: Forecasting “Cool Japan” Content Popularity on Web Data
 
UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話UT Startup Gym で人生が変わった話
UT Startup Gym で人生が変わった話
 
ウェブサイトで収益を得る
ウェブサイトで収益を得るウェブサイトで収益を得る
ウェブサイトで収益を得る
 
HTML で自己紹介ページをつくる
HTML で自己紹介ページをつくるHTML で自己紹介ページをつくる
HTML で自己紹介ページをつくる
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おう
 
ウェブサービスの企画とデザイン
ウェブサービスの企画とデザインウェブサービスの企画とデザイン
ウェブサービスの企画とデザイン
 
データベースを使おう
データベースを使おうデータベースを使おう
データベースを使おう
 
第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会 第3期キックオフ説明会+勉強会
第3期キックオフ説明会+勉強会
 
かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう かんたん Twitter アプリをつくろう
かんたん Twitter アプリをつくろう
 
ペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプペルソナシナリオとプロトタイプ
ペルソナシナリオとプロトタイプ
 

Recently uploaded

KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhrKARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhrRodolfFernandez1
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfoganekyokoi
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdfoganekyokoi
 
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイントshu1108hina1020
 
The first time I used CANVA to create a slide document.
The first time I used CANVA to create a slide document.The first time I used CANVA to create a slide document.
The first time I used CANVA to create a slide document.oganekyokoi
 
レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...
レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...
レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...yutakashikano1984
 
International Politics I - Lecture 1
International Politics I - Lecture 1International Politics I - Lecture 1
International Politics I - Lecture 1Toru Oga
 
Registration of travel agents - 'Explanation of the registration system under...
Registration of travel agents - 'Explanation of the registration system under...Registration of travel agents - 'Explanation of the registration system under...
Registration of travel agents - 'Explanation of the registration system under...oganekyokoi
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfoganekyokoi
 

Recently uploaded (9)

KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhrKARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
KARAPATANG PANTAO.pptxhrhrhrhrhrhrhrhrhr
 
Divorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdfDivorce agreements in administrative work.pdf
Divorce agreements in administrative work.pdf
 
What I did before opening my business..pdf
What I did before opening my business..pdfWhat I did before opening my business..pdf
What I did before opening my business..pdf
 
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
3年前期 交通基盤工学 第一回 ガイダンス 交通基盤工学の概要  パワーポイント
 
The first time I used CANVA to create a slide document.
The first time I used CANVA to create a slide document.The first time I used CANVA to create a slide document.
The first time I used CANVA to create a slide document.
 
レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...
レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...
レポートの書き方講座 [大学生初年次向けに対する講義資料] Lecture on how to write a report [lecture mater...
 
International Politics I - Lecture 1
International Politics I - Lecture 1International Politics I - Lecture 1
International Politics I - Lecture 1
 
Registration of travel agents - 'Explanation of the registration system under...
Registration of travel agents - 'Explanation of the registration system under...Registration of travel agents - 'Explanation of the registration system under...
Registration of travel agents - 'Explanation of the registration system under...
 
Establishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdfEstablishment and operation of medical corporations.pdf
Establishment and operation of medical corporations.pdf
 

【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’) Hypothesis

  • 1. Doing Bayesian Data Analysis Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’) Hypothesis 東京大学 松尾研究室 修士2年 飯塚修平@tushuhei 2013/08/25 1
  • 2. この章の内容 1.  パラメタ評価アプローチ (estimation) –  ひとつの事前確率 –  その値は信頼出来る? 2.  モデル比較アプローチ (model comparison) –  ふたつの事前確率 –  どちらのモデルが信頼出来る? 3.  それぞれのアプローチの注意点 2013/08/25 2 仮説検定についてベイジアンの立場から考えよう   彼ってどんな性格なの? どうしようもなく駄目なひとなのか、 とても潔癖で近づきがたいひとなのか、 それとも、その間のどこかなのかな。
  • 3. 導入 •  こういう悩みはつきない –  これからコイントスで先行を決めるんだけど、このコインで大丈夫なのかな? –  この新規開発した薬って本当に効くのかな?プラセボじゃないよね? –  その他諸々の「A と B どっちがいいかな。」 à ベイジアン風に言うと「偏り θ = 0.5」という帰無仮説は棄却されるのか、それ とも採用されるのか? •  ベイジアンだと、伝統的統計学より進んだ考え方で検定することが できる –  棄却 or 採用よりも 95% HDI を得られる方が情報量が多い –  事後確率分布を得ることで、パラメタと信頼度の関係を眺めることができる •  今回取り上げる方法は 2 つ –  パラメタ評価アプローチ 事後確率の 95% HDI の中に帰無値(null value, 仮説検定したい値)が入るか –  モデル比較アプローチ 「帰無値しか許さないモデル」 vs 「それ以外の値も広く許すモデル」 2013/08/25 3
  • 4. パラメタ評価アプローチ •  基本的な考え方 –  もし帰無値が事後確率の 95% HDI の外にあれば、その帰無値は信頼できる値で はない。 –  もし帰無値が事後確率の 95% HDI の中にあれば、その帰無値は信頼できる値の ひとつだと言える。 •  つまり、ひとつの事前確率から事後確率を算出し、帰無値の信頼性 を評価する。 •  実際の例 –  キーボードゲーム(パラメタの値を評価する例) –  ホットハンド・ジンクス(パラメタの値の差を評価する例) 2013/08/25 4
  • 5. 【例】キーボードゲーム •  被験者に以下のようなゲームをプレイしてもらう。 •  被験者はディスプレイに表示された単語に対して適切なキーを叩く。 •  正解すると、報酬を得ることができる。ルールは図の通り。 2013/08/25 5 “radio”   “ocean” ディスプレイ “radio”   “mountain” キーボード F J F J 報酬 報酬
  • 6. 【例】キーボードゲーム •  その後被験者に対して、これまでの学習からは正解がわからないテ ストを与える –  ディスプレイに “radio” とのみ表示する –  ディスプレイに ”ocean” と “mountain” の両方を表示する •  それぞれのテストについて被験者の叩くキーが偏るか? 2013/08/25 6 [Prior] θ = (F が叩かれる回数 / J が叩かれる回数) とし、一様 分布と仮定する。 [Likelihood] テストの結果 得られた尤度。片方のキー に偏っている。 [Posterior] 事後確率の 95% HDI に θ = 0.5 が 含まれなかった。すなわち、被験者は 50:50 でキーを選択するのではなく、いずれかに偏っ ていた。
  • 7. 【例】ホットハンド・ジンクス •  バスケットボールのジンクス: シュートに成功した後の方が、失敗した後よりもシュートが決まり やすくなる。à すなわち θ_AfterSuccess と θ_AfterFailure で違い があるのか? •  θ_AfterSuccess - θ_AfterFailure = 0 が 95% HDI 内に入っている。 à ジンクスなんてなかった 2013/08/25 7
  • 8. 相関するパラメタの場合 •  それぞれの場合のθの分布に着目しても、パラメタ間の関係は見えない。 •  相関の正負は、パラメタの差(この場合 θ1 - θ2)の分布の幅に現れる。 –  正の相関à近似直線(line of equality)の幅が狭い à 0 を 95% HDI に含まず、θ1 と θ2 が異なることを示している。 –  負の相関à近似直線の幅が広い 2013/08/25 8 θ1 とθ2 が相関する場合 θ1 とθ2 が逆相関する場合 95% HDI 0.0279 < (θ1 – θ2) < 0.206 狭い; 0 を HDI に含まない 95% HDI -0.26 < (θ1 – θ2) < 0.494 広い; 0 を HDI に含む
  • 9. ROPE の導入 •  Region of Practical Equivalence •  ROPE を導入することで、実用的な範囲内で帰無値が信頼できるか 否かを判断できるようになる。 –  幅を持たせることで、実用上十分なのに棄却してしまう可能性を減らす。 •  基本的な考え方 –  ROPE 全体が事後確率の 95% HDI の外にあれば、その帰無値は用いることが出 来ない [1] –  ROPE が事後確率の 95% HDI 全体を完全に含んでいれば、その帰無値は採用で きる [2] 2013/08/25 9 ROPE 95% HDI 95% HDIROPE [1] [2]
  • 10. 【例】コインは偏ってるか? •  理想的なコイン: 表が出る確率 θ = 0.5 ß 帰無値 •  ROPE: θ = [0.45, 0.55] •  10,000 回コインを投げて 5,200 回表が出た。 •  à 95% HDI = [0.51, 0.53] •  帰無値は HDI に含まれないが、HDI は十分 ROPE 内に収まっている。 •  実用上、θ = 0.5 として扱って OK 2013/08/25 10 0.45 0.55ROPE 0.51 0.53 95% HDI 0.50 帰無値
  • 11. モデル比較アプローチ •  次に、モデル比較として帰無値の信頼性を考える。 •  帰無モデル (null model): M_null –  帰無値のみを許すモデル •  対立モデル (alternative model): M_alt –  パラメタを広い範囲で許すモデル •  この2つのモデルの比較として、仮説検定問題を捉え直す。 2013/08/25 11
  • 12. M_null (θ1=θ2) M_alt (一様) 【例】ふたつのコインは同じ? •  ふたつのコインの表が出る確 率はそれぞれ θ1, θ2 •  M_null: θ1 = θ2 (ふたつのコ インは同じという帰無仮説) •  M_alt: 一様分布 •  コイントスの回数 N = 7 •  表が出た回数 z1 = 5, z2 = 2 •  p(D|M_null) = 1.94*10^(-5) •  p(D|M_alt) = 3.54*10^(-5) •  p(M_null) = p(M_alt) = 0.5 2013/08/25 12 M_alt がわずかながら勝利 だが、Bayer s Factor の 値は小さい →棄却は難しい
  • 13. 【例】記憶力を高める BGM は? •  被験者にある BGM がかかっている部屋の中で 20 個の単語を暗記 してもらう。 •  θ_ij: 被験者 i が BGM j の元で単語を暗記できる割合 –  思い出せる or 思い出せない(二値)なので、ベータ関数で表すことが可能 θ_ij = beta(θ_ij|μ_j, κ_j, (1-μ_j)κ_i) •  BGM の種類 (平均値) 1.  ヘビメタ (11.85) 2.  バッハ (9.85) 3.  ベートーベン (9.50) 4.  モーツァルト (9.60) à  何かを覚える時はクラシックよりもヘビメタ! à  では、この4つのグループに差があると言えるのか? 「差がある」という帰無仮説は棄却されるのか? 2013/08/25 13
  • 14. 【例】記憶力を高める BGM は? •  まずはパラメタ評価アプローチに戻って、それぞれのグループ間の パラメタに差があるか仮説検定を行う。 –  ホットハンド・ジンクスの例を参照 •  パラメタ μ_j の差をとって比較すると、各グループを [[1], [2, 3, 4]] と分けることができる。特にグループ 1 と 3, 4 の間の差が大きい。 2013/08/25 14
  • 15. 【例】記憶力を高める BGM は? •  モデル比較アプローチでは、以下2つのモデルの比較として問題を 捉え直す。 –  SameMu: 4つのグループ間で差がないとするモデル(帰無モデル) –  DiffMu: 4つのグループ間で差があるとするモデル(対立モデル) •  MCMC で見てみると、SameMu の方が勝っている。 à 4つのグループには差がない?? 2013/08/25 15
  • 16. 【例】記憶力を高める BGM は? •  結局、4つのグループは同じなの?違うの? •  【モデル比較アプローチ】 4つのパラメタをすべてのグループが共有するモデルと、それぞれ のグループが異なるパラメタを持つモデルの比較では、前者の方が 良かった。が、ベストではない。 •  【パラメタ評価アプローチ】 4つのモデルで異なるパラメタを持たせて比較した結果、[[1], [2, 3, 4]] とグルーピングできた。 •  à グループ 1 と グループ 2, 3, 4 でパラメタを分ける 2-パラメタモ デルが実は最も優秀である (Ex 12.1 で確認すべし) 2013/08/25 16 彼ってどんな性格なの? どうしようもなく駄目なひとなのか、 とても潔癖で近づきがたいひとなのか、 それとも、その間のどこかなのかな。
  • 17. 注意点 パラメタ評価アプローチ •  ROPE と HDI の幅の比は、帰無値が正しい確率を表しているのではない。 パラメタが帰無値に等しい確率を表しているのだ。 •  十分に比が大きい時のみ、この値は意味を持つ。何故なら、データが十分 でないとき、HDI の幅が大きくなってこの比が小さくなる可能性があるか らだ。 モデル比較アプローチ •  あくまで帰無モデルの信頼性は相対的なもの。 –  記憶と BGM の例を参照。 •  そのため、対立モデルは十分に吟味された、うまくいきそうなモデルを採 用すべきである。 –  慣習だからといって、何も考えずに一様分布モデルを採用するのは危険。 –  ベストなモデルがその過程で見過ごされてしまう可能性がある。 •  そのためには、事前知識を駆使して妥当なモデルを考えること。 2013/08/25 17