Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Upcoming SlideShare
What to Upload to SlideShare
What to Upload to SlideShare
Loading in …3
×
1 of 68

心理学におけるベイズ統計の流行を整理する

6

Share

Download to read offline

ベイズ塾のベイズ統計モデリングワークショップで発表したスライドです。

心理学におけるベイズ統計の流行を整理する

  1. 1. 心理学における【ベイズ統計】の 流行を整理する 清水裕士 関西学院大学 社会学部
  2. 2. 自己紹介 • 清水裕士 – 関西学院大学社会学部 • 専門 – 社会心理学 • Web – Twitter: @simizu706 – Website: http://norimune.net
  3. 3. ワークショップの流れ • 午前 – ベイズ統計の流行についての交通整理 • および、ワークショップの趣旨について – 仮説検証・モデル評価についての解説 • JASPの紹介、ベイズファクターについての解説 • 午後 – ベイズモデリングの実践例 • 基礎から臨床まで、さまざまな角度からモデリング例を紹介 – これからモデリングをする人のための学びルート • 実際にモデリングする・論文を書くための知識など
  4. 4. 本ワークショップで言いたいこと
  5. 5. 本ワークショップで言いたいこと × 頻度主義をやめてベイズ主義でやろうぜ ○ 心理学でモデリングやっていこうぜ
  6. 6. 本ワークショップで言いたいこと × p値やめてベイズファクター使おうぜ ○ モデル評価の観点は様々あるぜ
  7. 7. 本ワークショップで言いたいこと × t検定とか分散分析やめようぜ ○ モデリングと伝統的手法は共存する
  8. 8. 本ワークショップで言いたいこと ○ MCMC最高(*´Д`)ハァハァ ○ モデリングはいいぞ ※効果には個人差があります
  9. 9. ところで最近・・・
  10. 10. ベイズの本めっちゃ出てる
  11. 11. ベイズの本めっちゃ出てる
  12. 12. ベイズの本めっちゃ出てる
  13. 13. 今日の僕のお話 • ベイズ統計学についての整理 – なんかいろいろみんなベイズベイズ言っちゃって るけど、いったい何なの? – どういう流行なの? • ベイズ統計モデリング推し – 統計モデリングって何? – ベイズとどういう関係にあるの? – 伝統的な手法(t検定や分散分析)とどう違うの?
  14. 14. 特集号「統計革命」 • 三浦麻子・岡田謙介・清水裕士 企画 – オープンサイエンス – 仮説評価 – モデリング – 論文書く側だけでなく、査読する側にとってもこれ から必須になる知識を得るための道しるべ
  15. 15. 近日公刊!
  16. 16. 清水(印刷中)
  17. 17. ベイズ統計学の流行 • ずっと昔からベイズの長所は指摘されてきた – 今に始まった話ではない • ではなぜ、最近特に、心理学で「ベイズ統計」 という言葉をよく聞くの? • ここでは大きく分けて2つの理由を挙げたい – 心理学の再現性問題 – 統計モデリングとMCMCのコラボがハマった
  18. 18. ベイズ統計学の流行 • 理由1:伝統的な仮説検定の限界 – 再現性問題 – QRPに、伝統的統計学のわかりづらさも原因 – 仮説検定の代替手段としてのベイズ統計 • 理由2:統計モデリングの発展 – 実験系・社会科学系でモデリング手法が発展 – GLMM以降は最尤法では限界 – 確率的プログラミング言語でより柔軟なモデル – ベイズ統計モデリングが注目を得ている
  19. 19. ベイズが流行ってる見取り図 心理学再現できへんで! 帰無仮説検定への批判 ベイズ統計のわかりやすさ 仮設評価の自然さ 統計モデリング 機械学習 従来法では解けない問題 MCMCによるベイズ推定 確率的プログラミング言語 MCMC(*´Д`)ハァハァ 心理学における「ベイズの流行」 ※あくまで個人の感想です
  20. 20. 伝統的な仮説検定の限界
  21. 21. • 経験科学における大前提 –同じ条件・同じ手続きで実験を行えば,同じ 結果が得られる • 心理学における再現性の保証 –統計的検定の利用 実験結果の再現性 p値
  22. 22. 心理学実験再現できへんで?
  23. 23. 心理学の再現性問題 • 実験結果が再現されない – 疑わしい研究実践:QRP • 有意になるまでデータを足す • いろんな指標で検定を試す • データを見た後で仮説を設定する:HARKing • 有意性検定に対する過度な信頼と圧力 – 統計的に有意な結果なら大丈夫 – とりあえず有意にならないと論文にならない
  24. 24. 仮説検定からもう一歩 • p値「だけ」からの脱却 – 効果量に注目しよう – 信頼区間に注目しよう • 仮説検定からの脱却 – ベイズ統計の可能性 – より自由な仮説設定へ – 予測に使いやすい
  25. 25. 頻度主義からベイズ統計へ • 仮説検定がどうも変な理屈である – 帰無仮説を設定して,それが間違えていることをデー タで示す – 95%信頼区間は,同じサンプルサイズのデータをたく さんとったときに,その範囲に真値が95%の確率で含 まれる区間のこと • ベイズのほうが直感に合う? – 研究仮説が正しい確率がわかる – パラメータの確率的範囲が直接わかる
  26. 26. ベイズファクター • ベイズ統計学における仮説評価の基準 – 仮説Aと仮説Bのどちらが確からしいかを比率で 表す – 仮説AがBより何倍確からしい • みたいな • モデル比較・仮説評価は北條さんの発表で 触れますのでお楽しみに
  27. 27. 本ワークショップで言いたいこと × 頻度主義をやめてベイズ主義でやろうぜ ○ 心理学でモデリングやっていこうぜ
  28. 28. ベイズ統計モデリング • 心理学で流行りつつある方法論 – 特に、ベイズ認知モデリング
  29. 29. 統計モデリングとは? • 確率モデルをデータに当てはめて現象の理 解と予測を促す営み – 松浦(2016) • 伝統的な手法も含まれる? – そのとおり – しかし、強調点が少し違う
  30. 30. たとえば回帰分析 • 𝑌𝑖 = 𝛼 + 𝛽 𝑋𝑖 + 𝑟𝑖 • 𝑟𝑖~ 𝑁𝑜𝑟𝑚𝑎𝑙 0, 𝜎 – 切片𝛼、回帰係数𝛽 – 残差が正規分布に従う • 平均0、残差分散𝜎2 • データ生成についての確率モデル – 𝑌𝑖 ~ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇𝑖, 𝜎 :確率的関係 – 𝜇𝑖 = 𝛼 + 𝛽𝑋𝑖 :確定的関係 • 上と同じモデル
  31. 31. 平均𝜇𝑖 = 𝛼 + 𝛽𝑋𝑖の正規分布 青い破線は95%予測区間
  32. 32. データ生成メカニズムを考える? • データがどういう確率的+確定的な法則で得 られるのかを考える • 心理学的なデータ生成の発想 – 母集団に特定の確率分布を仮定して、そこから サンプリングされたものがデータ • つまりは、母集団分布の想定がデータ生成メカニズム のスタート – あるいは、行動生起確率を考えて、その確率が どういうメカニズムで説明できるか
  33. 33. 伝統的なデータ分析手法との違い • t検定や分散分析との違いは? – 数理的には統計モデリングの範疇 • なんだけども、目的がちょっと違う – 実験計画法とセットになった手法である – 因果効果の推定が主眼である – 効果の差から、心理メカニズムを推論
  34. 34. 例:ストループ課題 • 統制群と実験群 – 統制群:色パッチの色を答える – 実験群:色文字の色を答える • 色と文字の意味内容が不一致な場合に、回答時間が 遅れる • 認知的葛藤を反応時間の差で取り出す – 群間の「差」から、その背後にある心理的なメカニ ズムを推論・検証する 黄 緑
  35. 35. 統計モデリングは? • データ生成を確率分布で表現する – 𝑌𝑖 ~ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇𝑖, 𝜎 • 確率分布のパラメータに構造を想定する – 𝜇𝑖 = 𝛼 + 𝛽𝑋𝑖 • 現象の説明や予測を行う – 推定されたパラメータや、確率モデルそのものを 使って現象の説明や予測を行う
  36. 36. 例:遅延価値割引 • 今すぐもらえる5000円 • 1年後にもらえる5000円 – どっちがほしい? • 多くの人は今すぐの5000円がほしい – では、1年後の5000円は、今すぐでいえばどれぐ らいの価値と同じぐらいになるのか? – 1年後の1万円と比較したらどうなる?
  37. 37. 遅延価値割引 • 指数割引(複利計算モデル) – 𝑉 = 元の価値 × 𝑒−𝑘𝐷 – 𝑉は主観的価値、𝑘は割引率、𝐷は遅延時間 – 時間によって主観的価値の減少率が一定 • 双曲割引(単利計算モデル) – 𝑉 = 元の価値 × 1 1+𝑘𝐷 – 時間が経つと主観的価値の減少率が小さくなる
  38. 38. 遅延価値割引 𝑉 = 5000 × 1 1 + 𝑘𝐷 𝑉 = 5000 × 𝑒−𝑘𝐷 遅延時間 主 観 的 価 値
  39. 39. 行動生起メカニズム • 即時報酬と遅延報酬、どちらを選択するか – 即時報酬:いますぐ5000円 – 遅延報酬:1年後の1万円 • 選択が行動データ – 二値データ – 即時報酬を選択する確率𝜃を推定したい
  40. 40. 行動生起メカニズム • 𝑌~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝜃) – ベルヌーイ分布(二値データの確率分布) – 𝑌:いますぐ5千円か、12か月後に1万円かの選択 • 選択確率𝜃の心理メカニズムを想定する – 𝑉𝑖 = 5000: 即時報酬の主観的価値 – 𝑉𝑑 = 10000 1+𝑘∗12 : 遅延報酬の主観的価値 – 𝜃 = 1 1+exp 𝛽 𝑉 𝑖−𝑉 𝑑 • ロジスティックモデル • 𝛽は主観的価値に従って行動選択する程度(逆温度) もしk=0.1なら、𝑉𝑑 = 4545
  41. 41. どのモデルが妥当なの? • 双曲割引と指数割引どっちが正しい? – 本当のところどれが正しいのかはわからない – しかし、手元にあるデータから考えてどっちが 合ってるのか、どっちが予測力がありそうかは検 討できるかもしれない • モデル評価・モデル比較 – 次の北條さんのトークを待て!
  42. 42. ここまでのまとめ • 統計モデリング – 行動の生成メカニズムを確率分布で表現 – パラメータに構造(確定的関係)を想定して、心理 メカニズムを数理的に表現する – 必要に応じてモデル比較 • 伝統的な心理学の分析手法 – 実験計画と因果推論の枠組み – 群間の「差」から心理メカニズムを推論
  43. 43. 伝統的な分析手法との考え方の違い • 伝統的な手法 – 「差」を出すことに焦点があたっている – 緻密に設計された実験計画法と、有意な「差」か ら、その背後にある心理メカニズムを一つずつ確 かめていくというパラダイム • 線形モデル+有意性検定という枠組み – 有意性検定の結果が正しければ、データがどう いう分布なのかはあまり気にならない
  44. 44. 伝統的な分析手法との考え方の違い • 正規分布に近づけるためのデータ変換 – 対数変換などを施して正規分布に近づける – →統計モデリングでは極力得られたデータそのもの の生成メカニズムを考えたい • 標準誤差や自由度の補正 – モデルにデータが合わない場合(不均一分散や系列 相関など)に補正を行う – →補正をするのではなく、モデルそのものを構築しな おしたい
  45. 45. ちょっと待って
  46. 46. ベイズどこいったの?
  47. 47. ベイズ推定と統計モデリング • ベイズはどう関わるの? – 統計モデリングにおいてベイズは「本質的な」要 素ではない – しかし、ベイズ統計ととても相性がよい • ベイズと相性がいい理由 – 階層モデルが容易に構築可能 – MCMC+確率的プログラミング言語の利用
  48. 48. 階層モデルが容易に構築可能 • 階層モデルとは – 確率分布のパラメータに、確率分布を仮定するモデル – マルチレベルモデルなどがそれに該当 • 階層線形モデル – 個人を𝑖,集団をjで表現 – 𝑌𝑖𝑗 ~ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇𝑖𝑗, 𝜎 – 𝜇𝑖𝑗 = 𝛼𝑗 + 𝛽𝑋𝑖 – 𝛼𝑗 ~ 𝑁𝑜𝑟𝑚𝑎𝑙(𝛾, 𝜏):𝛼に確率分布が仮定される • 切片が集団ごとで異なり、それが正規分布に従うというモデル
  49. 49. ベイズと階層モデル • 最尤法の場合 – 頻度主義ではパラメータは固定値 – パラメータに確率分布の想定ができない – よって、階層モデルを解くには階層化したいパラメー タを積分して尤度関数からなくす必要がある • これは、多くの場合、困難 • ベイズの場合 – パラメータに確率分布を想定可能 – よって、ごく自然に階層モデルを表現可能
  50. 50. 階層モデルの利点 • 想定したモデルの個人差を考える – 遅延価値割引の例 • 双曲割引の割引率kに個人差を考える • 全員が同じ割引率であると考えるのは仮定が強すぎる – しかし、個人ごとに別々のモデルを想定すると、推定の精 度は悪くなる • 割引率に確率分布を仮定する – 𝑉𝑖 = 1 1+𝑘 𝑖 𝐷 – 𝑘𝑖 ~ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇 𝑘, 𝜎 𝑘 • 割引率𝑘がさらに正規分布に従うモデル • 割引率の個人差に緩い制約を置くことで、推定を安定化
  51. 51. MCMCによるベイズ推定 • マルコフ連鎖モンテカルロ法 – 詳しくはたくさん書籍が出てるのでご覧ください • MCMCの何がいいのか – 汎用的な推定アルゴリズム • 大抵のモデルを解くことができる – パラメータの分布情報がすべて手に入る • 推定精度が正確に評価できる • 予測分布の計算などが容易にできる
  52. 52. 確率的プログラミング言語 • 松浦(2016)による定義 – 様々な確率分布の関数や尤度の計算に特化した関 数が豊富に用意されており,確率モデルをデータに あてはめることを主な目的としたプログラミング言語 – Probabilistic Programming Language : PPL • ざっくりいえば – 用意された豊富な確率分布によって確率モデルを記 述するだけで、パラメータが推定可能 – MCMCなどの汎用的な解法アルゴリズムによって可 能になった
  53. 53. PPLにはどんなものがあるの? • WinBUGS – 結構昔からあるやつ – 今使ってる人は少ないかも • JAGS – WinBUGSと同じような文法で動く – 比較的使いやすいが、開発スピードは遅め • Stan – Gelmanのチームが作ってる – 開発がまだまだ進んでいて、機能も多様 • 他にもいろいろある
  54. 54. PPL(Stan)で回帰分析 • 読み込むデータ – サンプルサイズ: 𝑁 – 目的変数:𝑌 – 説明変数:X • 推定したいパラメータ – 切片:𝛼 – 係数:𝛽 – 残差SD:𝜎 • 推定したいモデル – 𝜇𝑖 = 𝛼 + 𝛽𝑋𝑖 – 𝑌𝑖 ~ 𝑁𝑜𝑟𝑚𝑎𝑙 𝜇𝑖, 𝜎
  55. 55. 遅延価値割引の例 • 𝑉𝑑 = 5000 × 1 1+𝑘𝐷 𝑠 – 双曲線に指数sをつけたモデル – これを最尤法で自力で解こうとすると結構大変 • PPLならこのモデルの式を書くだけでOK
  56. 56. MCMC+PPLのパワー • これまでの統計ソフト – 新しい分析法に対応するのは時間がかかる • Rであっても、パッケージが出るまでラグがある – 自分で新しいモデルを作ったら・・・? • 自分で解くためのアルゴリズムを用意する必要 • MCMC+PPL – モデルの数式を書くだけで勝手に解いてくれる – 先行研究をベースに、自分なりのアレンジを加えたい 場合でも、すぐに対応することができる
  57. 57. ベイズ統計モデリングによって • Carlin and Chib (1995) – 「どんなモデルを利用するかどうかは,ユーザーの想 像力によってのみ制限される」 – 「解けない」という制約によって心理学のモデル構築 に制限がかけられることはかなり減る • 逆に言えば, – 研究者側にその自由に答えるための知識や洞察力, 数学的な素養などが求められる・・・。
  58. 58. ベイズ統計モデリングと 伝統的な手法の共存
  59. 59. なぜ心理学で統計モデリングなのか • 理論に基づいた行動生起メカニズムを表現 – これまでは理論で想定された心理指標の推定を簡便 的にしか推定できないものも多かった • 例:信号検出理論、遅延価値割引・・・ – モデルを数学的に表現できるようになる • 強いモデルへのシフト • 分析の透明性・再生可能性が高くなる – PPLによってどういうモデルを作ったか一目瞭然 – 誰でも、いつでも同じ分析ができる – プレレジストレーションで先に公開するのもアリ
  60. 60. 分散分析「僕はもういらない子なの?」
  61. 61. 本ワークショップで言いたいこと × t検定とか分散分析やめようぜ ○ モデリングと伝統的手法は共存する
  62. 62. いらない子じゃない • モデリングと排他的な存在ではない – なぜなら目的が違うから • 分散分析など実験計画法とセットの手法 – 因果推論に対して強い武器を持っている • 統計モデリング – 心理メカニズムを数理的に表現し、パラメータを推定 する – モデル構築に対して強い武器
  63. 63. 共存も可能 • 遅延価値割引の例 – 階層モデルによって推定された割引率 – 個人差を表すパラメータ • 衝動性などの心理的な特徴を示すといわれている • 割引率と別の変数の相関、群間の「差」 – 推定されたパラメータ+伝統的な統計手法 – 他の変数との相関・因果効果を見ることも可能 – もちろん、どの割引率のモデルが有効かも検討する
  64. 64. あえて言うなら・・ • ある一部に見られる – 「やみくも」に正規分布を仮定した線形モデルに データを当てはめて, – 有意性「だけ」を確認するような分析手法 • いわゆる「ブラックボックス統計学」 – 久保(2012) – 統計モデリングの登場によって影を潜めていく可 能性はある・・・。
  65. 65. 本ワークショップで言いたいこと ○ MCMC最高(*´Д`)ハァハァ ○ モデリングはいいぞ ※効果には個人差があります
  66. 66. ご清聴ありがとうございました

×