Doing Baysian Data Analysis Chapter192. +
Contents
19.1 Bayesian Multifactor ANOVA
19.2 Repeated Measures, a.k.a. Within-Subject Designs
19.3 R Code
19.4 Exercises
1
3. +
Poem
Sometimes I wonder just how it could be, that Factors aligned
so you’d end up with me. All of the priors made everyone think,
that Our interaction was destined to shrink.
あなたが一直線に並べた要因が私と一緒になってしまったら、
いったいどの様になってしまうのか、私は時々不思議に思う。
全ての事前分布のために、私たちの交互作用が縮小する運命に
あると誰もが考える。
2
7. +
19.1.1 Interaction of Nominal Predictors
同じグラフでも異なる解釈が存在、左のグラフの矢印は交互作
用を示す
一方の変数の水準を固定した時、もう一方の変数の各水準の交
互作用の逸脱度の和はゼロ
6
9. +
19.1.1 Interaction of Nominal Predictors
ベースラインからの平均逸脱度は“主効果”
他の変数を固定した時の平均逸脱度は“単純効果”
交互作用がある場合、“主効果”と“単純効果”は等しくない
8
11. +
19.1.2 The Hierarchical Prior
Yiは正規分布、簡略化のためとANOVAと比較しやするするた
めに、分散の均一性を仮定
各変数と交互作用に対して、個別に超事前分布を置くため、一
つの変数の効果が分かったとしても、他の変数の効果に関する
情報は得られない
一方で、変数内の各水準の逸脱度は、同変数内の他の水準の逸
脱度に対する情報を与える(超事前分布、事前分布が共通のた
め)
10
12. +
19.1.3 An Example in R and BUGS
4つの学部と3つの職階で平均給与のモデルを作る
Y:平均給与 X1:学部 X2:職階
各水準の組み合わせでサンプル数が大きく異なると、通常の
ANOVAでは計算上問題が生じるが、BANOVAでは問題ない
11
14. +
19.1.4 Interpreting the Posterior
BFIN vs CEDP : 95%HDIがゼロから大きく乖離 → 有意な
差
CEDP vs THTR : 95%HDIがゼロを含む→ 有意な差はない
同様に、FT1 vs FT2、FT2 vs FT3も有意な差
13
15. +
19.1.4 Interpreting the Posterior
ただし、各変数の主効果は、あくまでも“平均の効果”
全ての学部においてFT2とFT3の差異は同じではなく、実際に
は交互作用の影響がある
そのため、相互作用を無視して各水準の効果を語るのは誤り
14
16. +
19.1.4.1 Combining Metric and Nominal
Predictors : ANCOVA
勤続年数を加味した上で、学部や職階による影響を評価したい
そこで“共変量”を加味した“共分散分析 : ANCOVA”を行う
ANCOVA : 線形回帰とANOVAの合わせ技、ANOVAと同様に各
水準の逸脱度の和はゼロ
共変量の係数は、水準毎に変えることが可能
総合的な傾きと水準毎の傾きに分離
水準毎の傾きの和はゼロ
水準毎の傾きは正規分布(もしくはt分布)
繰り返しのある線形回帰と本質的には同質、しかし多変量への
拡張の方法が異なる(逸脱度の和がゼロ)
15
20. +
19.1.5 Noncrossover Interactions,
Rescaling, and Homogeneous Variances
左のグラフでは、対数変換により交互作用が消失
交互作用から非交互作用への変換は、線分が交わらず、傾きの符号
が同じ場合にのみ可能
中央のグラフの様に線分が交差する場合は、交互作用は残る
右のグラフは、中央のグラフのX1とX2を入れ替えたもので、
傾きの符号が異なるため、相互作用は残る
水準内の分散を変えることでも交互作用は消失する
変換により分散の均一性を担保できるかは不明
担保できない場合は、均一とみなせる様にデータを変換するか、不
均一な分散を許容できる様にモデルを変更する必要がある
19
21. +
19.2 REPEATED MEASURES, A.K.A.
WITHIN-SUBJECT DESIGNS
同じ被験者に条件を変え、繰り返しテストを行う方法を“繰り
返し測定デザイン”もしくは“被験者内デザイン”と呼ぶ
説明変数に個々の被験者の効果を3番目の効果として追加
刺激の種類と利き腕か否かの例)
2次、3次の相互作用も加味、ただし計算が大変
20
22. +
19.2 REPEATED MEASURES, A.K.A.
WITHIN-SUBJECT DESIGNS
被験者のパラメータを推定するための事前分布を与えるため、
他の被験者の推定値に関する情報を得ることができる
また、被験者間をまたいだ“グループレベル”での超事前分布と
事前分布を与えることで、被験者レベルではなく、グループレ
ベルでの“shrinkage”が実現可能
21
23. +
19.2 REPEATED MEASURES, A.K.A.
WITHIN-SUBJECT DESIGNS
一方、被験者への負荷の観点からデータ収集には制約があり、
被験者一人から一つのデータしか収集できないケースがある
その場合でも、BANOVAは実行可能だが、データ数よりもパラ
メータ数の方が多くなってしまい、パラメータ推定が極めて困
難になるため、モデルのパラメータ数を削減する必要がある
被験者の効果がベースラインにのみ影響するモデルに修正
被験者の効果と処理パターンの効果の交互作用を削除
22
24. +
19.2.1 Why Use a Within-Subject
Design? And Why Not?
“被験者内デザイン”は“被験者間デザイン”より精度が高い
同じ被験者からテスト条件を変えて、繰り返しデータ取得した方が
精度が高くなる
他の被験者からデータ取得した場合、被験者間での水準効果の差異
はランダムサンプリングの影響を強く受けるため、制度が落ちる
しかしながら、“被験者内デザイン”にも問題がある
同じ被験者でも常に同じ状態にある訳ではなく、同じ被験者と言い
がたい(学習効果や疲労などの影響)
学習効果や疲労の影響が全ての実験条件で等しい場合、実験条
件(の順番)をランダマイズすることで、その影響は排除可能
しかしながら、実際には影響が全ての実験条件で等しいとは限
らず、影響が比較可能とは言い切れない
23
25. +
19.2.1 Why Use a Within-Subject
Design? And Why Not?
さらに、次の実験への持ち越し効果も考えられる
持ち越し効果を数学的に解明することは不可能
持ち越し効果が強く疑われる場合、“被験者間デザイン”に立ち戻り
つつ、被験者間のノイズを極力排除するために多くの被験者で実験
を行うようにする
一般的に全てのモデルは観察の独立性を仮定しているが、繰り
返し測定の場合、この仮定の正当性は弱いため、実験条件をラ
ンダマイズして、持ち越し効果を最小化する様に努める必要が
ある
24