SlideShare a Scribd company logo
1 of 16
Download to read offline
御近所圧力効果の推定
2018/04/21
Tokyo.R
@housecat442
スライドの内容に関して
● American Economic Association Annual Meeting 2018でSusan AtheyとGuido
Imbensが行ったtutorialを参照としています。
● 利用したデータとコードの大部分はこちらが本元です。
● 機械学習を利用した平均的な因果効果の推定方法の紹介が目的です。
Social Pressureの影響を知りたい
とある投票日の行動選択 ● 投票に行っても良いし
● 野球に行っても良い
● 以下の要因から行動を決定していると考える
○ 個人の投票結果から得られる利得
○ 外的なプレッシャー
Social Pressureの影響を知りたい
とある投票日の行動選択 ● 何もしなければ野球する人が居る
● アクションを取った場合には投票するかも
圧力を加える
御近所の投票参加履歴を送る 「介入する/しない」どちらかしか観測できない
Social Pressureの影響を知りたい
who treatment outcome
● ランダムに人を選んで圧力を与えた場合
○ A/Bテスト, RCTの状況
○ 圧力の有無の平均差が圧力の効果になる。
● 何かしらのルールを持って圧力をかける人を選んだ場合
○ 単純に平均差を取ると、ルールによる差が含まれる。
○ 「圧力の効果+ルールによる差」を得てしまう
→この状況でどうするか?という話
データについて
● オリジナルのデータ はRCTのデータ
○ 履歴はランダムに選んだ人に与えている
○ このデータからATEが解っている状態
● このデータに手を加えて sampling biasを作り出す
○ treatment群は投票行きそうな人を減らす
○ control群は投票行かなそうな人を減らす
→投票しなさそうな人に履歴を送るというシナリオ
control treatment
control treatment
ATE_RCT
ATE_est
比
較
miss
平均比較
● 全データでの W=1 と W=0 の平均の比較が履歴(圧力)Wの効果。
→効果の値が0と有意差があるかを検定する必要がある。
W=1の時のYの平均 W=0の時のYの平均
W=0の数 W=1の数
W=0の時のYの分散 W=1の時のYの分散
平均比較
● 縦軸がATE推定値
● oracle = データを削る前の結果
● naive = データを削ったあとの結果
oracleが一番正しい値なので、
naivenの結果は散々な事が分かる。
→sampling biasのあるデータで集計で意思決定
するのはいくらかリスクがある。
重回帰
● 重回帰で推定
● 関係性しそうな変数を突っ込んでWの係数を見る。
○ 過去の投票履歴とか
○ 性別・年齢・収入・人種 etc...
● 検定はβ_1の標準誤差を見れば良い
重回帰の結果を追加
● 重回帰による推定
● 青は大分oracleに近い事が分かる。
● 投入した変数Xの効果がちゃんとコントロー
ルされていると考えられる。
single-equation LASSO
● 圧力のパラメーター以外に正則化を使う
● 変数の選択を正則化に任せるという設計
● Wの係数がATEを表す
Single Equation Lasso
● seの出し方が不明だったので省略
● Direct Methodよりも悪そう
● 全部正則化させたUsual LASSOも表示
● 正則化によるバイアスの影響を受けている
のが分かる。
Belloni-Chernozhukov-Hansen(2013)
1. Wを予測する為のLASSO Logistic Regressionを解く
2. 1で係数が0にならなかった特徴量だけ取り出す
3. 2で選択した特徴量と WでYを説明するOLSを解く
4. Wの係数を解釈する
● 変数選択を自分でしなくてよい。
● ドメイン知識が変数の選択に対して無力な時に良いとされる
● k>nでも使える
Belloni et.alの結果
● 推定値もoracleに近いし、seも良い感じ。
● 変数選択を挟んでいる分 Direct methodよりも改
善している。
めでたしめでたし?
まとめ
● 御近所圧力で投票率が8%上がってた
● LASSOで変数選択をして、OLSというBelloni et.alの方法がよかった。
● データの特長によって、別の方法の方が良いことは大いにある。
● とりあえず集計だけで判断せず重回帰か傾向スコアで良いので使おう。
Enjoy!

More Related Content

More from Shota Yasui

Xgboost for share
Xgboost for shareXgboost for share
Xgboost for shareShota Yasui
 
重回帰分析で頑張る
重回帰分析で頑張る重回帰分析で頑張る
重回帰分析で頑張るShota Yasui
 
Dynamic panel in tokyo r
Dynamic panel in tokyo rDynamic panel in tokyo r
Dynamic panel in tokyo rShota Yasui
 
Rで部屋探し For slide share
Rで部屋探し For slide shareRで部屋探し For slide share
Rで部屋探し For slide shareShota Yasui
 

More from Shota Yasui (6)

Prml nn
Prml nnPrml nn
Prml nn
 
Xgboost for share
Xgboost for shareXgboost for share
Xgboost for share
 
重回帰分析で頑張る
重回帰分析で頑張る重回帰分析で頑張る
重回帰分析で頑張る
 
Dynamic panel in tokyo r
Dynamic panel in tokyo rDynamic panel in tokyo r
Dynamic panel in tokyo r
 
Rで部屋探し For slide share
Rで部屋探し For slide shareRで部屋探し For slide share
Rで部屋探し For slide share
 
Salmon cycle
Salmon cycleSalmon cycle
Salmon cycle
 

TokyoR 20180421