Gunosyデータマイニング研究会 #97でA/Bテストに関して述べている KDD2007の論文"Practical Guide to Controlled Experiments on the Web:
Listen to Your Customers
not to the HiPPO"を紹介した記事になります。著者はMicrosoftの方です。
1. Practical Guide to Controlled
Experiments on the Web:
Listen to Your Customers
not to the HiPPO
Ron Kohavi
Randal M. Henne
Dan Sommerfield
KDD 2007
Keisuke OSONE
Gunosy データマイニング研究会
2015. 12. 21
3. Practical Guide to Controlled
Experiments on the Web:
Listen to Your Customers
not to the HiPPO
Ron Kohavi
Randal M. Henne
Dan Sommerfield
KDD 2007
Keisuke OSONE
Gunosy データマイニング研究会 論文紹介
2015. 12. 21
28. 3.4 Limitations
• Quantitative Metrics, but No Explanations
• どっちのvariantがいいかはわかるがなぜかわからない
• Short Term vs Long Term Effects
• よいOECは容易に行かないである(ClickをあげるにはAdsを全
面に出せばいいがそれでいいのか?)
• Primacy and Newness Effects
• ナビゲーションを変えたときなどはユーザが不必要に触る(ホー
ソン効果)、数週間はみるべき
33. 5. LESSONS LEARNED
The Difference between theory and practice is larger in
practice than the difference between theory and practice
in theory.
— Jan L.A.va de Snepscheut
34. 5.1.1 Mine the Data
• OECにおいてはひとつの統計的な有意差しかでな
いが、幅広いバージョンのユーザが利用しているの
機械学習で何か発見できるかもしれない
36. 5.1.3 Test One Factor at a Time (or Not)
• テストはひとつの指標でしたほうがよい
• 複数の指標でやるのは大変
37. 5.2 Trust and Execution
Run Continuous A/A Tests
• まずA/Aテストを行い、データがマッチしているかなど確認す
る
• A/Aテストの結果に有意差がないか確認 (A/Aテストはパラレ
ルでよい)
Automate Ramp-up and Abort
• 有意に下がった場合には、すぐやめる (オンラインですぐにや
められるようにする)
38. 5.2 Trust and Execution
Determine the Minimum Sample Size
• ミニマムサイズを決める
Assign 50% of users to Treatment
• 半分のユーザをtreatmentに入れる (そうすれば99%/1%の25倍
のテストができる)
Beware of Day of Week Effects
• 曜日の影響を考慮する (1週間は少なくともやったほうがよい、国
によっても異なる)
39. 5.3 Culture and Business
Agree on the OEC Upfront
• Controlled Experimentsは定量的に新機能の効果
を測定できる
• 一番いいのはlife time valueを推測すること
• 実験にひとつの指標は必ずしも必要ではないが、ゴー
ルを明確にすることができる
40. Beware of Launching Features that Do not Hurt Users
• 統計的に差が出なくても、ネガティブではなく検出されなかっただけ
Weigh the Feature Maintenance Costs
• 差があったとしてもメンテナスコストも考えよう
Change to Data Driven Culture
• オンラインの実験はユーザが新機能をどのように使っているかわかる
• Webの世界では消費者のFeedbackで動的に変化できる
• OECと吟味された実験でゴールを目指せ
5.3 Culture and Business
41. SUMMARY
Almost any question can be answered cheaply,quickly and finally,
by a test campaign.
And that's the way to answer them – not by arguments around a
table.
Go to the court of last resort – buyers of your products.
— Claude Hopkins,Scientific Advertising,1922