講演者: 小宮山純平 先生 (東京大学生産技術研究所) 概要: 多腕バンディット問題は、情報の探索と活用のトレードオフを解決するための最も単純なモデルである。 この問題は1930年代から統計家によって扱われてきたが、近年オンライン広告配置などへの応用を契機として機械学習分野で研究が加速している。 本発表では、前半で多腕バンディット問題の定式化について説明した後、後半でオンライン広告配置、A/Bテスト、囲碁アルゴリズムなどの応用について解説する。Read less