Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Upcoming SlideShare
What to Upload to SlideShare
What to Upload to SlideShare
Loading in …3
×
1 of 14

R集会@統数研

2

Share

Download to read offline

2019年12月21日(土)統計数理研究所

R集会@統数研

  1. 1. 機械学習の数理100問 R言語バージョン 大阪大学 鈴木 讓 R研究集会@統数研 2019年12月21日 @Joe_suzuki
  2. 2. 鈴木 讓 (すずきじょう, Joe Suzuki) 大阪大学大学院基礎工学研究科 数理科学領域 教授 (基礎工学部情報科学科数理科学コース) 専門: データ科学、機械学習、グラフィカルモデル 開発CRAN パッケージ: BNSL R言語は、Rstudioではなくコマンドライン 規模が大きくなると、Rcppに移植 user 2015@Aalbolg 参加
  3. 3. 数学50% R言語50% 問題番号 分野 1-18 線形回帰 19-31 分類 32-39 リサンプリング 40-48 情報量基準 49-56 正則化 57-68 非線形 69-74 決定木 75-87 サポートベクトルマシン 88-100 教師なし学習 bayesnet.org/100.pdf 解く時間 阪大学部 阪大M1 30分以内 70% 90% 30分以上 2時間以内 25% 10%未満 2時間以上半日以内 5% 若干 丁寧すぎるヒントがついている 理系学部1年の線形代数を仮定
  4. 4. 問題どうしつながっている 数学的な導出 ヒント盛りだくさん R言語での実現 動作確認 数学で正確な判断をしたことが、正当化される ロジスティック回帰の最尤法の例
  5. 5. 講義の演習問題 R言語の学習と統計学の学習の相乗効果 時期 所属 科目 2016年後期 理学部数学科 実験数学 3 2017,2018,2019後期 基礎工数理科学 計算数理 B 基礎工 情報科学科 数理科学コース (履修前に、R言語と数理の基礎) G. James, D. Witten, R. Tibshrani, T.Hastie ``Introduction to Statistical Learning with R”
  6. 6. Rを使った統計教育の問題意識 • パッケージにデータを放り込むだけ 頭を使わない人生を奨励している • 使い方を覚えるだけ 学問は毎日変化・成長している 学生を、明日の化石にしている 講義の目標 学生の頭の中に数理的なロジックを構築できないか
  7. 7. データ関連人材育成関西地区コンソーシアム(duex.jp) 神戸大、奈良先、和歌山大、滋賀大、阪大、阪府大+阪市大 通信教育(e-learning): 100問 + ビデオ教材
  8. 8. ビデオ@vimeo (機械学習の数理、スパース、ベイズネット、統計学)
  9. 9. 書籍としての出版 機械学習の数理100問: 統計的学習 with R (共立出版) 問題番号 分野 問題 0章 線形代数 なし 1章 線形回帰 1-18 2章 分類 19-31 3章 リサンプリング 32-39 4章 情報量基準 40-48 5章 正則化 49-56 6章 非線形 57-68 7章 決定木 69-74 8章 サポートベクトルマシン 75-87 9章 教師なし学習 88-100 bayesnet.org/main.pdf B5 220ページ 2020年3月中旬発行予定
  10. 10. 類似書籍との比較 分量が多い 数学的 コードがない ロジックより直感 プレゼンがうまい Rの使い方 しきいが高い プロには物足りない 新書の位置づけ 分量が少ない Rのソース 数学的な感動
  11. 11. 国内の既存の機械学習書籍への問題意識 • 「ななめ読み」を前提 • 「身につける」がない 新書のねらい: 手を動かす 数式を導出 Rコードを組立てる (パッケージよりスクラッチ)
  12. 12. 執筆における苦心: Rによる作図 Library(tikzDevice) tikz(“fig1-7.tex”,width=4.0,height=3.2) curve(soft.th(5,x),-5,5) dev.off documentclass[dvipdfmx,a4j]{jbook} usepackage{tikz} begin{figure} input{fig1-7} caption{label{fig1-7} 図を表示} end{figure} tikz形式(テキスト)を fig1-7.texという ファイル名にはきだす 出力されたtikz形式を 手で修正する
  13. 13. スパース推定と機械学習への応用 100問: 近日公開 数理 + R言語 2018年前期の大学院講義(90名が受講): 129問を提供 2019年11月行動計量学会セミナー(62名が受講): 86問を提供 2019年後期の学部3年, 学年4年, 博士のセミナーで93問を提供 bayesnet.org/sparse.pdf
  14. 14. 書籍の将来展望 機械学習の数理100問シリーズ (共立出版) 1. 統計的学習 with R 2. 統計的学習 with Python 3. Lasso with R 4. Lasso with Python 5. 機械学習のためのカーネル with R 6. 機械学習のためのカーネル with Python 7. グラフィカルモデルと因果推論 with R 8. グラフィカルモデルと因果推論 with Python 対応する100問に対するビデオを公開予定 W○○○○○ful Rシリーズ からの誘いもあったが。。。

×