Submit Search
Upload
Rで売上予測のデモ(回帰分析)
•
5 likes
•
8,096 views
裕
裕美 成田
Follow
2015/12/22 第八回雑談会で発表した内容です。
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 18
Download Now
Download to read offline
Recommended
機械学習を用いた予測モデル構築・評価
機械学習を用いた予測モデル構築・評価
Shintaro Fukushima
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
諒介 荒木
Osaka.Stan #3 Chapter 5-2
Osaka.Stan #3 Chapter 5-2
Takayuki Goto
SapporoR#6 初心者セッションスライド
SapporoR#6 初心者セッションスライド
Hiroshi Shimizu
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
StanとRでベイズ統計モデリングに関する読書会(Osaka.stan) 第四章
nocchi_airport
統計的学習の基礎_3章
統計的学習の基礎_3章
Shoichi Taguchi
カステラ本勉強会 第三回
カステラ本勉強会 第三回
ke beck
多変量解析の背景理論
多変量解析の背景理論
h_yama2396
More Related Content
What's hot
重回帰分析で交互作用効果
重回帰分析で交互作用効果
Makoto Hirakawa
ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析
Shushi Namba
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
takehikoihayashi
順序データでもベイズモデリング
順序データでもベイズモデリング
. .
Rで学ぶ観察データでの因果推定
Rで学ぶ観察データでの因果推定
Hiroki Matsui
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
Ryutaro Yamauchi
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
Morpho, Inc.
Anova君を使った分散分析
Anova君を使った分散分析
Takashi Yamane
時系列分析による異常検知入門
時系列分析による異常検知入門
Yohei Sato
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
Shiga University, RIKEN
スパースモデリング入門
スパースモデリング入門
Hideo Terada
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Hiroshi Shimizu
金融リスクとポートフォリオマネジメント
金融リスクとポートフォリオマネジメント
Kei Nakagawa
機械学習システムの品質保証に向けた課題とコンソーシアム活動
機械学習システムの品質保証に向けた課題とコンソーシアム活動
Hideto Ogawa
ベイズ統計モデリングと心理学
ベイズ統計モデリングと心理学
Shushi Namba
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
Takashi J OZAKI
SEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデル
Masaru Tokuoka
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
hoxo_m
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
Masayuki Tanaka
R stan導入公開版
R stan導入公開版
考司 小杉
What's hot
(20)
重回帰分析で交互作用効果
重回帰分析で交互作用効果
ベイズモデリングで見る因子分析
ベイズモデリングで見る因子分析
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
順序データでもベイズモデリング
順序データでもベイズモデリング
Rで学ぶ観察データでの因果推定
Rで学ぶ観察データでの因果推定
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
[論文解説]Unsupervised monocular depth estimation with Left-Right Consistency
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
(文献紹介)Deep Unrolling: Learned ISTA (LISTA)
Anova君を使った分散分析
Anova君を使った分散分析
時系列分析による異常検知入門
時系列分析による異常検知入門
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
スパースモデリング入門
スパースモデリング入門
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
金融リスクとポートフォリオマネジメント
金融リスクとポートフォリオマネジメント
機械学習システムの品質保証に向けた課題とコンソーシアム活動
機械学習システムの品質保証に向けた課題とコンソーシアム活動
ベイズ統計モデリングと心理学
ベイズ統計モデリングと心理学
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
計量時系列分析の立場からビジネスの現場のデータを見てみよう - 30th Tokyo Webmining
SEMを用いた縦断データの解析 潜在曲線モデル
SEMを用いた縦断データの解析 潜在曲線モデル
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
非制約最小二乗密度比推定法 uLSIF を用いた外れ値検出
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
遠赤外線カメラと可視カメラを利用した悪条件下における画像取得
R stan導入公開版
R stan導入公開版
Similar to Rで売上予測のデモ(回帰分析)
20190512 subscription meetup kamata
20190512 subscription meetup kamata
真太郎 鎌田
ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>
Courslide
rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話
Yuya Matsumura
Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法
E2D3.org
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
predictori
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
Ryota Inaba
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
松本健太郎
Tdc 20181121
Tdc 20181121
Masabumi Furuhata
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
junji kumooka
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
陽一 滝川
データサイエンティストの今
データサイエンティストの今
Suzuki Shinji
価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術
Shinichi Nakagawa
本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法
takashi sasaki
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
The Japan DataScientist Society
少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト
SPIRAL Inc.
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
Satoru Ishikawa
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
schoowebcampus
120801発会式概要
120801発会式概要
Michiharu Kitano
Similar to Rで売上予測のデモ(回帰分析)
(18)
20190512 subscription meetup kamata
20190512 subscription meetup kamata
ビジネスフレームワーク<経営戦略>
ビジネスフレームワーク<経営戦略>
rstanで個人のパラメーターを推定した話
rstanで個人のパラメーターを推定した話
Webマーケティングを通じたデータサイエンティストの価値発揮方法
Webマーケティングを通じたデータサイエンティストの価値発揮方法
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
ウマナリティクス#2資料『PAI競馬予測が1番人気に挑む!』
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
XP祭り2017『忖度と心理的安全』(スライド公開用)#xpjug
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
「グラフをつくる前に読む本」を読む前に語りつくす(DevLOVE関西)
Tdc 20181121
Tdc 20181121
杉並診断士会向けKintoneご紹介コンテンツr2
杉並診断士会向けKintoneご紹介コンテンツr2
IT技術者でも1から学べるビジネスモデルキャンバス入門
IT技術者でも1から学べるビジネスモデルキャンバス入門
データサイエンティストの今
データサイエンティストの今
価値を見せる技術 #DevLOVE ベースボールからみる技術
価値を見せる技術 #DevLOVE ベースボールからみる技術
本を読んでもわからないリアルなアンケート実践法
本を読んでもわからないリアルなアンケート実践法
データサイエンス業務と「ツール」
データサイエンス業務と「ツール」
少しの工夫で成果に直結!アンケート調査To Do リスト
少しの工夫で成果に直結!アンケート調査To Do リスト
データ分析を支える技術 データ分析基盤再入門
データ分析を支える技術 データ分析基盤再入門
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
分析のリアルがここに!現場で使えるデータ分析(1限目) 先生:吉永 恵一
120801発会式概要
120801発会式概要
Rで売上予測のデモ(回帰分析)
1.
Rで売上予測のデモ 第⼋回 雑談会 2015/12/22 成⽥裕美
2.
2 あんただれ︖ • いわゆる統計&分析屋 – 専⾨統計調査⼠ –
SAS認定プロフェッショナル ビジネスアナリスト – R, SAS, SPSSなんでもやります • ⼈事・組織系コンサルファーム出⾝ • 三沢市出⾝&在住/2016年1⽉ 開業予定 ‒ ⼦連れ出戻りUターンです♡ 成⽥ 裕美(なりた ひろみ)
3.
3 データ分析の⽬的 • データを要約する(記述統計、可視化) • 仮説を検証する(統計的仮説検定) •
仮説を創造する(データマイニング) • 未来を予測する(回帰分析、機械学習) ↑今回はコレ
4.
4 売上予測の重要性 • 売れ残る ⇒
ロスの発⽣ • 売れすぎる ⇒ 機会の損失 過去の実績から未来の売上を予測 経営資源の最適化 根拠(データ)に基づく販売戦略 売れ残っても 売れすぎても 致命傷
5.
5 統計解析⽤⾔語 R • なんてったってタダ♡ •
世界3⼤統計ソフトウェアの1つ (R, SAS, SPSS) • オープンソースなので⽇々進化する Rってスゴイんだぜ︕︕︕ 昔は⼤⾦払わないと出来なかった分析がタダで出来ます
6.
6 Rのデモ ごぼうビールの消費量を予測する 月 平均気温 消費量
百ℓ 1 5.7 2.41 2 6.4 3.91 3 7.9 4.32 4 13.9 5.55 5 19.7 5.63 6 21.6 6.23 7 27.9 8.34 8 29.1 8.39 9 28.1 7.33 12 8.9 4.77 11 13.2 4.95 10 18.5 5.51
7.
7 散布図&相関係数 相関係数 =0.95 気温が上がるほど 消費量も増える 気温と消費量の 間には強い正の 相関がある
8.
8 これが回帰分析 すべてのデータからの距離が 最も短くなる予測式を求める
9.
9 消費量 = 0.19(百ℓ)×
気温(℃) + 2.4 気温が1℃上昇すると、平均消費量が19ℓ増える 回帰分析の結果(1)
10.
10 回帰分析の結果(2) 切⽚と気温が消費量を予測する上で意味が あるのかを、検定という⼿法で検証 2つとも最⾼ランクの★3つなので、予測の上で ほぼほぼ有効だということがいえる。
11.
11 回帰分析の結果(3) 決定係数R²は予測式の当てはまりの良さを 表す。(0に近いほど当てはまりが悪く、 1に近いほど当てはまりが良い) 今回0.9なので、だいぶ当てはまりが良い、 つまり精度の⾼い予測式だといえる。
12.
12 信頼区間と予測区間 ⾚︓信頼区間 予測式の信頼幅 を表します 緑︓予測区間 予測値の取りう る幅を表します データを取り直して同じ分析を 繰り返したとしたら、100回の うち95回はこの範囲内に予測 式・予測値が収まると考えられ ますよ、という意味 ⿊︓予測式
13.
13 でもね。。。 • たった1つの変数から精度の⾼い予測式が 出来ることは、⾮常にまれ • 実際は、消費量に影響する様々な変数を複 数使って予測するケースがほとんど(重回 帰分析)
14.
14 最⼤電⼒ (千kw) = 16770.6 +(181.1 × 最⾼気温)+(125.0 × 最低気温) - 123.7
(晴) + 101.1 (⾬) + 6384.6 (⽉) 6269.2 (⽕) 6276.4 (⽔) 6156.9 (⽊) 5942.3 (⾦) 2427.8 (⼟) - 1674.7(⽇祝)- 5614.5 (年末年始) 重回帰分析ってこんな感じ〜
15.
15 重回帰分析の注意点 • 予測するための変数をたくさん投⼊すれば するほど、理論上は予測精度が⾼くなる • でも変数が増えすぎると、予測式が安定し なくなってヘンテコな係数が出たりする (多重共線性に気をつけろ︕) •
いかに少数精鋭の変数を選び出してシンプ ルで美しいモデルを作れるか、ここはまさ にアナリストの腕の⾒せどころ
16.
16 重回帰分析の発展形 • 今回お話したのは、⼀番単純な線形モデル • 曲線関係を表したり、もっと複雑な関係 (交互作⽤とか)をモデルに組み込んだり、 ⼈⼯知能の⼿法を取り⼊れたりして、デー タ分析の世界はどんどん進化 •
でも基本的な原理や考え⽅は共通している
17.
17 参考︓デモに使⽤したRのコード #---ごぼうビールの売上データ ⽉ <- c(1:12) 気温
<- c(5.7,6.4,7.9,13.9,19.7,21.6,27.9,29.1,28.1,18.5,13.2,8.9) 消費量 <- c(2.41,3.91,4.32,5.55,5.63,6.23,8.34,8.39,7.33,5.51,4.95,4.77) beer <- data.frame(⽉,気温,消費量); beer #---これを散布図にしてみると p1 <- ggplot (beer, aes(x = 気温, y = 消費量)) p1 + geom_point(size = 5)+ labs(title = "気温とごぼうビール消費量の散布図") #---相関係数を算出する round(cor(beer$消費量 , beer$気温),2) #---回帰分析を実⾏してみよう beer.lm <- lm (消費量 ~ 気温, data = beer);summary(beer.lm) #---実測値と予測値を⽐べてみる 実測値 <- beer[,3] ; 予測値 <- round(predict(beer.lm),2);(data.frame(実測値, 予測値)) #---予測値を計算しよう new <- data.frame (気温 = 20) #来⽉の平均気温が20度という予報が出たと仮定 predict(beer.lm, newdata = data.frame(気温 = 20)) #---信頼区間と予測区間 #(conf <- predict(beer.lm, new_dat, interval="confidence")) #信頼区間 #(pred <- predict(beer.lm, new_dat, interval="prediction")) #予測区間 #---信頼区間と予測区間のグラフ new1 <- data.frame("気温"=seq(5,30,0.2)) conf <- predict(beer.lm, new1, interval="confidence") pred <- predict(beer.lm, new1, interval="prediction") matplot(new1$気温, cbind(conf), lty=c(1,2,2), col=c(1,2,2), type="l", xlim=c(5,30), ylim=c(2,10), xlab="気温", ylab="消費量") par(new=T) matplot(new1$気温, cbind(pred), lty=c(1,2,2), col=c(1,3,3), type="l", xlim=c(5,30), ylim=c(2,10), xlab="気温", ylab="消費量")
18.
18 Fin ご清聴ありがとうございました。 (*´ω`)
Download Now