More Related Content Similar to 統計学の基礎の基礎 (20) More from Ken'ichi Matsui (20) 統計学の基礎の基礎12. > ab_data <- matrix(c(25,117,10,32), ncol=2, byrow=T)
> chisq.test(ab_data)
Pearson's Chi-squared test with Yates' continuity correction
data: ab_data
X-squared = 0.45721, df = 1, p-value = 0.4989
A/Bテスト
計算してみると、
もしこの実験を繰り返すことが
できたとすると、49.9%くらいの
確率でこれくらい(これ以上)の差は
発生しうる。
→ 施策に効果があるとは言えない!
16. 記述統計
トータル
最高スコア 990
最低スコア 10
平均スコア 583.7
標準偏差 170.1
例:TOEIC公開テスト第202回の試験
→ 第202回の受験者全員を対象にデータを要約
http://www.toeic.or.jp/toeic/about/data/data_avelist/data_ave01_04.html
http://www.toeic.or.jp/toeic/about/data/data_avelist/data_dist01_04.html
17. 記述統計
トータル
最高スコア 990
最低スコア 10
平均スコア 583.7
標準偏差 170.1
例:TOEIC公開テスト第202回の試験
→ 第202回の受験者全員を対象にデータを要約
http://www.toeic.or.jp/toeic/about/data/data_avelist/data_ave01_04.html
http://www.toeic.or.jp/toeic/about/data/data_avelist/data_dist01_04.html
手元のデータを
要約している。
22. ID total_bill tip gender smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.5 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
5 25.29 4.71 Male No Sun Dinner 4
6 8.77 2 Male No Sun Dinner 2
7 26.88 3.12 Male No Sun Dinner 4
…
…
…
…
…
…
…
…
使用するデータ
例:飲食店の顧客別支払い金額データ
48. 変数とは:データを扱う
名前 数学
田中 96
高橋 63
鈴木 85
渡辺 66
清水 91
木村 89
山本 77
ID 数学
1 96
2 63
3 85
4 66
5 91
6 89
7 77
IDにする 変数にする
ID 数学
1
2
3
4
5
6
7
x1
x2
x3
x4
x5
x6
x7
49. 変数とは:データを扱う
名前 数学
田中 96
高橋 63
鈴木 85
渡辺 66
清水 91
木村 89
山本 77
ID 数学
1 96
2 63
3 85
4 66
5 91
6 89
7 77
IDにする 変数にする
x5:右下の数字(添字)はデータのIDを表す
ID 数学
1
2
3
4
5
6
7
x1
x2
x3
x4
x5
x6
x7
76. 名前 数学 偏差 偏差2乗 人数で割る ルート
田中 96 15 225
高橋 63 -18 324
鈴木 85 4 16
渡辺 66 -15 225
清水 91 10 100
木村 89 8 64
山本 77 -4 16
合計 970 138.57 11.77
標準偏差は11.77
分散・標準偏差
平均 81.00
77. Ex: 偏差値
名前 数学 偏差 標準偏差
何個分? ← 10倍 ← + 50
田中 96 15 1.27 12.74 62.74
高橋 63 -18 -1.53 -15.29 34.71
鈴木 85 4 0.34 3.40 53.40
渡辺 66 -15 -1.27 -12.74 37.26
清水 91 10 0.85 8.50 58.50
木村 89 8 0.68 6.80 56.80
山本 77 -4 -0.34 -3.40 46.60
平均 81.00 標準偏差 11.77
これが「偏差値」
110. コイン投げ
表は1 裏は0
[1, 0, 1, 0, 0, 0, 0, 1, 0, 0,
0, 1, 0, 0, 1, 0, 1, 0, 0, 1]
ランダムに20回投げると、
このようなデータとなる
推測:正規分布とは
111. コイン投げ
表は1 裏は0
[1, 0, 1, 0, 0, 0, 0, 1, 0, 0,
0, 1, 0, 0, 1, 0, 1, 0, 0, 1]
ランダムに20回投げると、
このようなデータとなる
表の数を数えると
7 になる。
推測:正規分布とは
112. コイン投げ
9 12 11 4 10 12 10 9 9 9 8 9 10 11 11 8 12 11
15 7 16 8 11 10 13 10 11 12 7 11 11 11 8 9 10
13 12 10 12 8 11 8 12 8 10 12 11 11 13 13 7
11 8 13 12 7 5 9 12 9 8 11 11 10 10 10 10 5
16 6 14 9 10 13 11 7 11 10 8 11 13 8 9 13 7
12 9 11 10 10 7 12 8 12 11 6 14 9 13 13
20回1セットとして、それを100セット実施
すると下記のようなデータになる。
推測:正規分布とは
139. 参考
・「ビジネスに活かすデータマイニング」 尾崎 隆 著
・「日本統計学会公式認定 統計検定3級対応
データの分析」日本統計学会編
・「データサイエンティスト養成読本」
・「【統計学】初めての「標準偏差」(統計学に挫折
しないために)」 http://goo.gl/yM0QHU
・ 今日使ったプログラムコード
https://goo.gl/Wckrdm