Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

7

Share

Download to read offline

統計勉強会Vol1

Download to read offline

Related Audiobooks

Free with a 30 day trial from Scribd

See all

統計勉強会Vol1

  1. 1. 統計勉強会 超入門 鈴木雄登
  2. 2. 対象 • 今回統計勉強会をはじめるにあたって • データマイニングとかやってみたい • けど、統計の知識はほぼゼロ • そんな人のための知識補完として
  3. 3. 目次 • 1次元データ • 代表値 • 散らばりをしらべる • 2次元データ
  4. 4. 統計学とは 現象の法則性を 見つけたい データを集めよ う データがごちゃご ちゃ データを 整理しよう
  5. 5. データの種類 • 量的データと質的データ 量的データ 質的データ 長さ、重さ、体積…etc. のような値で測定できるもの 性別、天気、居住域..etc. などのような値ではなく、 そのカテゴリーに属しているかどうか
  6. 6. 次元 データの種類数は 『次元』 で表す
  7. 7. 1次元のデータ
  8. 8. 次元って?? x y 1次元 x z y 2次元 x 3次元
  9. 9. 統計(自然科学)での次元 (男) 1次元 (男、27歳) 2次元 (男、27歳、消防士 3次元 利用するデータの種類 数
  10. 10. 1次元のデータを可視化 • 度数分布 頻度合計 頻度 階級 度数 相対度数 累積度数 累積相対度 数 0〜20 3 0.06 3 0.06 20〜40 10 0.2 13 0.26 40〜60 20 0.4 33 0.66 60〜80 9 0.18 42 0.84 80〜10 0 8 0.16 50 1.00 合計 50 1.00 頻度/全体 頻度合計/全体
  11. 11. 1次元のデータを可視化 • ヒストグラム 25 20 1〜20 20〜40 40〜60 60〜80 80〜100 15 10 5 0 項目 1
  12. 12. 代表値
  13. 13. 平均 • 算術平均 • いつもの平均 • 両端の階級を無視して計算するときもある。 →外れ値考慮
  14. 14. 平均 • 幾何平均 割合の平均を求めるときなどに使う • 調和平均
  15. 15. メディアン • 1,1,1,1,2,3,4,5,16,20のような数列の代表値 第一四分位点 1 メディア ン 5 10 平均 15 20
  16. 16. モード • 最頻度 モード
  17. 17. 散らばりを調べる
  18. 18. 散らばりの尺度 • レンジ • 分布の存在する範囲を示す • 平均偏差 • 観測値が平均からどれくらい離れているかを平均したもの • 分散と標準偏差 • 観測値が平均との距離の2乗和平均の平方根を取ったもの 分散 : 標準偏差 :
  19. 19. 偏差 • 標準偏差の方が圧倒的に使われる • 理論的に計算しやすい(←絶対値が計算しづらい) • 優れている 違いを考えるには、平均とは何か?ということが鍵になります。サンプ ルの平均は m=(x1+...+xn)÷n で求めるのが通例ですが、なぜこうするの がよいか?を考えてみてください。 実は、このようにして求める平均は、標準偏差の2乗和を最小にします。 では、平均偏差を最小にするような値を計算してみましょう。つまり、 J= |x1-μ|+...+|xn-μ| を最小にするμを求めるわけです。 例えば、データが(1,1,1,0,-3)だったとします。 m=0 となりますが、(2)式を最小にする値は、0ではありませんね。 一方で,標準偏差の2乗和 V= (x1-μ)^2+...+(xn-μ)^2 を最小にするμはVをμで微分して=0と置いて、とけば μ=m であることがわかります。 平均偏差を最小にする値は中央値ですので、そこが違うということにな るわけです。 引用:http://okwave.jp/qa/q1241831.html
  20. 20. 2次元データ
  21. 21. 相関と回帰 • 相関 • xとyに区別を設けず、対等に見る見方 • 独立なものの関係を調べる x y • 回帰 • xからy(もしくはyからx)を見る見方 • 従属的なものの関係を調べる x y
  22. 22. 散布図 Y の値 1 3.5 3 2.5 2 Y の値 1 1.5 1 0.5 0 0 1 2 3 4
  23. 23. 相関関係 http://www.sqc-works.com/qc7-04.html
  24. 24. 相関係数 • どれくらい相関関係があるかを計算 • 定義はいろいろ • 最もよく用いられるピアソンの積率相関係数 xの標準偏差 偏差積の平均 =共分散 yの標準偏差 範囲は-1~1
  25. 25. 相関係数のイメージ 共分散によって相関係数は決まる I Ⅱ 相関係数が±1を取る条件 平均 Ⅲ Ⅳ
  26. 26. 回帰 • 最小二乗法 を最小化するaとbを求める bx+a y
  27. 27. 回帰 最終的にはこれを解けばいい 求まったaとbによる式 回帰方程式(回帰直線とも)と呼ばれる
  28. 28. 回帰直線 Y の値 1 3.5 3 2.5 2 Y の値 1 1.5 1 0.5 0 0 1 2 3 4
  29. 29. 相関係数と回帰直線の傾き • 相関係数rと回帰直線の傾きbの関係 rは相関係数なので、xとyの相関を示す -1 ~ 1 なので2乗にするとrが大きいほど、回帰が当てはまる。 そこでrの2乗を決定係数と呼ぶ
  • csk813

    Feb. 26, 2015
  • chinomamo

    Feb. 15, 2015
  • Masurou

    May. 6, 2014
  • hkuwamura

    Apr. 23, 2014
  • tomohirozouda

    Apr. 21, 2014
  • TakeshiWatanabe2

    Dec. 14, 2013
  • makotouehara39

    Dec. 13, 2013

Views

Total views

1,634

On Slideshare

0

From embeds

0

Number of embeds

3

Actions

Downloads

11

Shares

0

Comments

0

Likes

7

×