SlideShare a Scribd company logo
1 of 37
Download to read offline
ポアソン分布と指数分布
  のいけない関係
      @teramonagi
第20回R勉強会@東京(#TokyoR)
      2012/01/28
Agenda
• 自己紹介
• ポアソン分布ってなに?
• 指数分布ってなに?
• 2つの分布のいけない関係


    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              2
自己紹介
こういう者です
◆職業:クオンツ(計量的に金融する)
◆使う道具
 データ・数理解析/プログラム
 C++/C#/R/Python/Excel/VBA…..
◆最近の興味:
 関数型言語・統計(科)学・確率論

      ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                4
ポアソン分布ってなに?
ポアソン分布ってなに?


単位時間当りの生起確率
• 単位時間:1時間・1秒間・(1m)等
• 生起確率:事象が起こる確率
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              6
ポアソン分布ってなに?
• 単位時間当り平均λ回起こる事象が
  単位時間中にx回起こる確率は・・・

                             x
   px                           e    

                           x!         x  0,1,2,...
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                   7
ポアソン分布の例
     ~1年間での1日あたりの交通事故死亡者数~
                                          x       度数
                                         0        119
                                         1        152
                                         2        68
頻度




                                         3        20
                                         4         4
                                         5         1
                                         6         1
                                        6以上        0
                                         計        365




                    死亡者数
        ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                        8
ポアソン分布の特徴

• 平均:λ、分散: λ
• ただ1つλというパラメーターだけで
特徴づけられる


        ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                  9
ポアソン分布を計算してみる
• 1時間に平均5人が訪れるWebサイ
  トがある。1時間に3人訪問者があ
  る確率を求める
• λ=5、x=3を公式に代入
> (5^3) / (3 * 2) * exp(-5)
[1] 0.1403739(約14%!)
      ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                10
稀な現象としてのポアソン分布
• 高校で習った二項分布を思い出す
• 表が出る確率がpのコインをN回投
  げてx回表が出る確率は?


 px  N Cx p 1  p     x                   N x


     ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                  11
稀な現象としてのポアソン分布
px  N Cx p 1  p     x                   N x

                              ただし以下のようにp, λの積を固定
N  , p  0                    Np

                             x
     px                        e   

                          x!
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                     12
ちなみにRだと



(d,r,p,q)pois関数

   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             13
指数分布ってなに?
指数分布ってなに?


 事象の生起間隔の確率
• 生起間隔:ある事象が起こって次に
  また発生するまでの間隔
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              15
指数分布ってなに?
• 単位時間当り平均λ回起こる事象を
  考える。その事象の発生間隔がt単
  位時間である確率(密度)は・・・


   pt   e                        t

                                      t  0, 実数
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                               16
指数分布の例
         ~30歳のおっさんの平均余命の分布~
確率(密度)




                         余命(年)
          ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                    17
指数分布を計算してみる
• 1時間に平均5人が訪れるWebサイト
  がある。次の訪問者が来るまでの間隔
  が12分である確率を求めよ
• λ=5、t=12/60を公式に代入
> 5 * exp(-5 * 12 / 60)
[1] 1.839397
(確率“密度“なんで1越えます)
     ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                               18
指数分布の特徴
• 平均:1/λ、分散: 1/λ^2
• ただ1つλというパラメーターだけで特
  徴づけられる
• 次に事象が発生するまでの時間は今
  まで待った時間とは関係ない(無記憶
  性)
        ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                  19
ちなみにRだと



(d,r,p,q)exp関数

  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            20
2つの分布のいけない関係
2つの分布のいけない関係
   ポアソン分布
単位時間当りの生起確率

   指数分布
事象の生起間隔の確率
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            22
2つの分布のいけない関係
  ポアソン分布
単位時間当たり平均λ回

     指数分布
平均1/λ単位時間に一回
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            23
2つの分布のいけない関係
ある“事象”に対して
   ポアソン分布
 単位時間当たり平均λ回
回数に注目:ポアソン分布
      指数分布
時間に注目:指数分布
  1/λ単位時間に一回
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             24
同じ物(事象)
を異なる視点
から見てるわ
 けだね!
Rで確かめてみる
• Rを使って指数分布を生成
• 1単位時間に何回事象が発生する
  かをカウント
• その頻度がポアソン分布に従うかを
  チェック!

    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              26
アルゴリズムの流れー1
指数分布に従う乱数生成
                  2 8
                     9
                  3     6
1  5         7     4
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             27
アルゴリズムの流れー2
  作った乱数の合計が
単位時間に何個入るかカウント

1(単位時間)

 1 +  2 +  3 ≧1
                 28
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
アルゴリズムの流れー2
   作った乱数の合計が
この場合3番目の指数分布
 単位時間に何個入るかカウント
の値を足しちゃうと合計が1
  1(単位時間)
を越えるので、2とカウント
  1 +  2 +  3 ≧1
                  29
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
アルゴリズムの流れー2’
  作った乱数の合計が
単位時間に何個入るかカウント

1(単位時間)

              1                            ≧1
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             30
アルゴリズムの流れー2’
   作った乱数の合計が
この場合1番目の指数分布
 単位時間に何個入るかカウント

の値が1を越えるので、0と
 1(単位時間)
カウント
               1                            ≧1
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              31
アルゴリズムの流れー3


1と2を繰り返して出てきた
カウント値の統計量を計算


  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            32
結果のチェック(分布比較)
頻度(確率)




                       訪問者数
           ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                     33
結果のチェック(分布比較)
頻度(確率)




  指数分布からポアソン分布
  を作成することができた!


                       訪問者数
           ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                     34
まとめ
• ポアソン/指数分布について説明
• ある“事象”に対して
 –“回数“に注目:ポアソン分布
 –“時間”に注目:指数分布
• Rでシミュレーションしてみた

    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              35
Rのコード
#1単位時間内に到着する訪問者数を数えるシミュレーション
VisitorCounter <- function(lambda)
{
  counter <- 0
  time.arrival <- rexp(1, rate = lambda)
  while(time.arrival < 1) {
    counter <- counter + 1
    #次の訪問者の到着時間を計算
    time.arrival <- time.arrival + rexp(1, rate = lambda)
  }
  counter
}
               ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                            36
Rのコード
#1単位時間あたりの訪問者数の平均値
lambda <- 5
#シミュレーション回数
N <- 10^4
#シミュレーション実施
x <- sapply(1:N, function(i){VisitorCounter(lambda)})
#表示
barplot(rbind(table(x) / N, dpois(0:max(x), lambda)),
 col = c("violetred1", "slateblue4"),
 legend.text = c("Simulation", "Theoritical"),
 args.legend = list(x = "topright"),
 beside = TRUE
 )
               ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                         37

More Related Content

What's hot

画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
takaya imai
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
Yohei Sato
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
takehikoihayashi
 

What's hot (20)

ベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づけるベルヌーイ分布からベータ分布までを関係づける
ベルヌーイ分布からベータ分布までを関係づける
 
トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方
 
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
 
Transformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法についてTransformerを多層にする際の勾配消失問題と解決法について
Transformerを多層にする際の勾配消失問題と解決法について
 
モデル予見制御に基づくペアトレード戦略
モデル予見制御に基づくペアトレード戦略モデル予見制御に基づくペアトレード戦略
モデル予見制御に基づくペアトレード戦略
 
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデル
 
画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量画像認識の初歩、SIFT,SURF特徴量
画像認識の初歩、SIFT,SURF特徴量
 
最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情最近のDeep Learning (NLP) 界隈におけるAttention事情
最近のDeep Learning (NLP) 界隈におけるAttention事情
 
Rで学ぶ回帰分析と単位根検定
Rで学ぶ回帰分析と単位根検定Rで学ぶ回帰分析と単位根検定
Rで学ぶ回帰分析と単位根検定
 
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析
 
PRML 第4章
PRML 第4章PRML 第4章
PRML 第4章
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
 
比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!比例ハザードモデルはとってもtricky!
比例ハザードモデルはとってもtricky!
 
階層ベイズとWAIC
階層ベイズとWAIC階層ベイズとWAIC
階層ベイズとWAIC
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
Prml 最尤推定からベイズ曲線フィッティング
Prml 最尤推定からベイズ曲線フィッティングPrml 最尤推定からベイズ曲線フィッティング
Prml 最尤推定からベイズ曲線フィッティング
 
Stanでガウス過程
Stanでガウス過程Stanでガウス過程
Stanでガウス過程
 

Viewers also liked (6)

Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~ Rで計量時系列分析~CRANパッケージ総ざらい~
Rで計量時系列分析~CRANパッケージ総ざらい~
 
Qsim kobe.r4
Qsim kobe.r4Qsim kobe.r4
Qsim kobe.r4
 
Rで学ぶ逆変換(逆関数)法
Rで学ぶ逆変換(逆関数)法Rで学ぶ逆変換(逆関数)法
Rで学ぶ逆変換(逆関数)法
 
MCMCと正規分布の推測
MCMCと正規分布の推測MCMCと正規分布の推測
MCMCと正規分布の推測
 
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について
 
負の二項分布について
負の二項分布について負の二項分布について
負の二項分布について
 

More from Nagi Teramo

healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れる
healthplanetパッケージで体組成データを手に入れて健康な体も手に入れるhealthplanetパッケージで体組成データを手に入れて健康な体も手に入れる
healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れる
Nagi Teramo
 
続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)
Nagi Teramo
 
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
Nagi Teramo
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
Nagi Teramo
 

More from Nagi Teramo (20)

第86回R勉強会@東京 LT資料
第86回R勉強会@東京 LT資料第86回R勉強会@東京 LT資料
第86回R勉強会@東京 LT資料
 
Rでを作る
Rでを作るRでを作る
Rでを作る
 
Reproducebility 100倍 Dockerマン
Reproducebility 100倍 DockerマンReproducebility 100倍 Dockerマン
Reproducebility 100倍 Dockerマン
 
healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れる
healthplanetパッケージで体組成データを手に入れて健康な体も手に入れるhealthplanetパッケージで体組成データを手に入れて健康な体も手に入れる
healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れる
 
闇と向き合う
闇と向き合う闇と向き合う
闇と向き合う
 
機械の体を手に入れるのよ、 鉄郎!!!
機械の体を手に入れるのよ、鉄郎!!!機械の体を手に入れるのよ、鉄郎!!!
機械の体を手に入れるのよ、 鉄郎!!!
 
続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)
 
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
 
Ultra Lightning Talk × 3
Ultra Lightning Talk × 3Ultra Lightning Talk × 3
Ultra Lightning Talk × 3
 
F#談話室(17)
F#談話室(17)F#談話室(17)
F#談話室(17)
 
RFinanceJはじめました
RFinanceJはじめましたRFinanceJはじめました
RFinanceJはじめました
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
 
お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!
 
Trading volume mapping R in recent environment
Trading volume mapping R in recent environment Trading volume mapping R in recent environment
Trading volume mapping R in recent environment
 
~knitr+pandocではじめる~『R MarkdownでReproducible Research』
~knitr+pandocではじめる~『R MarkdownでReproducible Research』~knitr+pandocではじめる~『R MarkdownでReproducible Research』
~knitr+pandocではじめる~『R MarkdownでReproducible Research』
 
とある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみたとある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみた
 
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
 
Tokyo.R 白熱教室「これからのRcppの話をしよう」
Tokyo.R 白熱教室「これからのRcppの話をしよう」Tokyo.R 白熱教室「これからのRcppの話をしよう」
Tokyo.R 白熱教室「これからのRcppの話をしよう」
 
レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成
 

指数分布とポアソン分布のいけない関係