SlideShare a Scribd company logo
1 of 37
Download to read offline
ポアソン分布と指数分布
  のいけない関係
      @teramonagi
第20回R勉強会@東京(#TokyoR)
      2012/01/28
Agenda
• 自己紹介
• ポアソン分布ってなに?
• 指数分布ってなに?
• 2つの分布のいけない関係


    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              2
自己紹介
こういう者です
◆職業:クオンツ(計量的に金融する)
◆使う道具
 データ・数理解析/プログラム
 C++/C#/R/Python/Excel/VBA…..
◆最近の興味:
 関数型言語・統計(科)学・確率論

      ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                4
ポアソン分布ってなに?
ポアソン分布ってなに?


単位時間当りの生起確率
• 単位時間:1時間・1秒間・(1m)等
• 生起確率:事象が起こる確率
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              6
ポアソン分布ってなに?
• 単位時間当り平均λ回起こる事象が
  単位時間中にx回起こる確率は・・・

                             x
   px                           e    

                           x!         x  0,1,2,...
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                   7
ポアソン分布の例
     ~1年間での1日あたりの交通事故死亡者数~
                                          x       度数
                                         0        119
                                         1        152
                                         2        68
頻度




                                         3        20
                                         4         4
                                         5         1
                                         6         1
                                        6以上        0
                                         計        365




                    死亡者数
        ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                        8
ポアソン分布の特徴

• 平均:λ、分散: λ
• ただ1つλというパラメーターだけで
特徴づけられる


        ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                  9
ポアソン分布を計算してみる
• 1時間に平均5人が訪れるWebサイ
  トがある。1時間に3人訪問者があ
  る確率を求める
• λ=5、x=3を公式に代入
> (5^3) / (3 * 2) * exp(-5)
[1] 0.1403739(約14%!)
      ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                10
稀な現象としてのポアソン分布
• 高校で習った二項分布を思い出す
• 表が出る確率がpのコインをN回投
  げてx回表が出る確率は?


 px  N Cx p 1  p     x                   N x


     ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                  11
稀な現象としてのポアソン分布
px  N Cx p 1  p     x                   N x

                              ただし以下のようにp, λの積を固定
N  , p  0                    Np

                             x
     px                        e   

                          x!
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                     12
ちなみにRだと



(d,r,p,q)pois関数

   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             13
指数分布ってなに?
指数分布ってなに?


 事象の生起間隔の確率
• 生起間隔:ある事象が起こって次に
  また発生するまでの間隔
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              15
指数分布ってなに?
• 単位時間当り平均λ回起こる事象を
  考える。その事象の発生間隔がt単
  位時間である確率(密度)は・・・


   pt   e                        t

                                      t  0, 実数
    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                               16
指数分布の例
         ~30歳のおっさんの平均余命の分布~
確率(密度)




                         余命(年)
          ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                    17
指数分布を計算してみる
• 1時間に平均5人が訪れるWebサイト
  がある。次の訪問者が来るまでの間隔
  が12分である確率を求めよ
• λ=5、t=12/60を公式に代入
> 5 * exp(-5 * 12 / 60)
[1] 1.839397
(確率“密度“なんで1越えます)
     ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                               18
指数分布の特徴
• 平均:1/λ、分散: 1/λ^2
• ただ1つλというパラメーターだけで特
  徴づけられる
• 次に事象が発生するまでの時間は今
  まで待った時間とは関係ない(無記憶
  性)
        ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                  19
ちなみにRだと



(d,r,p,q)exp関数

  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            20
2つの分布のいけない関係
2つの分布のいけない関係
   ポアソン分布
単位時間当りの生起確率

   指数分布
事象の生起間隔の確率
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            22
2つの分布のいけない関係
  ポアソン分布
単位時間当たり平均λ回

     指数分布
平均1/λ単位時間に一回
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            23
2つの分布のいけない関係
ある“事象”に対して
   ポアソン分布
 単位時間当たり平均λ回
回数に注目:ポアソン分布
      指数分布
時間に注目:指数分布
  1/λ単位時間に一回
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             24
同じ物(事象)
を異なる視点
から見てるわ
 けだね!
Rで確かめてみる
• Rを使って指数分布を生成
• 1単位時間に何回事象が発生する
  かをカウント
• その頻度がポアソン分布に従うかを
  チェック!

    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              26
アルゴリズムの流れー1
指数分布に従う乱数生成
                  2 8
                     9
                  3     6
1  5         7     4
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             27
アルゴリズムの流れー2
  作った乱数の合計が
単位時間に何個入るかカウント

1(単位時間)

 1 +  2 +  3 ≧1
                 28
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
アルゴリズムの流れー2
   作った乱数の合計が
この場合3番目の指数分布
 単位時間に何個入るかカウント
の値を足しちゃうと合計が1
  1(単位時間)
を越えるので、2とカウント
  1 +  2 +  3 ≧1
                  29
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
アルゴリズムの流れー2’
  作った乱数の合計が
単位時間に何個入るかカウント

1(単位時間)

              1                            ≧1
  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                             30
アルゴリズムの流れー2’
   作った乱数の合計が
この場合1番目の指数分布
 単位時間に何個入るかカウント

の値が1を越えるので、0と
 1(単位時間)
カウント
               1                            ≧1
   ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              31
アルゴリズムの流れー3


1と2を繰り返して出てきた
カウント値の統計量を計算


  ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                            32
結果のチェック(分布比較)
頻度(確率)




                       訪問者数
           ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                     33
結果のチェック(分布比較)
頻度(確率)




  指数分布からポアソン分布
  を作成することができた!


                       訪問者数
           ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                     34
まとめ
• ポアソン/指数分布について説明
• ある“事象”に対して
 –“回数“に注目:ポアソン分布
 –“時間”に注目:指数分布
• Rでシミュレーションしてみた

    ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                              35
Rのコード
#1単位時間内に到着する訪問者数を数えるシミュレーション
VisitorCounter <- function(lambda)
{
  counter <- 0
  time.arrival <- rexp(1, rate = lambda)
  while(time.arrival < 1) {
    counter <- counter + 1
    #次の訪問者の到着時間を計算
    time.arrival <- time.arrival + rexp(1, rate = lambda)
  }
  counter
}
               ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                            36
Rのコード
#1単位時間あたりの訪問者数の平均値
lambda <- 5
#シミュレーション回数
N <- 10^4
#シミュレーション実施
x <- sapply(1:N, function(i){VisitorCounter(lambda)})
#表示
barplot(rbind(table(x) / N, dpois(0:max(x), lambda)),
 col = c("violetred1", "slateblue4"),
 legend.text = c("Simulation", "Theoritical"),
 args.legend = list(x = "topright"),
 beside = TRUE
 )
               ポアソン分布と指数分布のいけない関係@第20回R勉強会@東京(#TokyoR)
                                                         37

More Related Content

What's hot

変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)Takao Yamanaka
 
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布についてhoxo_m
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介Naoki Hayashi
 
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章Shushi Namba
 
ベータ分布の謎に迫る
ベータ分布の謎に迫るベータ分布の謎に迫る
ベータ分布の謎に迫るKen'ichi Matsui
 
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」Ken'ichi Matsui
 
MCMCと正規分布の推測
MCMCと正規分布の推測MCMCと正規分布の推測
MCMCと正規分布の推測Gen Fujita
 
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説Hiroshi Shimizu
 
【解説】 一般逆行列
【解説】 一般逆行列【解説】 一般逆行列
【解説】 一般逆行列Kenjiro Sugimoto
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編Hiroshi Shimizu
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明Haruka Ozaki
 
馬に蹴られるモデリング
馬に蹴られるモデリング馬に蹴られるモデリング
馬に蹴られるモデリングShushi Namba
 
色々な確率分布とその応用
色々な確率分布とその応用色々な確率分布とその応用
色々な確率分布とその応用Hiroki Iida
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデルYohei Sato
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数daiki hojo
 
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~. .
 

What's hot (20)

変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
 
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について
 
ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介ベイズ統計学の概論的紹介
ベイズ統計学の概論的紹介
 
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
StanとRでベイズ統計モデリング読書会(Osaka.stan) 第6章
 
ベータ分布の謎に迫る
ベータ分布の謎に迫るベータ分布の謎に迫る
ベータ分布の謎に迫る
 
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
数学カフェ 確率・統計・機械学習回 「速習 確率・統計」
 
2 3.GLMの基礎
2 3.GLMの基礎2 3.GLMの基礎
2 3.GLMの基礎
 
MCMCと正規分布の推測
MCMCと正規分布の推測MCMCと正規分布の推測
MCMCと正規分布の推測
 
Stanでガウス過程
Stanでガウス過程Stanでガウス過程
Stanでガウス過程
 
Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説Cmdstanr入門とreduce_sum()解説
Cmdstanr入門とreduce_sum()解説
 
【解説】 一般逆行列
【解説】 一般逆行列【解説】 一般逆行列
【解説】 一般逆行列
 
Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
変分ベイズ法の説明
変分ベイズ法の説明変分ベイズ法の説明
変分ベイズ法の説明
 
馬に蹴られるモデリング
馬に蹴られるモデリング馬に蹴られるモデリング
馬に蹴られるモデリング
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
色々な確率分布とその応用
色々な確率分布とその応用色々な確率分布とその応用
色々な確率分布とその応用
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
 
Stanの便利な事後処理関数
Stanの便利な事後処理関数Stanの便利な事後処理関数
Stanの便利な事後処理関数
 
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
MCMCサンプルの使い方 ~見る・決める・探す・発生させる~
 
MICの解説
MICの解説MICの解説
MICの解説
 

More from Nagi Teramo

第86回R勉強会@東京 LT資料
第86回R勉強会@東京 LT資料第86回R勉強会@東京 LT資料
第86回R勉強会@東京 LT資料Nagi Teramo
 
Rでを作る
Rでを作るRでを作る
Rでを作るNagi Teramo
 
Reproducebility 100倍 Dockerマン
Reproducebility 100倍 DockerマンReproducebility 100倍 Dockerマン
Reproducebility 100倍 DockerマンNagi Teramo
 
healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れる
healthplanetパッケージで体組成データを手に入れて健康な体も手に入れるhealthplanetパッケージで体組成データを手に入れて健康な体も手に入れる
healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れるNagi Teramo
 
闇と向き合う
闇と向き合う闇と向き合う
闇と向き合うNagi Teramo
 
機械の体を手に入れるのよ、 鉄郎!!!
機械の体を手に入れるのよ、鉄郎!!!機械の体を手に入れるのよ、鉄郎!!!
機械の体を手に入れるのよ、 鉄郎!!!Nagi Teramo
 
続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)Nagi Teramo
 
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnetNagi Teramo
 
Ultra Lightning Talk × 3
Ultra Lightning Talk × 3Ultra Lightning Talk × 3
Ultra Lightning Talk × 3Nagi Teramo
 
RFinanceJはじめました
RFinanceJはじめましたRFinanceJはじめました
RFinanceJはじめましたNagi Teramo
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法Nagi Teramo
 
お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!Nagi Teramo
 
Trading volume mapping R in recent environment
Trading volume mapping R in recent environment Trading volume mapping R in recent environment
Trading volume mapping R in recent environment Nagi Teramo
 
~knitr+pandocではじめる~『R MarkdownでReproducible Research』
~knitr+pandocではじめる~『R MarkdownでReproducible Research』~knitr+pandocではじめる~『R MarkdownでReproducible Research』
~knitr+pandocではじめる~『R MarkdownでReproducible Research』Nagi Teramo
 
とある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみたとある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみたNagi Teramo
 
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~Nagi Teramo
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」Nagi Teramo
 
Tokyo.R 白熱教室「これからのRcppの話をしよう」
Tokyo.R 白熱教室「これからのRcppの話をしよう」Tokyo.R 白熱教室「これからのRcppの話をしよう」
Tokyo.R 白熱教室「これからのRcppの話をしよう」Nagi Teramo
 
レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成Nagi Teramo
 

More from Nagi Teramo (20)

第86回R勉強会@東京 LT資料
第86回R勉強会@東京 LT資料第86回R勉強会@東京 LT資料
第86回R勉強会@東京 LT資料
 
Rでを作る
Rでを作るRでを作る
Rでを作る
 
Reproducebility 100倍 Dockerマン
Reproducebility 100倍 DockerマンReproducebility 100倍 Dockerマン
Reproducebility 100倍 Dockerマン
 
healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れる
healthplanetパッケージで体組成データを手に入れて健康な体も手に入れるhealthplanetパッケージで体組成データを手に入れて健康な体も手に入れる
healthplanetパッケージで 体組成データを手に入れて 健康な体も手に入れる
 
闇と向き合う
闇と向き合う闇と向き合う
闇と向き合う
 
機械の体を手に入れるのよ、 鉄郎!!!
機械の体を手に入れるのよ、鉄郎!!!機械の体を手に入れるのよ、鉄郎!!!
機械の体を手に入れるのよ、 鉄郎!!!
 
続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)続わかりやすいパターン認識11章(11.1 - 11.4)
続わかりやすいパターン認識11章(11.1 - 11.4)
 
5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet5分でわかるかもしれないglmnet
5分でわかるかもしれないglmnet
 
Ultra Lightning Talk × 3
Ultra Lightning Talk × 3Ultra Lightning Talk × 3
Ultra Lightning Talk × 3
 
F#談話室(17)
F#談話室(17)F#談話室(17)
F#談話室(17)
 
RFinanceJはじめました
RFinanceJはじめましたRFinanceJはじめました
RFinanceJはじめました
 
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
東京R非公式おじさんが教える本当に気持ちいいパッケージ作成法
 
お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!お前の逐モン、GETだぜ!
お前の逐モン、GETだぜ!
 
Trading volume mapping R in recent environment
Trading volume mapping R in recent environment Trading volume mapping R in recent environment
Trading volume mapping R in recent environment
 
~knitr+pandocではじめる~『R MarkdownでReproducible Research』
~knitr+pandocではじめる~『R MarkdownでReproducible Research』~knitr+pandocではじめる~『R MarkdownでReproducible Research』
~knitr+pandocではじめる~『R MarkdownでReproducible Research』
 
とある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみたとある金融屋の統計技師が時系列解析してみた
とある金融屋の統計技師が時系列解析してみた
 
可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~可視化周辺の進化がヤヴァイ~rChartsを中心として~
可視化周辺の進化がヤヴァイ~rChartsを中心として~
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
 
Tokyo.R 白熱教室「これからのRcppの話をしよう」
Tokyo.R 白熱教室「これからのRcppの話をしよう」Tokyo.R 白熱教室「これからのRcppの話をしよう」
Tokyo.R 白熱教室「これからのRcppの話をしよう」
 
レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成レプリカ交換モンテカルロ法で乱数の生成
レプリカ交換モンテカルロ法で乱数の生成
 

指数分布とポアソン分布のいけない関係