SlideShare a Scribd company logo
1 of 34
WSモデル上の
                パーコレーション解析

                       @yokkuns: 里 洋平
                     yohei0511@gmail.com
                2012.05.23 複雑ネットワーク勉強会


2012年5月23日水曜日
本日の内容
                複雑ネットワーク - 基礎から応用まで
                 - 8.4 WSモデル上のパーコレーション -




2012年5月23日水曜日
AGENDA

      ◆ 自己紹介

      ◆ パーコレーションとは

      ◆ WSモデル上のパーコレーション




2012年5月23日水曜日
自己紹介

             時系列解析や異常検知などの方法論を
          実ビジネスに適用するデータマイニングエンジニア



     ◆ 名前: 里 洋平
     ◆ ID : yokkuns
     ◆ 職業:
     データマイニングエンジニア
     ◆     統計解析 パターン認識 機械学
     習 データマイニング NLP 金融工学
     などを勉強中

2012年5月23日水曜日
活動例: 勉強会の主催・執筆


                   Tokyo.R主催




                パッケージ本執筆しました!




2012年5月23日水曜日
活動例: 動画レコメンド

                閲覧されている動画の情報を用いておすすめ動画を表示する




2012年5月23日水曜日
活動例: 市場予測

                Web上の情報から市場予測




2012年5月23日水曜日
活動例: 異常検知
                              Anomaly detection

                    複数時系列から異常な振る舞いを検知する

                                                                            C
                                                                            A
        時系列のモデリング               複数時系列の異常検知                                  B

      時系列A                             時系列A

                                                                        異常な振る舞い
      時系列B


      時系列C                      時系列B          時系列C

                                 異常な振る舞いの時系列を検出




                例1:トラフィック異常検知                   例2:CM効果のノイズ除去

                    トラフィックA                          ケースA
                                                              CM効果
                    トラフィックB                          ケースB

                    トラフィックC      調査                  ケースC

                     異常な振る舞いをしている                    異常な振る舞いをしているケースを
                     トラフィックの原因を調査する                  除外して、CMの効果を算出する
                                                                                  85
2012年5月23日水曜日
活動例: 時系列解析と異常検知
                      Anomaly detection

                新しいデータと過去時系列モデルの乖離から異常検出


                          8000.0000
                                             異常スコア推移
  モデル構築
                                                       3.0000




                                       異常値
  ◇例 : ARIMAモデル                                        2.2500




                          5970.7500                    1.5000




                                                       0.7500




                          3941.5000                         0



  異常スコアの算出
                                                       -0.7500

   ◇例 : 対数損失

                          1912.2500                    -1.5000




                                                       -2.2500




                           -117.0000                   -3.0000


                                                t
                                  4/ 週
                                  4/ 1週
                                  4/ 8週
                                   5/ 週
                                   5/ 週
                                  5/ 週
                                  5/ 週
                                  5/ 週
                                   6/ 週
                                  6/ 週
                                  6/ 週
                                  6/ 週
                                   7/ 週
                                  7/ 週
                                  7/ 週
                                  7/ 8週
                                        週
                                      4



                                    25
                                      2
                                      9
                                    16
                                    23
                                    30
                                      6
                                    13
                                    20
                                    27
                                      4
                                    11


                                    25
                                    1
                                    1




                                    1
                                   4/




                                                                 86
2012年5月23日水曜日
活動例: 時系列解析と影響分析
                        TV Commercial Effects

                時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出
                                                   イベン
                CM時系列                               ト

                                          新規
                                          登録


                              CM                   ARPP
                                                    U




                                          ARPU

            各KPIの時系列
                                                          その他
                                                           外部
                                   継続率
                                                           要因




                                                 ケース




                                                            87

2012年5月23日水曜日
活動例: データマイニングCROSS




2012年5月23日水曜日
AGENDA

      ◆ 自己紹介

      ◆ パーコレーションとは

      ◆ WSモデル上のパーコレーション




2012年5月23日水曜日
ネットワーク上の感染伝搬モデル
                ネットワーク上の感染伝搬は、感染の種類だけでなく
                   ネットワークの構造も大きく影響している

                感染症の種類       昔              今


                 ペスト     じわじわと前線が進む    飛びながら速く広がる?!




            インフルエンザ      じわじわと前線が進む?   飛びながら速く広がる



  ペストがはやった"#世紀と現代では、人のネットワーク構造が異なる!
  !!!!・ 昔は高速移動手段がなかったため平均距離$が大きかったため、広がるのが遅かった!
  !!!!・ 現在は、飛行機などの存在により、$は小さいため、急速に広がる!
  !
  !!!!⇒!感染症の種類よりもネットワークの構造が帰結を決める

                                                    2


2012年5月23日水曜日
パーコレーション
              空間構造をもち、時間を持たない確率モデル
           森林火災、感染症、噂の伝搬など様々な伝搬現象を表す




                                                                            3
  図!"#$%!&&#'()%*+),-./01-2'(&(.*3*1*(*&4)5)*42#&6786%)42'&%)42'9*:'.-#;(

2012年5月23日水曜日
パーコレーションの種類
                 頂点に黒石 or 白石を置くサイト・パーコレーションと
                枝に黒石 or 白石を置くボンド・パーコレーションがある




                                               4

2012年5月23日水曜日
相転移と臨界確率
                  数値計算や近似計算によって、臨界確率を境に
                   浸透が起こりやすくなる事が分かっている


                  θ(q)




                                                                θ(q)
                                                        qc
  図!"#$%!&&'''()*+,-*),(.%&)*+,-*),&/01)2*31+14,56782-9,:1;,<          5


2012年5月23日水曜日
AGENDA

      ◆ 自己紹介

      ◆ パーコレーションとは

      ◆ WSモデル上のパーコレーション




2012年5月23日水曜日
WS上のパーコレーション概要
                枝をつなぎ変える程 平均距離Lが小さくなるため
                臨界確率 qc が小さくなり 浸透が起こりやすい




2012年5月23日水曜日
黒石の連結成分の大きさの平均を求めたい
    黒石の連結成分の大きさがN となる確率P(N )から期待値を計算する
         P(N )はつなぎかえ確率pの値によって変化し
        直接評価するのが難しいため母関数を用いて考える



                    黒石の連結成分の大きさの平均が の時
                    ネットワーク全体に浸透が起こる



                     直接求めるのは難しいため母関数を考える




2012年5月23日水曜日
母関数のアプローチ
                 輪に沿った連結成分(ローカルクラスタ)と
                ショートカットによるそれらの結合の様子を考える




2012年5月23日水曜日
完全クラスタの構成要素
       ショートカットも含めた成分(完全クラスタ)は
   1個のローカルクラスタと複数の完全クラスタの結合で表現出来る




2012年5月23日水曜日
完全クラスタの母関数
                    完全クラスタは、以下のように表現出来る
                      また、その母関数をH0(x)とする




                =   n1       +
                                 n1
                                          +
                                                  n1
                                                           +・・・



                    +    N       +            +             +・・・
                                      N                N


     完全クラスタ              +・・・
    ローカルクラスタ
2012年5月23日水曜日
完全クラスタの母関数
                    ローカルクラスタのサイズがN の時に注目する
                    各項に完全クラスタがあり、その母関数もH0(x)




                =    n1       +
                                  n1
                                           +
                                                   n1
                                                            +・・・



                    +     N       +            +             +・・・
                                       N                N


     完全クラスタ               +・・・             ローカルクラスタのサイズがN の条件の元で
                                              ショートカットの数がm個の成分
    ローカルクラスタ
2012年5月23日水曜日
完全クラスタの母関数
           母関数は、ローカルクラスタの分布と
    ショートカットによる完全クラスタとの結合の分布の式で書き下せる




2012年5月23日水曜日
完全クラスタの母関数
           母関数は、ローカルクラスタの分布と
    ショートカットによる完全クラスタとの結合の分布の式で書き下せる




                                                m個の完全クラスタの
                                                    母関数




                ローカルクラスタのサイズが   ローカルクラスタのサイズがN の条件の元で
                   N になる確率        ショートカットの数がm個になる確率




2012年5月23日水曜日
ショートカットがある確率
       ネットワーク全体ではショートカットの数は、p<k>N/2本
             端点は2 p<k>N/2 = p<k>N個
    二項定理を用いて長さNの輪のうちN の部分に端点がm個入る確率を表す




                   mこの端点の       端点がm回    端点が(総数-m)回
                N内の位置の組み合わせ数   N に入る確率   N 以外に入る確率




2012年5月23日水曜日
ローカルクラスタの確率
                輪に沿って右側に黒石によって進む事が出来る確率を用いて
                       ローカルクラスタの確率を表す




2012年5月23日水曜日
ローカルクラスタの確率
                輪に沿って右側に黒石によって進む事が出来る確率を用いて
                       ローカルクラスタの確率を表す




                            最初が黒石である確率




                                  右側にN -1回      ローカルクラスタの
                最初の石がローカルクラスタの
                                   辿れる確率     両端の先が全て白石である確率
                どこでも良いことを意味する
                                 それなりに荒い近似



2012年5月23日水曜日
母関数の展開

                完全クラスタの部分を整理して展開する




   ※


2012年5月23日水曜日
連結成分の大きさの平均の算出

         母関数をxについて微分してx=1で連結成分の大きさの平均になる




 x=1を代入




 H0(1) = 1より




2012年5月23日水曜日
計算の補足




   x=1を代入




2012年5月23日水曜日
パーコレーションの臨界確率
                臨界確率は、連結成分の大きさの平均が無限大になるところ
                  pはWSモデルのつなぎかえ確率なので我々が与える
                  最終的にqcだけの式になるので、数値計算で求める




2012年5月23日水曜日
臨界指数
          ベキ指数が連結成分の大きさ以外の様々な変数についても求まる
              このようなベキ指数を相転移の臨界指数という




2012年5月23日水曜日
AGENDA

      ◆ 自己紹介

      ◆ パーコレーションとは

      ◆ WSモデル上のパーコレーション




2012年5月23日水曜日

More Related Content

What's hot

Japan r2 lt_yokkuns
Japan r2 lt_yokkunsJapan r2 lt_yokkuns
Japan r2 lt_yokkunsYohei Sato
 
Japan r2 tokyor
Japan r2 tokyorJapan r2 tokyor
Japan r2 tokyorYohei Sato
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデルYohei Sato
 
Tokyor26 data fusion
Tokyor26 data fusionTokyor26 data fusion
Tokyor26 data fusionYohei Sato
 
時系列分析による異常検知入門
時系列分析による異常検知入門時系列分析による異常検知入門
時系列分析による異常検知入門Yohei Sato
 
Tokyo r15 異常検知入門
Tokyo r15 異常検知入門Tokyo r15 異常検知入門
Tokyo r15 異常検知入門Yohei Sato
 
異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –Yohei Sato
 
RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21horihorio
 
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」Shohei Hido
 
R実践 機械学習による異常検知 02
R実践 機械学習による異常検知 02R実践 機械学習による異常検知 02
R実践 機械学習による異常検知 02akira_11
 
数理的に組み込みソフトを開発する方法入門
数理的に組み込みソフトを開発する方法入門数理的に組み込みソフトを開発する方法入門
数理的に組み込みソフトを開発する方法入門Toshiyuki Fujikura
 

What's hot (12)

Japan r2 lt_yokkuns
Japan r2 lt_yokkunsJapan r2 lt_yokkuns
Japan r2 lt_yokkuns
 
Japan r2 tokyor
Japan r2 tokyorJapan r2 tokyor
Japan r2 tokyor
 
Rで階層ベイズモデル
Rで階層ベイズモデルRで階層ベイズモデル
Rで階層ベイズモデル
 
Tokyor26 data fusion
Tokyor26 data fusionTokyor26 data fusion
Tokyor26 data fusion
 
時系列分析による異常検知入門
時系列分析による異常検知入門時系列分析による異常検知入門
時系列分析による異常検知入門
 
Tokyo r15 異常検知入門
Tokyo r15 異常検知入門Tokyo r15 異常検知入門
Tokyo r15 異常検知入門
 
異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –異常行動検出入門 – 行動データ時系列のデータマイニング –
異常行動検出入門 – 行動データ時系列のデータマイニング –
 
RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21
 
FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」FIT2012招待講演「異常検知技術のビジネス応用最前線」
FIT2012招待講演「異常検知技術のビジネス応用最前線」
 
R実践 機械学習による異常検知 02
R実践 機械学習による異常検知 02R実践 機械学習による異常検知 02
R実践 機械学習による異常検知 02
 
数理的に組み込みソフトを開発する方法入門
数理的に組み込みソフトを開発する方法入門数理的に組み込みソフトを開発する方法入門
数理的に組み込みソフトを開発する方法入門
 
Test
TestTest
Test
 

Viewers also liked

第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッション第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッションYohei Sato
 
Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介
Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介
Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介Yohei Sato
 
Sakuteki02 yokkuns
Sakuteki02 yokkunsSakuteki02 yokkuns
Sakuteki02 yokkunsYohei Sato
 
Tokyowebmining09 初めてでも分かるペアトレード
Tokyowebmining09 初めてでも分かるペアトレードTokyowebmining09 初めてでも分かるペアトレード
Tokyowebmining09 初めてでも分かるペアトレードYohei Sato
 
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みTokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みYohei Sato
 
Tokyor42 ggplot2
Tokyor42 ggplot2Tokyor42 ggplot2
Tokyor42 ggplot2Yohei Sato
 
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Yohei Sato
 
Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Yohei Sato
 
Japan r2 opening
Japan r2 openingJapan r2 opening
Japan r2 openingYohei Sato
 
Tokyowebmining07 初めてでも分かるヘッジファンド入門
Tokyowebmining07 初めてでも分かるヘッジファンド入門Tokyowebmining07 初めてでも分かるヘッジファンド入門
Tokyowebmining07 初めてでも分かるヘッジファンド入門Yohei Sato
 
エンジニアサポート新年会2012 データマイニングcross 第1部
エンジニアサポート新年会2012 データマイニングcross 第1部エンジニアサポート新年会2012 データマイニングcross 第1部
エンジニアサポート新年会2012 データマイニングcross 第1部Yohei Sato
 
Tokyor14 - R言語でユニットテスト
Tokyor14 - R言語でユニットテストTokyor14 - R言語でユニットテスト
Tokyor14 - R言語でユニットテストYohei Sato
 
Tokyor10 opening
Tokyor10 openingTokyor10 opening
Tokyor10 openingYohei Sato
 
Tokyor39 yokkuns
Tokyor39 yokkunsTokyor39 yokkuns
Tokyor39 yokkunsYohei Sato
 

Viewers also liked (16)

第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッション第3回Japan rパネルディスカッション
第3回Japan rパネルディスカッション
 
Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介
Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介
Tokyor13 - YjdnJlpパッケージとTokyo.R翻訳プロジェクトの紹介
 
Sakuteki02 yokkuns
Sakuteki02 yokkunsSakuteki02 yokkuns
Sakuteki02 yokkuns
 
Tokyowebmining09 初めてでも分かるペアトレード
Tokyowebmining09 初めてでも分かるペアトレードTokyowebmining09 初めてでも分かるペアトレード
Tokyowebmining09 初めてでも分かるペアトレード
 
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組みTokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
Tokyor45 カーネル多変量解析第2章 カーネル多変量解析の仕組み
 
Tokyor42 ggplot2
Tokyor42 ggplot2Tokyor42 ggplot2
Tokyor42 ggplot2
 
Tokyor42_r_datamining_18
Tokyor42_r_datamining_18Tokyor42_r_datamining_18
Tokyor42_r_datamining_18
 
Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門
 
Ml4nlp04 1
Ml4nlp04 1Ml4nlp04 1
Ml4nlp04 1
 
Japan r2 opening
Japan r2 openingJapan r2 opening
Japan r2 opening
 
Japanr01
Japanr01Japanr01
Japanr01
 
Tokyowebmining07 初めてでも分かるヘッジファンド入門
Tokyowebmining07 初めてでも分かるヘッジファンド入門Tokyowebmining07 初めてでも分かるヘッジファンド入門
Tokyowebmining07 初めてでも分かるヘッジファンド入門
 
エンジニアサポート新年会2012 データマイニングcross 第1部
エンジニアサポート新年会2012 データマイニングcross 第1部エンジニアサポート新年会2012 データマイニングcross 第1部
エンジニアサポート新年会2012 データマイニングcross 第1部
 
Tokyor14 - R言語でユニットテスト
Tokyor14 - R言語でユニットテストTokyor14 - R言語でユニットテスト
Tokyor14 - R言語でユニットテスト
 
Tokyor10 opening
Tokyor10 openingTokyor10 opening
Tokyor10 opening
 
Tokyor39 yokkuns
Tokyor39 yokkunsTokyor39 yokkuns
Tokyor39 yokkuns
 

More from Yohei Sato

Tokyor60 r data_science_part1
Tokyor60 r data_science_part1Tokyor60 r data_science_part1
Tokyor60 r data_science_part1Yohei Sato
 
Tokyor60 opening
Tokyor60 openingTokyor60 opening
Tokyor60 openingYohei Sato
 
EasyHtmlReportの紹介
EasyHtmlReportの紹介EasyHtmlReportの紹介
EasyHtmlReportの紹介Yohei Sato
 
20131206 japan r
20131206 japan r20131206 japan r
20131206 japan rYohei Sato
 
Tokyor35 人工データの発生
Tokyor35 人工データの発生Tokyor35 人工データの発生
Tokyor35 人工データの発生Yohei Sato
 
ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例Yohei Sato
 
R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略Yohei Sato
 
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Yohei Sato
 

More from Yohei Sato (8)

Tokyor60 r data_science_part1
Tokyor60 r data_science_part1Tokyor60 r data_science_part1
Tokyor60 r data_science_part1
 
Tokyor60 opening
Tokyor60 openingTokyor60 opening
Tokyor60 opening
 
EasyHtmlReportの紹介
EasyHtmlReportの紹介EasyHtmlReportの紹介
EasyHtmlReportの紹介
 
20131206 japan r
20131206 japan r20131206 japan r
20131206 japan r
 
Tokyor35 人工データの発生
Tokyor35 人工データの発生Tokyor35 人工データの発生
Tokyor35 人工データの発生
 
ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例ドリコムの分析環境とデータサイエンス活用事例
ドリコムの分析環境とデータサイエンス活用事例
 
R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略R言語で学ぶマーケティング分析 競争ポジショニング戦略
R言語で学ぶマーケティング分析 競争ポジショニング戦略
 
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
 

Complex network ws_percolation

  • 1. WSモデル上の パーコレーション解析 @yokkuns: 里 洋平 yohei0511@gmail.com 2012.05.23 複雑ネットワーク勉強会 2012年5月23日水曜日
  • 2. 本日の内容 複雑ネットワーク - 基礎から応用まで - 8.4 WSモデル上のパーコレーション - 2012年5月23日水曜日
  • 3. AGENDA ◆ 自己紹介 ◆ パーコレーションとは ◆ WSモデル上のパーコレーション 2012年5月23日水曜日
  • 4. 自己紹介 時系列解析や異常検知などの方法論を 実ビジネスに適用するデータマイニングエンジニア ◆ 名前: 里 洋平 ◆ ID : yokkuns ◆ 職業: データマイニングエンジニア ◆ 統計解析 パターン認識 機械学 習 データマイニング NLP 金融工学 などを勉強中 2012年5月23日水曜日
  • 5. 活動例: 勉強会の主催・執筆 Tokyo.R主催 パッケージ本執筆しました! 2012年5月23日水曜日
  • 6. 活動例: 動画レコメンド 閲覧されている動画の情報を用いておすすめ動画を表示する 2012年5月23日水曜日
  • 7. 活動例: 市場予測 Web上の情報から市場予測 2012年5月23日水曜日
  • 8. 活動例: 異常検知 Anomaly detection 複数時系列から異常な振る舞いを検知する C A 時系列のモデリング 複数時系列の異常検知 B 時系列A 時系列A 異常な振る舞い 時系列B 時系列C 時系列B 時系列C 異常な振る舞いの時系列を検出 例1:トラフィック異常検知 例2:CM効果のノイズ除去 トラフィックA ケースA CM効果 トラフィックB ケースB トラフィックC 調査 ケースC 異常な振る舞いをしている 異常な振る舞いをしているケースを トラフィックの原因を調査する 除外して、CMの効果を算出する 85 2012年5月23日水曜日
  • 9. 活動例: 時系列解析と異常検知 Anomaly detection 新しいデータと過去時系列モデルの乖離から異常検出 8000.0000 異常スコア推移 モデル構築 3.0000 異常値 ◇例 : ARIMAモデル 2.2500 5970.7500 1.5000 0.7500 3941.5000 0 異常スコアの算出 -0.7500 ◇例 : 対数損失 1912.2500 -1.5000 -2.2500 -117.0000 -3.0000 t 4/ 週 4/ 1週 4/ 8週 5/ 週 5/ 週 5/ 週 5/ 週 5/ 週 6/ 週 6/ 週 6/ 週 6/ 週 7/ 週 7/ 週 7/ 週 7/ 8週 週 4 25 2 9 16 23 30 6 13 20 27 4 11 25 1 1 1 4/ 86 2012年5月23日水曜日
  • 10. 活動例: 時系列解析と影響分析 TV Commercial Effects 時系列的な振る舞いの特徴から各KPIへのCMの影響度を算出 イベン CM時系列 ト 新規 登録 CM ARPP U ARPU 各KPIの時系列 その他 外部 継続率 要因 ケース 87 2012年5月23日水曜日
  • 12. AGENDA ◆ 自己紹介 ◆ パーコレーションとは ◆ WSモデル上のパーコレーション 2012年5月23日水曜日
  • 13. ネットワーク上の感染伝搬モデル ネットワーク上の感染伝搬は、感染の種類だけでなく ネットワークの構造も大きく影響している 感染症の種類 昔 今 ペスト じわじわと前線が進む 飛びながら速く広がる?! インフルエンザ じわじわと前線が進む? 飛びながら速く広がる ペストがはやった"#世紀と現代では、人のネットワーク構造が異なる! !!!!・ 昔は高速移動手段がなかったため平均距離$が大きかったため、広がるのが遅かった! !!!!・ 現在は、飛行機などの存在により、$は小さいため、急速に広がる! ! !!!!⇒!感染症の種類よりもネットワークの構造が帰結を決める 2 2012年5月23日水曜日
  • 14. パーコレーション 空間構造をもち、時間を持たない確率モデル 森林火災、感染症、噂の伝搬など様々な伝搬現象を表す 3 図!"#$%!&&#'()%*+),-./01-2'(&(.*3*1*(*&4)5)*42#&6786%)42'&%)42'9*:'.-#;( 2012年5月23日水曜日
  • 15. パーコレーションの種類 頂点に黒石 or 白石を置くサイト・パーコレーションと 枝に黒石 or 白石を置くボンド・パーコレーションがある 4 2012年5月23日水曜日
  • 16. 相転移と臨界確率 数値計算や近似計算によって、臨界確率を境に 浸透が起こりやすくなる事が分かっている θ(q) θ(q) qc 図!"#$%!&&'''()*+,-*),(.%&)*+,-*),&/01)2*31+14,56782-9,:1;,< 5 2012年5月23日水曜日
  • 17. AGENDA ◆ 自己紹介 ◆ パーコレーションとは ◆ WSモデル上のパーコレーション 2012年5月23日水曜日
  • 18. WS上のパーコレーション概要 枝をつなぎ変える程 平均距離Lが小さくなるため 臨界確率 qc が小さくなり 浸透が起こりやすい 2012年5月23日水曜日
  • 19. 黒石の連結成分の大きさの平均を求めたい 黒石の連結成分の大きさがN となる確率P(N )から期待値を計算する P(N )はつなぎかえ確率pの値によって変化し 直接評価するのが難しいため母関数を用いて考える 黒石の連結成分の大きさの平均が の時 ネットワーク全体に浸透が起こる 直接求めるのは難しいため母関数を考える 2012年5月23日水曜日
  • 20. 母関数のアプローチ 輪に沿った連結成分(ローカルクラスタ)と ショートカットによるそれらの結合の様子を考える 2012年5月23日水曜日
  • 21. 完全クラスタの構成要素 ショートカットも含めた成分(完全クラスタ)は 1個のローカルクラスタと複数の完全クラスタの結合で表現出来る 2012年5月23日水曜日
  • 22. 完全クラスタの母関数 完全クラスタは、以下のように表現出来る また、その母関数をH0(x)とする = n1 + n1 + n1 +・・・ + N + + +・・・ N N 完全クラスタ +・・・ ローカルクラスタ 2012年5月23日水曜日
  • 23. 完全クラスタの母関数 ローカルクラスタのサイズがN の時に注目する 各項に完全クラスタがあり、その母関数もH0(x) = n1 + n1 + n1 +・・・ + N + + +・・・ N N 完全クラスタ +・・・ ローカルクラスタのサイズがN の条件の元で ショートカットの数がm個の成分 ローカルクラスタ 2012年5月23日水曜日
  • 24. 完全クラスタの母関数 母関数は、ローカルクラスタの分布と ショートカットによる完全クラスタとの結合の分布の式で書き下せる 2012年5月23日水曜日
  • 25. 完全クラスタの母関数 母関数は、ローカルクラスタの分布と ショートカットによる完全クラスタとの結合の分布の式で書き下せる m個の完全クラスタの 母関数 ローカルクラスタのサイズが ローカルクラスタのサイズがN の条件の元で N になる確率 ショートカットの数がm個になる確率 2012年5月23日水曜日
  • 26. ショートカットがある確率 ネットワーク全体ではショートカットの数は、p<k>N/2本 端点は2 p<k>N/2 = p<k>N個 二項定理を用いて長さNの輪のうちN の部分に端点がm個入る確率を表す mこの端点の 端点がm回 端点が(総数-m)回 N内の位置の組み合わせ数 N に入る確率 N 以外に入る確率 2012年5月23日水曜日
  • 27. ローカルクラスタの確率 輪に沿って右側に黒石によって進む事が出来る確率を用いて ローカルクラスタの確率を表す 2012年5月23日水曜日
  • 28. ローカルクラスタの確率 輪に沿って右側に黒石によって進む事が出来る確率を用いて ローカルクラスタの確率を表す 最初が黒石である確率 右側にN -1回 ローカルクラスタの 最初の石がローカルクラスタの 辿れる確率 両端の先が全て白石である確率 どこでも良いことを意味する それなりに荒い近似 2012年5月23日水曜日
  • 29. 母関数の展開 完全クラスタの部分を整理して展開する ※ 2012年5月23日水曜日
  • 30. 連結成分の大きさの平均の算出 母関数をxについて微分してx=1で連結成分の大きさの平均になる x=1を代入 H0(1) = 1より 2012年5月23日水曜日
  • 31. 計算の補足 x=1を代入 2012年5月23日水曜日
  • 32. パーコレーションの臨界確率 臨界確率は、連結成分の大きさの平均が無限大になるところ pはWSモデルのつなぎかえ確率なので我々が与える 最終的にqcだけの式になるので、数値計算で求める 2012年5月23日水曜日
  • 33. 臨界指数 ベキ指数が連結成分の大きさ以外の様々な変数についても求まる このようなベキ指数を相転移の臨界指数という 2012年5月23日水曜日
  • 34. AGENDA ◆ 自己紹介 ◆ パーコレーションとは ◆ WSモデル上のパーコレーション 2012年5月23日水曜日