SlideShare a Scribd company logo
1 of 10
Download to read offline
【SUUMO】データ及び評価方法概要


              MP統括部 SUUMOネット推進部
               横断MPグループ CRMチーム
                    野村 眞平




2012/8/3             1
分析課題

     • アクセスログから、未来のCV(資料請求する)
       物件、PV(見る)物件を予測して頂きます。
           分析用データ
                    アクセスログ


    2012年                2012年       2012年
    5月16日                6月19日       7月24日
             この期間に初回訪問


           評価用データ
                                              この期間に資料請求
                    アクセスログ                      Or 物件閲覧


    2012年                            2012年   2012年   2012年
    5月16日                            7月24日   7月25日   7月31日




2012/8/3                         2
提供データ

     • ご提供させていただくデータは下記のデータで
       す。
           –   行動履歴データ
           –   検索条件テーブル(駅)
           –   検索条件テーブル(沿線)
           –   検索条件テーブル(市区郡)
           –   物件テーブル
           –   駅マスタ
           –   沿線マスタ
           –   市区郡マスタ
           –   物件マスタ


2012/8/3                 3
提供データ

                       1   n(≧0)    ② 検索情報テーブル(駅)      1       1       ⑥ 駅マスタ
       ① 行動履歴データ
                                     ①との結合キー:パラメータID                ②との結合キー:駅コード
                       1
              1    1
                           n(≧0)   ③ 検索情報テーブル(沿線)      1       1      ⑦ 沿線マスタ
                                     ①との結合キー:パラメータID               ②との結合キー:沿線コード



                           n(≧0) ④ 検索条件テーブル(市区郡) 1             1     ⑧ 市区郡マスタ
                                     ①との結合キー:パラメータID               ③との結合キー:市区郡コード



                           n(≧0)        ⑤ 物件テーブル       1       1      ⑨ 物件マスタ
                                     ①との結合キー:パラメータID               ①との結合キー:物件コード


 No                        ファイル名
 ①    行動履歴データ              SUUMO_koudourireki
                                                           ・オブジェクトの色の意味は下記の通り。
 ②    検索条件テーブル(駅)          SUUMO_search_eki
                                                             トランザクションデータ        マスタデータ
 ③    検索条件テーブル(沿線)         SUUMO_search_ensen
 ④    検索条件テーブル(市区郡)        SUUMO_search_shikugun           ・オブジェクトの結合方法は、オブジェクト内に記載している
 ⑤    物件テーブル               SUUMO_bukken                    結合キーと、対象オブジェクトにある同名の項目により
                                                           実施する。
 ⑥    駅マスタ                 SUUMO_eki_master
 ⑦    沿線マスタ                SUUMO_ensen_master
 ⑧    市区郡マスタ               SUUMO_shikugun_master
 ⑨    物件マスタ                SUUMO_bukken_master

2012/8/3                                           4
提供データ

 ① 行動履歴データ(サンプル)
     セッ                            Page
             ユーザ     アクセス                 滞在   エリア        リクエスト            パラメー        会員   検索          検索
     ション                          Seria                                                           ・・・
              ID      日時                  時間   コード          URL             タID       フラグ   条件1         条件N
      ID                            l

                    2012-07-01
     001_a   001                   1      10    -     http://suumo.jp      para_001    1     -    …      -
                   22:00:00.111

                    2012-07-01                       http://suumo.jp/chi
     001_a   001                   2      12   010                         para_002    1     1    …      0
                   22:00:10.982                           nai/kanto

                    2012-07-02                       http://suumo.jp/chi
     001_b   001                   1      8    030                         para_003    1     0    …      1
                   17:01:00.982                           nai/kanto

                    2012-07-02                       http://suumo.jp/chi
     001_b   001                   2      10   030                         para_004    1     -    …      -
                   17:01:08.432                           nai/tokyo

                    2012-07-02                       http://suumo.jp/chi
     001_b   001                   3      12   030                         para_005    1     -    …      -
                   17:01:18.654                           nai/tokyo

                    2012-07-02                       http://suumo.jp/chi
     001_b   001                   4      20   030                         para_006    1     -    …      -
                   17:01:30.982                          nait/tokyo

                    2012-07-02                       http://suumo.jp/chi
     001_b   001                   5      7    010                         para_007    1     -    …      -
                   17:01:50.326                          ntai/tokyo

                    2012-07-01
     002_c   002                   1      8    050    http://suumo.jp      para_008    0     1    …      1
                   12:00:00.131

                    2012-07-01
     002_c   002                   2      13   050    http://suumo.jp      para_009    0     -    …      -
                   12:00:08.145

                    2012-07-01                       http://suumo.jp/chi
     002_c   002                   3      10   050                         para_010    0     -    …      -
                   12:00:21.451                          ntai/chiba

      …      …         …           …      …    …              …              …        …     …     …     …




2012/8/3                                                  5
提供データ
    ① 行動履歴データ
           項目名            名称              備考
     1     session_id     セッションID
     2     uu_id          暗号化クッキーID
     3     request_data   アクセス日時
     4     param_id       パラメータID
     :     :              :               :

    ② 検索条件テーブル(駅)
           項目名            名称              備考
     1     param_id       パラメータID
     2     eki_cd         検索指定駅コード        1検索で複数駅指定されている場合は、複数行に分
                                          割して記載。

    ③ 検索条件テーブル(沿線)
           項目名            名称              備考
     1     param_id       パラメータID
     2     ensen_cd       検索指定沿線コード       1検索で複数沿線指定されている場合は、複数行に
                                          分割して記載。

    ④ 検索条件テーブル(市区郡)
           項目名            名称              備考
     1     param_id       パラメータID
     2     shikugun_cd    検索指定市区郡コード      1検索で複数市区郡指定されている場合は、複数
                                          行に分割して記載。

2012/8/3                              6
提供データ
    ⑤ 物件テーブル
           項目名             名称            備考
     1     param_id        パラメータID
     2     bukken_cd       物件コード         1PVに複数物件が指定されている場合は、複数行に
                                         分割して記載。

    ⑥ 駅マスタ
           項目名             名称            備考
     1     eki_cd          駅コード
     2     eki_name        駅名

    ⑦ 沿線マスタ
           項目名             名称            備考
     1     ensen_cd        沿線コード
     2     ensen_name      沿線名

    ⑧ 市区郡マスタ
           項目名             名称            備考
     1     shikugun_cd     市区郡コード
     2     shikugun_name   市区郡名

    ⑨ 物件マスタ
           項目名             名称            備考
     1     bukken_cd       物件コード
     2     area_cd         エリアコード
     :
2012/8/3                             7
分析用データ

     • 分析用データとして下記のデータを提供させて
       頂きます。
           – データ抽出条件
            • 5月16日~6月19日に初めてsuumoを来訪したカスタマー
           – 行動履歴データ期間
            • 2012年5月16日~2012年7月24日




2012/8/3                    8
評価方法

     • 評価用データでの当てはまりの良さを評価させ
       ていただきます。
           – データ抽出条件
            • 行動履歴データ期間内に初めてsuumoを来訪したカスタ
              マーのうち、予測対象期間内にCVもしくは物件ページを
              見たカスタマー
           – 行動履歴データ期間
            • 2012年5月16日~2012年7月24日
           – 予測対象期間
            • 2012年7月25日~2012年7月31日
           – 予測対象
            • 対象期間内のユーザー毎のPV及びCV物件



2012/8/3                    9
評価方法

           – 評価基準
            • 1カスタマーにつき推薦物件を5件あげていただきます
            • CV的中を30P、PV的中を1Pとします
            • ユーザーにつき1つ目の正解の得点を100%とし2つ目は
              40%、3つ目以降は30%、20%、10%とします
   ※得点表
                                正解数
               1個目   2個目        3個目   4個目   5個目
       CV       30    12         9     6     3
       PV        1     1         1     1     1




2012/8/3                   10

More Related Content

Viewers also liked

これからの住宅 20130725 暮らしのミニセミナー (1)
これからの住宅 20130725 暮らしのミニセミナー (1)これからの住宅 20130725 暮らしのミニセミナー (1)
これからの住宅 20130725 暮らしのミニセミナー (1)yukariharada
 
+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)
+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)
+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)hosokawa atsushi
 
CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)
CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)
CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)ナイル株式会社
 
アメーバピグのユーザ体験を定量/定性で捉える方法
アメーバピグのユーザ体験を定量/定性で捉える方法アメーバピグのユーザ体験を定量/定性で捉える方法
アメーバピグのユーザ体験を定量/定性で捉える方法寛 水野
 
博士論文公聴会
博士論文公聴会博士論文公聴会
博士論文公聴会Makoto SAKAI
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例Amazon Web Services Japan
 
ユニクロ実証研究
ユニクロ実証研究ユニクロ実証研究
ユニクロ実証研究h-takamizawa
 
就活生が企業研究で見るべき5つの財務指標
就活生が企業研究で見るべき5つの財務指標就活生が企業研究で見るべき5つの財務指標
就活生が企業研究で見るべき5つの財務指標Satoshi Uehara
 
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素Recruit Technologies
 
ユーザーエクスペリエンスに基づいた指標設計と改善の考え方
ユーザーエクスペリエンスに基づいた指標設計と改善の考え方ユーザーエクスペリエンスに基づいた指標設計と改善の考え方
ユーザーエクスペリエンスに基づいた指標設計と改善の考え方Taku ogawa
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組Recruit Technologies
 
リクルートのWebサービスを支える「RAFTEL」
リクルートのWebサービスを支える「RAFTEL」リクルートのWebサービスを支える「RAFTEL」
リクルートのWebサービスを支える「RAFTEL」Recruit Technologies
 
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルリクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルRecruit Technologies
 
パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)
パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)
パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)一般社団法人シェアリングエコノミー協会
 

Viewers also liked (17)

これからの住宅 20130725 暮らしのミニセミナー (1)
これからの住宅 20130725 暮らしのミニセミナー (1)これからの住宅 20130725 暮らしのミニセミナー (1)
これからの住宅 20130725 暮らしのミニセミナー (1)
 
+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)
+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)
+手のひらで考えるデジタル活用マーケティング_(digital marketing to think plus palm)
 
Uberご紹介(髙橋正巳)
Uberご紹介(髙橋正巳)Uberご紹介(髙橋正巳)
Uberご紹介(髙橋正巳)
 
CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)
CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)
CV数を2倍に改善した不動産サイト事例SEOセミナーレポート(外部公開用)
 
アメーバピグのユーザ体験を定量/定性で捉える方法
アメーバピグのユーザ体験を定量/定性で捉える方法アメーバピグのユーザ体験を定量/定性で捉える方法
アメーバピグのユーザ体験を定量/定性で捉える方法
 
博士論文公聴会
博士論文公聴会博士論文公聴会
博士論文公聴会
 
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
[よくわかるクラウドデータベース] リクルートにおけるRedshift導入・活用事例
 
ユニクロ実証研究
ユニクロ実証研究ユニクロ実証研究
ユニクロ実証研究
 
就活生が企業研究で見るべき5つの財務指標
就活生が企業研究で見るべき5つの財務指標就活生が企業研究で見るべき5つの財務指標
就活生が企業研究で見るべき5つの財務指標
 
Pepper+独自会話エンジン
Pepper+独自会話エンジンPepper+独自会話エンジン
Pepper+独自会話エンジン
 
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
リクルートが実践で学んできた“セルフBI”推進に求められる3つの要素
 
ユーザーエクスペリエンスに基づいた指標設計と改善の考え方
ユーザーエクスペリエンスに基づいた指標設計と改善の考え方ユーザーエクスペリエンスに基づいた指標設計と改善の考え方
ユーザーエクスペリエンスに基づいた指標設計と改善の考え方
 
リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組リクルートにおけるデータのインフラ化への取組
リクルートにおけるデータのインフラ化への取組
 
リクルートのWebサービスを支える「RAFTEL」
リクルートのWebサービスを支える「RAFTEL」リクルートのWebサービスを支える「RAFTEL」
リクルートのWebサービスを支える「RAFTEL」
 
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアルリクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
リクルートテクノロジーズが語る 企業における、「AI/ディープラーニング」活用のリアル
 
シェアリングエコノミー推進に係る政府の取り組について(犬童周作)
シェアリングエコノミー推進に係る政府の取り組について(犬童周作)シェアリングエコノミー推進に係る政府の取り組について(犬童周作)
シェアリングエコノミー推進に係る政府の取り組について(犬童周作)
 
パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)
パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)
パソナグループの地方創生とシェアリングエコノミー推進のとりくみ (勝瀬博則)
 

課題設定部門データ説明

  • 1. 【SUUMO】データ及び評価方法概要 MP統括部 SUUMOネット推進部 横断MPグループ CRMチーム 野村 眞平 2012/8/3 1
  • 2. 分析課題 • アクセスログから、未来のCV(資料請求する) 物件、PV(見る)物件を予測して頂きます。 分析用データ アクセスログ 2012年 2012年 2012年 5月16日 6月19日 7月24日 この期間に初回訪問 評価用データ この期間に資料請求 アクセスログ Or 物件閲覧 2012年 2012年 2012年 2012年 5月16日 7月24日 7月25日 7月31日 2012/8/3 2
  • 3. 提供データ • ご提供させていただくデータは下記のデータで す。 – 行動履歴データ – 検索条件テーブル(駅) – 検索条件テーブル(沿線) – 検索条件テーブル(市区郡) – 物件テーブル – 駅マスタ – 沿線マスタ – 市区郡マスタ – 物件マスタ 2012/8/3 3
  • 4. 提供データ 1 n(≧0) ② 検索情報テーブル(駅) 1 1 ⑥ 駅マスタ ① 行動履歴データ ①との結合キー:パラメータID ②との結合キー:駅コード 1 1 1 n(≧0) ③ 検索情報テーブル(沿線) 1 1 ⑦ 沿線マスタ ①との結合キー:パラメータID ②との結合キー:沿線コード n(≧0) ④ 検索条件テーブル(市区郡) 1 1 ⑧ 市区郡マスタ ①との結合キー:パラメータID ③との結合キー:市区郡コード n(≧0) ⑤ 物件テーブル 1 1 ⑨ 物件マスタ ①との結合キー:パラメータID ①との結合キー:物件コード No ファイル名 ① 行動履歴データ SUUMO_koudourireki ・オブジェクトの色の意味は下記の通り。 ② 検索条件テーブル(駅) SUUMO_search_eki トランザクションデータ マスタデータ ③ 検索条件テーブル(沿線) SUUMO_search_ensen ④ 検索条件テーブル(市区郡) SUUMO_search_shikugun ・オブジェクトの結合方法は、オブジェクト内に記載している ⑤ 物件テーブル SUUMO_bukken 結合キーと、対象オブジェクトにある同名の項目により 実施する。 ⑥ 駅マスタ SUUMO_eki_master ⑦ 沿線マスタ SUUMO_ensen_master ⑧ 市区郡マスタ SUUMO_shikugun_master ⑨ 物件マスタ SUUMO_bukken_master 2012/8/3 4
  • 5. 提供データ ① 行動履歴データ(サンプル) セッ Page ユーザ アクセス 滞在 エリア リクエスト パラメー 会員 検索 検索 ション Seria ・・・ ID 日時 時間 コード URL タID フラグ 条件1 条件N ID l 2012-07-01 001_a 001 1 10 - http://suumo.jp para_001 1 - … - 22:00:00.111 2012-07-01 http://suumo.jp/chi 001_a 001 2 12 010 para_002 1 1 … 0 22:00:10.982 nai/kanto 2012-07-02 http://suumo.jp/chi 001_b 001 1 8 030 para_003 1 0 … 1 17:01:00.982 nai/kanto 2012-07-02 http://suumo.jp/chi 001_b 001 2 10 030 para_004 1 - … - 17:01:08.432 nai/tokyo 2012-07-02 http://suumo.jp/chi 001_b 001 3 12 030 para_005 1 - … - 17:01:18.654 nai/tokyo 2012-07-02 http://suumo.jp/chi 001_b 001 4 20 030 para_006 1 - … - 17:01:30.982 nait/tokyo 2012-07-02 http://suumo.jp/chi 001_b 001 5 7 010 para_007 1 - … - 17:01:50.326 ntai/tokyo 2012-07-01 002_c 002 1 8 050 http://suumo.jp para_008 0 1 … 1 12:00:00.131 2012-07-01 002_c 002 2 13 050 http://suumo.jp para_009 0 - … - 12:00:08.145 2012-07-01 http://suumo.jp/chi 002_c 002 3 10 050 para_010 0 - … - 12:00:21.451 ntai/chiba … … … … … … … … … … … … 2012/8/3 5
  • 6. 提供データ ① 行動履歴データ 項目名 名称 備考 1 session_id セッションID 2 uu_id 暗号化クッキーID 3 request_data アクセス日時 4 param_id パラメータID : : : : ② 検索条件テーブル(駅) 項目名 名称 備考 1 param_id パラメータID 2 eki_cd 検索指定駅コード 1検索で複数駅指定されている場合は、複数行に分 割して記載。 ③ 検索条件テーブル(沿線) 項目名 名称 備考 1 param_id パラメータID 2 ensen_cd 検索指定沿線コード 1検索で複数沿線指定されている場合は、複数行に 分割して記載。 ④ 検索条件テーブル(市区郡) 項目名 名称 備考 1 param_id パラメータID 2 shikugun_cd 検索指定市区郡コード 1検索で複数市区郡指定されている場合は、複数 行に分割して記載。 2012/8/3 6
  • 7. 提供データ ⑤ 物件テーブル 項目名 名称 備考 1 param_id パラメータID 2 bukken_cd 物件コード 1PVに複数物件が指定されている場合は、複数行に 分割して記載。 ⑥ 駅マスタ 項目名 名称 備考 1 eki_cd 駅コード 2 eki_name 駅名 ⑦ 沿線マスタ 項目名 名称 備考 1 ensen_cd 沿線コード 2 ensen_name 沿線名 ⑧ 市区郡マスタ 項目名 名称 備考 1 shikugun_cd 市区郡コード 2 shikugun_name 市区郡名 ⑨ 物件マスタ 項目名 名称 備考 1 bukken_cd 物件コード 2 area_cd エリアコード : 2012/8/3 7
  • 8. 分析用データ • 分析用データとして下記のデータを提供させて 頂きます。 – データ抽出条件 • 5月16日~6月19日に初めてsuumoを来訪したカスタマー – 行動履歴データ期間 • 2012年5月16日~2012年7月24日 2012/8/3 8
  • 9. 評価方法 • 評価用データでの当てはまりの良さを評価させ ていただきます。 – データ抽出条件 • 行動履歴データ期間内に初めてsuumoを来訪したカスタ マーのうち、予測対象期間内にCVもしくは物件ページを 見たカスタマー – 行動履歴データ期間 • 2012年5月16日~2012年7月24日 – 予測対象期間 • 2012年7月25日~2012年7月31日 – 予測対象 • 対象期間内のユーザー毎のPV及びCV物件 2012/8/3 9
  • 10. 評価方法 – 評価基準 • 1カスタマーにつき推薦物件を5件あげていただきます • CV的中を30P、PV的中を1Pとします • ユーザーにつき1つ目の正解の得点を100%とし2つ目は 40%、3つ目以降は30%、20%、10%とします ※得点表 正解数 1個目 2個目 3個目 4個目 5個目 CV 30 12 9 6 3 PV 1 1 1 1 1 2012/8/3 10