課題設定部門データ説明
- 2. 分析課題
• アクセスログから、未来のCV(資料請求する)
物件、PV(見る)物件を予測して頂きます。
分析用データ
アクセスログ
2012年 2012年 2012年
5月16日 6月19日 7月24日
この期間に初回訪問
評価用データ
この期間に資料請求
アクセスログ Or 物件閲覧
2012年 2012年 2012年 2012年
5月16日 7月24日 7月25日 7月31日
2012/8/3 2
- 3. 提供データ
• ご提供させていただくデータは下記のデータで
す。
– 行動履歴データ
– 検索条件テーブル(駅)
– 検索条件テーブル(沿線)
– 検索条件テーブル(市区郡)
– 物件テーブル
– 駅マスタ
– 沿線マスタ
– 市区郡マスタ
– 物件マスタ
2012/8/3 3
- 4. 提供データ
1 n(≧0) ② 検索情報テーブル(駅) 1 1 ⑥ 駅マスタ
① 行動履歴データ
①との結合キー:パラメータID ②との結合キー:駅コード
1
1 1
n(≧0) ③ 検索情報テーブル(沿線) 1 1 ⑦ 沿線マスタ
①との結合キー:パラメータID ②との結合キー:沿線コード
n(≧0) ④ 検索条件テーブル(市区郡) 1 1 ⑧ 市区郡マスタ
①との結合キー:パラメータID ③との結合キー:市区郡コード
n(≧0) ⑤ 物件テーブル 1 1 ⑨ 物件マスタ
①との結合キー:パラメータID ①との結合キー:物件コード
No ファイル名
① 行動履歴データ SUUMO_koudourireki
・オブジェクトの色の意味は下記の通り。
② 検索条件テーブル(駅) SUUMO_search_eki
トランザクションデータ マスタデータ
③ 検索条件テーブル(沿線) SUUMO_search_ensen
④ 検索条件テーブル(市区郡) SUUMO_search_shikugun ・オブジェクトの結合方法は、オブジェクト内に記載している
⑤ 物件テーブル SUUMO_bukken 結合キーと、対象オブジェクトにある同名の項目により
実施する。
⑥ 駅マスタ SUUMO_eki_master
⑦ 沿線マスタ SUUMO_ensen_master
⑧ 市区郡マスタ SUUMO_shikugun_master
⑨ 物件マスタ SUUMO_bukken_master
2012/8/3 4
- 5. 提供データ
① 行動履歴データ(サンプル)
セッ Page
ユーザ アクセス 滞在 エリア リクエスト パラメー 会員 検索 検索
ション Seria ・・・
ID 日時 時間 コード URL タID フラグ 条件1 条件N
ID l
2012-07-01
001_a 001 1 10 - http://suumo.jp para_001 1 - … -
22:00:00.111
2012-07-01 http://suumo.jp/chi
001_a 001 2 12 010 para_002 1 1 … 0
22:00:10.982 nai/kanto
2012-07-02 http://suumo.jp/chi
001_b 001 1 8 030 para_003 1 0 … 1
17:01:00.982 nai/kanto
2012-07-02 http://suumo.jp/chi
001_b 001 2 10 030 para_004 1 - … -
17:01:08.432 nai/tokyo
2012-07-02 http://suumo.jp/chi
001_b 001 3 12 030 para_005 1 - … -
17:01:18.654 nai/tokyo
2012-07-02 http://suumo.jp/chi
001_b 001 4 20 030 para_006 1 - … -
17:01:30.982 nait/tokyo
2012-07-02 http://suumo.jp/chi
001_b 001 5 7 010 para_007 1 - … -
17:01:50.326 ntai/tokyo
2012-07-01
002_c 002 1 8 050 http://suumo.jp para_008 0 1 … 1
12:00:00.131
2012-07-01
002_c 002 2 13 050 http://suumo.jp para_009 0 - … -
12:00:08.145
2012-07-01 http://suumo.jp/chi
002_c 002 3 10 050 para_010 0 - … -
12:00:21.451 ntai/chiba
… … … … … … … … … … … …
2012/8/3 5
- 6. 提供データ
① 行動履歴データ
項目名 名称 備考
1 session_id セッションID
2 uu_id 暗号化クッキーID
3 request_data アクセス日時
4 param_id パラメータID
: : : :
② 検索条件テーブル(駅)
項目名 名称 備考
1 param_id パラメータID
2 eki_cd 検索指定駅コード 1検索で複数駅指定されている場合は、複数行に分
割して記載。
③ 検索条件テーブル(沿線)
項目名 名称 備考
1 param_id パラメータID
2 ensen_cd 検索指定沿線コード 1検索で複数沿線指定されている場合は、複数行に
分割して記載。
④ 検索条件テーブル(市区郡)
項目名 名称 備考
1 param_id パラメータID
2 shikugun_cd 検索指定市区郡コード 1検索で複数市区郡指定されている場合は、複数
行に分割して記載。
2012/8/3 6
- 7. 提供データ
⑤ 物件テーブル
項目名 名称 備考
1 param_id パラメータID
2 bukken_cd 物件コード 1PVに複数物件が指定されている場合は、複数行に
分割して記載。
⑥ 駅マスタ
項目名 名称 備考
1 eki_cd 駅コード
2 eki_name 駅名
⑦ 沿線マスタ
項目名 名称 備考
1 ensen_cd 沿線コード
2 ensen_name 沿線名
⑧ 市区郡マスタ
項目名 名称 備考
1 shikugun_cd 市区郡コード
2 shikugun_name 市区郡名
⑨ 物件マスタ
項目名 名称 備考
1 bukken_cd 物件コード
2 area_cd エリアコード
:
2012/8/3 7
- 8. 分析用データ
• 分析用データとして下記のデータを提供させて
頂きます。
– データ抽出条件
• 5月16日~6月19日に初めてsuumoを来訪したカスタマー
– 行動履歴データ期間
• 2012年5月16日~2012年7月24日
2012/8/3 8
- 9. 評価方法
• 評価用データでの当てはまりの良さを評価させ
ていただきます。
– データ抽出条件
• 行動履歴データ期間内に初めてsuumoを来訪したカスタ
マーのうち、予測対象期間内にCVもしくは物件ページを
見たカスタマー
– 行動履歴データ期間
• 2012年5月16日~2012年7月24日
– 予測対象期間
• 2012年7月25日~2012年7月31日
– 予測対象
• 対象期間内のユーザー毎のPV及びCV物件
2012/8/3 9
- 10. 評価方法
– 評価基準
• 1カスタマーにつき推薦物件を5件あげていただきます
• CV的中を30P、PV的中を1Pとします
• ユーザーにつき1つ目の正解の得点を100%とし2つ目は
40%、3つ目以降は30%、20%、10%とします
※得点表
正解数
1個目 2個目 3個目 4個目 5個目
CV 30 12 9 6 3
PV 1 1 1 1 1
2012/8/3 10