SlideShare a Scribd company logo
1 of 21
Download to read offline
指導教授: 沈錳坤
學生: 徐凡耘
2015/06/24
Outline
 Part I : 背景知識
 Ad Network 簡介
 RTB (Real Time Bidding) 簡介
 兩者的差別
 DSP/ DMP 需要作的事
 Part II : DSP中的算法
 用户選擇(Audience Selection)
 出價演算法(Bidding Algorithm)
 線上出價調整(Bid Adjustment)
 Part III: Data Preprocessing
 進行步驟
 參考文獻
•Ad Network 簡介
•RTB (Real Time Bidding) 簡介
•DSP 一般工作流程
背景知識 - Ad Network 簡介
版位 廣告主
AD Network
1. 設置條件2. 廣告請求
3. 返回廣告
背景知識 - RTB (Real Time Bidding)
廣告主版位
1. 設置條件
3. 公開競價
5. 返回廣告
DSP
AD Exchange
User A User B
2. 廣告請求
4. 得標廣告
背景知識 – 兩者的差別
 以DSP角度
 原本廣告請求都一定有曝光機會,但現在不一定
 原本以CPC計價,現在要用CPM計價
 DSP變多了,競爭變多,要搶廣告主訂單
 以廣告主角度
 更符合自己利益
 可自訂投放受眾
 以DMP角度
 每家 DSP 都必須有這樣的部門分析受眾資料
 滿足廣告主客製化投放需求
背景知識 – DSP/ DMP需要作的事
 追踪用戶行為 (Behavior Tracking)
 Action Data:
 DMP 在廣告主的網站上埋 code(通常是放一個 1X1 不可見
的圖像),當用戶瀏覽該網站時,DMP得到相關資料。在廣
告主授權下,把該資料交給 DSP。
 Mapping Data:
 DSP 會和第三方網站合作(例如:yahoo、google),在它
們的網站上埋 code,或者向 DMP 購買用戶瀏覽資料,這樣
就可以追蹤用戶在網路上的行為。
 用戶在每個網站上留下的cookie 不一樣,需要做 cookie
mapping.
背景知識 – DSP/ DMP 需要作的事
 受眾選擇(Audience Selection)
 離線計算每個 campaign 的目標投放用戶集
 廣告主可以通過配置來管理這些目標投放的用戶集
 進行即時競價
 當 Ad Exchange 發佈廣告請求的時候,DSP 會收到以
下資料 (當前版位資料、當前用户的cookie 和基本資料)
 DSP 需要在 100ms 內,根據對該用戶的理解,並且考
慮當前的版位,根據自己的競價演算法,來決定以下資
料 (是否要對這次曝光進行競價? 要投放哪個 campaign
的廣告? 出價是多少? )
背景知識 – DSP/ DMP 需要作的事
 廣告曝光
 競價最高者DSP,赢得了曝光機會,則 DSP 返回廣告
資訊,用戶就會再該廣告版位上看到該廣告(圖片、文
字、影片、 flash)
 追蹤轉化
 Ad Exchange 向 DSP 回報該 DSP 出價成功的曝光廣告
是否產生點擊或轉化
 根據這些統計資料如: 點擊率CTR、轉化率 CVR,每個
轉化平均成本 CPA 等各種指標,匯總成報表給廣告主
•用户選擇(Audience Selection)
•出價演算法(Bidding Algorithm)
•在線出價調整(Bid Adjustment)
常用演算法– Audience Selection
 受眾選擇(Audience Selection) :
 找到每個 Campaign 的目標投放用户集 (user
targeting)
 方法一:Tagging based
 DSP 對所有能掌握住的用戶,根據其行為每個用戶打上
各種標籤(User Profiling)
 廣告主對每個 campaign 選擇一系列標籤,確定自己要
的用戶集
DSP中的演算法-Audience Selection
 Tagging 的作法:
 建立標籤體系(有無階層),符合廣告主的習慣
 有些標籤可以直接拿到,如地區、作頁系統、瀏覽器
 用戶瀏覽行為貼標 (例如: 網頁類別、商品、電影 )
 UGC 標籤或 Meta Info中的資料,對應到標籤體系中的標籤
 瀏覽本文提取關鍵字,對應到標籤體系中的標籤
 專家定義
 對應不到標籤者,可用 KNN等演算法得到標籤
 行為加權計算
 權重與行為類型有關 (例如: 購買 > 點擊 > 瀏覽)
 權重與行為時間先後有關
 分類問題
 建立每個Campaign的segment點擊與否(Gradient
Boosting Trees)
 推薦問題
 協同過濾 (Item-base, User-base, SlopeOne 等)
 圖模型 (Random walk, label propagation 等)
 其他 (ALS, SVD, Topic Model)
DSP中的演算法-Audience Selection
 方法二:Retargeting
 紀錄曾經瀏覽過廣告主的cookie,然後廣告只對這些
cookie投放廣告
 核心技術
 廣告主/ DMP 在廣告主網站上嵌入JS收集
 廣告主通過 DMP 平台或者CRM系統,來挑選和管理
這些cookie
DSP中的演算法-Audience Selection
 方法三:Look-alike 模型的做法
(以M6D的做法為例)
 針對每個 campaign
 建立 model 預估用戶發生轉化機率 (P c|u)
 正例是在廣告主網頁發生轉化的用戶,反之為負例
 根據每個用戶 P(c|u) 將用戶劃分到不同的 Segments
 不同 segments 的 P(c|u)範圍不同,平均每個 Campaign 有
10~50個 segments。廣告主根據自己的需求決定開啟或者
關閉某些 segments
DSP中的演算法-Audience Selection
DSP中的算法-Bidding Algorithm
 Real time bidding 過程
 當 Ad Exchange 發送競價請求時,會帶出用戶的Cookie
與廣告版位資料
 檢索: DSP 先根據Cookie找到所有目標投放用戶集包含該
Cookie的Campaign
 過濾: 濾掉預算不符的Campaign與已達用戶曝光次數上限
的Campaign
 出價: 對每一個Campaign計算出價金額
 內部競價: 選擇出價最高的Campaign,並返回Ad
Exchange
 以上需要100ms內完成
DSP中的算法-Bidding Algorithm
 出價模型(以MD6為例)
(P(c | s, i, a)
一個曝光的價值 = 點擊機率 * 點擊價值
(P(c | s, a)
s 目標用戶的集合 (Segment)
a 廣告 Campaign
i 當前的版位 (inventory)
c 轉化 (conversion)
P(c | s, i, a) 與 P(c | s, a) 分別是對每個Compaign
建模的,BasePrice 是人為指定
1. 整理資料
1.1 在 Hive 上建立資料
1.2 關聯 imp, click, conv
1.3 資料轉換與特徵抽取 (時間、IP、UA)
1.4 data profiling
2. 資料建模
2.1 隨機抽取資料做測試資料集,剩下的做訓練資料集
2.2 套用演算法
3. 成效評估
3.1 AUC 評估前後 life 值
進行步驟
資料說明 (點擊、曝光、轉換與競標 log)
Bid_ID c664386ec6e82748041166b2db11602f
Timestamp 20130311195547700
類型 2
ID 2d1e5f1bbde3daf1e87e5d4b58bc45d2
UA
Mozilla/5.0 (Windows NT 6.1; WOW64)
AppleWebKit/535.12 (KHTML, like
Gecko) Maxthon/3.0 Chrome/18.0.966.0
Safari/535.12
IP 125.123.45.*
區域 94
城市 98
交易平台 2
廣告所在網域 kDsuqx9vdo5bgYMf5SqfNX
廣告所在URL ddf57d3266e44c0db001ed0d8cc59300
匿名URL_ID null
版位ID 3252010289
廣告寬度 160
廣告高度 600
廣告可視性 1
版位形式 0
版位底價 5
廣告創意ID 51fd94f6624989b7cecbc307f00f97f7
出價(CPM) 300
成交價 0
主頁URL 9f4e2f16b6873a7eb504df6f61b24044
廣告主ID 1458
用戶標籤 10057, 13042, 10031, 14273
Bid_ID e3d962536ef3ac7096b31fdd1c1c24b0
Timestamp 2.01303E+16
ID 37a6259cc0c1dae299a7866489dff0bd
UA
Mozilla/4.0 (compatible; MSIE 8.0;
Windows NT 6.1; Trident/4.0;
QQDownload 734; SLCC2; .NET CLR
2.0.50727; .NET CLR 3.5.30729; .NET CLR
3.0.30729; eSobiSubscriber 2.0.4.16;
MAAR),gzip(gfe),gzip(gfe)
IP 219.232.120.*
區域 1
城市 1
交易平台 2
網域 DF9blS9bQqsIFYB4uA5R
URL b6c5272dfc63032f659be9b786c5f8da
匿名URL_ID
版位ID 2006366309
廣告寬度 728
廣告高度 90
版位可視性 1
版位形式 0
版位底價 5
廣告創意ID 5aca4c5f29e59e425c7ea657fdaac91e
出價 300
廣告主ID 2345
用戶標籤 null
參考文獻
 Bid Optimizing and Inventory Scoring in Targeted Online Advertising
 Design Principles of Massive, Robust Prediction Systems
 Bid Landscape forecasting in Online Ad Exchange Marketplance
http://www.sheetoo.com/app/course/overview?course_id=200
 Real-Time Bidding Algorithms for Performance-Based Display Ad
Allocation
 Fast Algorithm for Finding Matchings in Lopsided Bipartite Graphs with
Applications to Display Ads
Logistic Regression in Rare Events Data
 Alex Smola Blog: http://blog.smola.org/post/4110255196/real-simple-
covariate-shift-correction
 PID Controller wikipedia http://en.wikipedia.org/wiki/PID_controller

More Related Content

Similar to 行動廣告演算法探討

打倒程式化購買術語
打倒程式化購買術語打倒程式化購買術語
打倒程式化購買術語NT150 Com
 
成效行銷&精準廣告
成效行銷&精準廣告成效行銷&精準廣告
成效行銷&精準廣告Hsiang-Wei Yu
 
从整合营销角度看Cmmg的应用
从整合营销角度看Cmmg的应用从整合营销角度看Cmmg的应用
从整合营销角度看Cmmg的应用tudoucatch
 
行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行Craig Chao
 
網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯Norika
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.comsuilingbo
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.comsuilingbo
 
Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網Joseph Chiang
 
線上廣告簡介
線上廣告簡介線上廣告簡介
線上廣告簡介Ihong Chen
 
Display advertising netowrk eco system sharing
Display advertising netowrk eco system sharingDisplay advertising netowrk eco system sharing
Display advertising netowrk eco system sharing誼峰 陳
 
Real time bidding 实时竞价
Real time bidding 实时竞价 Real time bidding 实时竞价
Real time bidding 实时竞价 Yana Timofeeva
 
一淘广告机器学习
一淘广告机器学习一淘广告机器学习
一淘广告机器学习Shaoning Pan
 
美团点评技术沙龙011 - 团购系统流量和容量评估实践
美团点评技术沙龙011 - 团购系统流量和容量评估实践美团点评技术沙龙011 - 团购系统流量和容量评估实践
美团点评技术沙龙011 - 团购系统流量和容量评估实践美团点评技术团队
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理Kay Yan
 
如何防止销售撞单 桉树Crm
如何防止销售撞单 桉树Crm如何防止销售撞单 桉树Crm
如何防止销售撞单 桉树Crmwangxeme
 
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作jeffery57
 
High Throughput Computing Technologies
High Throughput Computing TechnologiesHigh Throughput Computing Technologies
High Throughput Computing TechnologiesJazz Yao-Tsung Wang
 
網路廣告的基本架構
網路廣告的基本架構網路廣告的基本架構
網路廣告的基本架構Chen-en Lu
 

Similar to 行動廣告演算法探討 (20)

打倒程式化購買術語
打倒程式化購買術語打倒程式化購買術語
打倒程式化購買術語
 
成效行銷&精準廣告
成效行銷&精準廣告成效行銷&精準廣告
成效行銷&精準廣告
 
1 Dmaic D
1 Dmaic D1 Dmaic D
1 Dmaic D
 
从整合营销角度看Cmmg的应用
从整合营销角度看Cmmg的应用从整合营销角度看Cmmg的应用
从整合营销角度看Cmmg的应用
 
行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行行動廣告與大數據資料分析策略與執行
行動廣告與大數據資料分析策略與執行
 
網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯網路廣告操作基礎 - 架構設計與優化邏輯
網路廣告操作基礎 - 架構設計與優化邏輯
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com
 
商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com商业产品体系介绍 By offer5.com
商业产品体系介绍 By offer5.com
 
Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網Yahoo! 奇摩關鍵字廣告聯播網
Yahoo! 奇摩關鍵字廣告聯播網
 
yeah baby
yeah babyyeah baby
yeah baby
 
線上廣告簡介
線上廣告簡介線上廣告簡介
線上廣告簡介
 
Display advertising netowrk eco system sharing
Display advertising netowrk eco system sharingDisplay advertising netowrk eco system sharing
Display advertising netowrk eco system sharing
 
Real time bidding 实时竞价
Real time bidding 实时竞价 Real time bidding 实时竞价
Real time bidding 实时竞价
 
一淘广告机器学习
一淘广告机器学习一淘广告机器学习
一淘广告机器学习
 
美团点评技术沙龙011 - 团购系统流量和容量评估实践
美团点评技术沙龙011 - 团购系统流量和容量评估实践美团点评技术沙龙011 - 团购系统流量和容量评估实践
美团点评技术沙龙011 - 团购系统流量和容量评估实践
 
大规模数据处理
大规模数据处理大规模数据处理
大规模数据处理
 
如何防止销售撞单 桉树Crm
如何防止销售撞单 桉树Crm如何防止销售撞单 桉树Crm
如何防止销售撞单 桉树Crm
 
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
基于KMeans建模的 广告效果聚类分析,以实现有针对性的广告效果测量和优化工作
 
High Throughput Computing Technologies
High Throughput Computing TechnologiesHigh Throughput Computing Technologies
High Throughput Computing Technologies
 
網路廣告的基本架構
網路廣告的基本架構網路廣告的基本架構
網路廣告的基本架構
 

More from FEG

Sequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdfSequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdfFEG
 
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdfFEG
 
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdfFEG
 
Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318FEG
 
2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practices2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practicesFEG
 
2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratch2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratchFEG
 
2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratchFEG
 
2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratch2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratchFEG
 
2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_Rules2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_RulesFEG
 
202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)FEG
 
202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis Visualization202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis VisualizationFEG
 
Transfer Learning (20230516)
Transfer Learning (20230516)Transfer Learning (20230516)
Transfer Learning (20230516)FEG
 
Image Classification (20230411)
Image Classification (20230411)Image Classification (20230411)
Image Classification (20230411)FEG
 
Google CoLab (20230321)
Google CoLab (20230321)Google CoLab (20230321)
Google CoLab (20230321)FEG
 
Supervised Learning
Supervised LearningSupervised Learning
Supervised LearningFEG
 
UnSupervised Learning Clustering
UnSupervised Learning ClusteringUnSupervised Learning Clustering
UnSupervised Learning ClusteringFEG
 
Data Visualization in Excel
Data Visualization in ExcelData Visualization in Excel
Data Visualization in ExcelFEG
 
6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdf6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdfFEG
 
5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdf5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdfFEG
 
4_Regression_analysis.pdf
4_Regression_analysis.pdf4_Regression_analysis.pdf
4_Regression_analysis.pdfFEG
 

More from FEG (20)

Sequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdfSequence Model pytorch at colab with gpu.pdf
Sequence Model pytorch at colab with gpu.pdf
 
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
學院碩士班_非監督式學習_使用Orange3直接使用_分群_20240417.pdf
 
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
資料視覺化_透過Orange3進行_無須寫程式直接使用_碩士學程_202403.pdf
 
Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318Pytorch cnn netowork introduction 20240318
Pytorch cnn netowork introduction 20240318
 
2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practices2023 Decision Tree analysis in business practices
2023 Decision Tree analysis in business practices
 
2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratch2023 Clustering analysis using Python from scratch
2023 Clustering analysis using Python from scratch
 
2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch2023 Data visualization using Python from scratch
2023 Data visualization using Python from scratch
 
2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratch2023 Supervised Learning for Orange3 from scratch
2023 Supervised Learning for Orange3 from scratch
 
2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_Rules2023 Supervised_Learning_Association_Rules
2023 Supervised_Learning_Association_Rules
 
202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)202312 Exploration Data Analysis Visualization (English version)
202312 Exploration Data Analysis Visualization (English version)
 
202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis Visualization202312 Exploration of Data Analysis Visualization
202312 Exploration of Data Analysis Visualization
 
Transfer Learning (20230516)
Transfer Learning (20230516)Transfer Learning (20230516)
Transfer Learning (20230516)
 
Image Classification (20230411)
Image Classification (20230411)Image Classification (20230411)
Image Classification (20230411)
 
Google CoLab (20230321)
Google CoLab (20230321)Google CoLab (20230321)
Google CoLab (20230321)
 
Supervised Learning
Supervised LearningSupervised Learning
Supervised Learning
 
UnSupervised Learning Clustering
UnSupervised Learning ClusteringUnSupervised Learning Clustering
UnSupervised Learning Clustering
 
Data Visualization in Excel
Data Visualization in ExcelData Visualization in Excel
Data Visualization in Excel
 
6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdf6_Association_rule_碩士班第六次.pdf
6_Association_rule_碩士班第六次.pdf
 
5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdf5_Neural_network_碩士班第五次.pdf
5_Neural_network_碩士班第五次.pdf
 
4_Regression_analysis.pdf
4_Regression_analysis.pdf4_Regression_analysis.pdf
4_Regression_analysis.pdf
 

行動廣告演算法探討

  • 2. Outline  Part I : 背景知識  Ad Network 簡介  RTB (Real Time Bidding) 簡介  兩者的差別  DSP/ DMP 需要作的事  Part II : DSP中的算法  用户選擇(Audience Selection)  出價演算法(Bidding Algorithm)  線上出價調整(Bid Adjustment)  Part III: Data Preprocessing  進行步驟  參考文獻
  • 3. •Ad Network 簡介 •RTB (Real Time Bidding) 簡介 •DSP 一般工作流程
  • 4. 背景知識 - Ad Network 簡介 版位 廣告主 AD Network 1. 設置條件2. 廣告請求 3. 返回廣告
  • 5. 背景知識 - RTB (Real Time Bidding) 廣告主版位 1. 設置條件 3. 公開競價 5. 返回廣告 DSP AD Exchange User A User B 2. 廣告請求 4. 得標廣告
  • 6. 背景知識 – 兩者的差別  以DSP角度  原本廣告請求都一定有曝光機會,但現在不一定  原本以CPC計價,現在要用CPM計價  DSP變多了,競爭變多,要搶廣告主訂單  以廣告主角度  更符合自己利益  可自訂投放受眾  以DMP角度  每家 DSP 都必須有這樣的部門分析受眾資料  滿足廣告主客製化投放需求
  • 7. 背景知識 – DSP/ DMP需要作的事  追踪用戶行為 (Behavior Tracking)  Action Data:  DMP 在廣告主的網站上埋 code(通常是放一個 1X1 不可見 的圖像),當用戶瀏覽該網站時,DMP得到相關資料。在廣 告主授權下,把該資料交給 DSP。  Mapping Data:  DSP 會和第三方網站合作(例如:yahoo、google),在它 們的網站上埋 code,或者向 DMP 購買用戶瀏覽資料,這樣 就可以追蹤用戶在網路上的行為。  用戶在每個網站上留下的cookie 不一樣,需要做 cookie mapping.
  • 8. 背景知識 – DSP/ DMP 需要作的事  受眾選擇(Audience Selection)  離線計算每個 campaign 的目標投放用戶集  廣告主可以通過配置來管理這些目標投放的用戶集  進行即時競價  當 Ad Exchange 發佈廣告請求的時候,DSP 會收到以 下資料 (當前版位資料、當前用户的cookie 和基本資料)  DSP 需要在 100ms 內,根據對該用戶的理解,並且考 慮當前的版位,根據自己的競價演算法,來決定以下資 料 (是否要對這次曝光進行競價? 要投放哪個 campaign 的廣告? 出價是多少? )
  • 9. 背景知識 – DSP/ DMP 需要作的事  廣告曝光  競價最高者DSP,赢得了曝光機會,則 DSP 返回廣告 資訊,用戶就會再該廣告版位上看到該廣告(圖片、文 字、影片、 flash)  追蹤轉化  Ad Exchange 向 DSP 回報該 DSP 出價成功的曝光廣告 是否產生點擊或轉化  根據這些統計資料如: 點擊率CTR、轉化率 CVR,每個 轉化平均成本 CPA 等各種指標,匯總成報表給廣告主
  • 11. 常用演算法– Audience Selection  受眾選擇(Audience Selection) :  找到每個 Campaign 的目標投放用户集 (user targeting)  方法一:Tagging based  DSP 對所有能掌握住的用戶,根據其行為每個用戶打上 各種標籤(User Profiling)  廣告主對每個 campaign 選擇一系列標籤,確定自己要 的用戶集
  • 12. DSP中的演算法-Audience Selection  Tagging 的作法:  建立標籤體系(有無階層),符合廣告主的習慣  有些標籤可以直接拿到,如地區、作頁系統、瀏覽器  用戶瀏覽行為貼標 (例如: 網頁類別、商品、電影 )  UGC 標籤或 Meta Info中的資料,對應到標籤體系中的標籤  瀏覽本文提取關鍵字,對應到標籤體系中的標籤  專家定義  對應不到標籤者,可用 KNN等演算法得到標籤  行為加權計算  權重與行為類型有關 (例如: 購買 > 點擊 > 瀏覽)  權重與行為時間先後有關
  • 13.  分類問題  建立每個Campaign的segment點擊與否(Gradient Boosting Trees)  推薦問題  協同過濾 (Item-base, User-base, SlopeOne 等)  圖模型 (Random walk, label propagation 等)  其他 (ALS, SVD, Topic Model) DSP中的演算法-Audience Selection
  • 14.  方法二:Retargeting  紀錄曾經瀏覽過廣告主的cookie,然後廣告只對這些 cookie投放廣告  核心技術  廣告主/ DMP 在廣告主網站上嵌入JS收集  廣告主通過 DMP 平台或者CRM系統,來挑選和管理 這些cookie DSP中的演算法-Audience Selection
  • 15.  方法三:Look-alike 模型的做法 (以M6D的做法為例)  針對每個 campaign  建立 model 預估用戶發生轉化機率 (P c|u)  正例是在廣告主網頁發生轉化的用戶,反之為負例  根據每個用戶 P(c|u) 將用戶劃分到不同的 Segments  不同 segments 的 P(c|u)範圍不同,平均每個 Campaign 有 10~50個 segments。廣告主根據自己的需求決定開啟或者 關閉某些 segments DSP中的演算法-Audience Selection
  • 16. DSP中的算法-Bidding Algorithm  Real time bidding 過程  當 Ad Exchange 發送競價請求時,會帶出用戶的Cookie 與廣告版位資料  檢索: DSP 先根據Cookie找到所有目標投放用戶集包含該 Cookie的Campaign  過濾: 濾掉預算不符的Campaign與已達用戶曝光次數上限 的Campaign  出價: 對每一個Campaign計算出價金額  內部競價: 選擇出價最高的Campaign,並返回Ad Exchange  以上需要100ms內完成
  • 17. DSP中的算法-Bidding Algorithm  出價模型(以MD6為例) (P(c | s, i, a) 一個曝光的價值 = 點擊機率 * 點擊價值 (P(c | s, a) s 目標用戶的集合 (Segment) a 廣告 Campaign i 當前的版位 (inventory) c 轉化 (conversion) P(c | s, i, a) 與 P(c | s, a) 分別是對每個Compaign 建模的,BasePrice 是人為指定
  • 18.
  • 19. 1. 整理資料 1.1 在 Hive 上建立資料 1.2 關聯 imp, click, conv 1.3 資料轉換與特徵抽取 (時間、IP、UA) 1.4 data profiling 2. 資料建模 2.1 隨機抽取資料做測試資料集,剩下的做訓練資料集 2.2 套用演算法 3. 成效評估 3.1 AUC 評估前後 life 值 進行步驟
  • 20. 資料說明 (點擊、曝光、轉換與競標 log) Bid_ID c664386ec6e82748041166b2db11602f Timestamp 20130311195547700 類型 2 ID 2d1e5f1bbde3daf1e87e5d4b58bc45d2 UA Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.12 (KHTML, like Gecko) Maxthon/3.0 Chrome/18.0.966.0 Safari/535.12 IP 125.123.45.* 區域 94 城市 98 交易平台 2 廣告所在網域 kDsuqx9vdo5bgYMf5SqfNX 廣告所在URL ddf57d3266e44c0db001ed0d8cc59300 匿名URL_ID null 版位ID 3252010289 廣告寬度 160 廣告高度 600 廣告可視性 1 版位形式 0 版位底價 5 廣告創意ID 51fd94f6624989b7cecbc307f00f97f7 出價(CPM) 300 成交價 0 主頁URL 9f4e2f16b6873a7eb504df6f61b24044 廣告主ID 1458 用戶標籤 10057, 13042, 10031, 14273 Bid_ID e3d962536ef3ac7096b31fdd1c1c24b0 Timestamp 2.01303E+16 ID 37a6259cc0c1dae299a7866489dff0bd UA Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; QQDownload 734; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; eSobiSubscriber 2.0.4.16; MAAR),gzip(gfe),gzip(gfe) IP 219.232.120.* 區域 1 城市 1 交易平台 2 網域 DF9blS9bQqsIFYB4uA5R URL b6c5272dfc63032f659be9b786c5f8da 匿名URL_ID 版位ID 2006366309 廣告寬度 728 廣告高度 90 版位可視性 1 版位形式 0 版位底價 5 廣告創意ID 5aca4c5f29e59e425c7ea657fdaac91e 出價 300 廣告主ID 2345 用戶標籤 null
  • 21. 參考文獻  Bid Optimizing and Inventory Scoring in Targeted Online Advertising  Design Principles of Massive, Robust Prediction Systems  Bid Landscape forecasting in Online Ad Exchange Marketplance http://www.sheetoo.com/app/course/overview?course_id=200  Real-Time Bidding Algorithms for Performance-Based Display Ad Allocation  Fast Algorithm for Finding Matchings in Lopsided Bipartite Graphs with Applications to Display Ads Logistic Regression in Rare Events Data  Alex Smola Blog: http://blog.smola.org/post/4110255196/real-simple- covariate-shift-correction  PID Controller wikipedia http://en.wikipedia.org/wiki/PID_controller