SlideShare a Scribd company logo
1 of 28
网站离线数据安全分析漫谈
    吴翰清
   2012-07
Who am I?
• Alibaba security
  (7 years)



《白帽子讲web安全》
数据,安全分析

Data Analysis
一些开源项目
• Apache-scalp
• grep

•   规则集:
•   Php-ids
•   Mod-security
•   fuzzdb
有扫描了,
还需要分析日志吗?
漏洞 != 攻击
• 扫描能发现漏洞 (vulnerability)
 – 时间(time)、地点(apps)、起因(vulns)



• 分析日志能发现攻击 (Attack)
 – 时间(time)、地点(apps)、人物(source ip)
 – 起因(vulns)、经过(intrude path)、结果(lost)
Why not IPS/WAF?
• 在线数据分析:IPS/IDS/WAF

• 离线数据分析
 – 计算更复杂
 – 数据量更大
 – 并联、异步
 – 时效性不高
满足更复杂的需求
• 场景1:
 – 统计某XSS蠕虫感染的用户数


• 场景2:
 – 把网站的所有请求根据URL去重,提供给扫描
   器进行扫描
挑战与对策

大数据的传输    syslog-ng, ?

大数据的存储    hdfs

大数据的计算   map-reduce

实时性的提高    hbase?
现有流程

日志收集



 ETL


规则分析



结果输出
数据仓库?
处理能力
• 10亿+请求
• 半小时左右分析完,仍有提高空间
分析什么?
• 白名单的思想
• Referer
• url 字符集



• 产生过多噪音
• 降噪
检测XSS?
• 检测通用类型的攻击吗?
 – XSS
 – SQL INJECTION
 – FILE INCLUSION
 – CODE INJECTION
 – COMMAND EXECUTE
 – ……
• Alibaba的需求 vs 中小网站的需求
检测具体的exploits
• 漏洞库
漏洞 != 攻击 != 攻击成功
• 误报 404/403/500/503/301/302/…




• 有用吗?没用吗?有用吗?没用吗?
攻击验证
日志收集


 ETL


规则分析


攻击验证



结果输出
Webshell检测
Webshell分布
• 90%以上webshell为ddos
• 多数webshell是ddos、挂暗链、挂马
0.0026%为webshell请求
攻击检测
每当新漏洞公布时
DEDE CMS 5.7 SQLi (ssvid-60089)
Shopex4.8.5 SQLi (wooyun-2012-08597)
当然也能统计
展望未来
为中小网站提供数据安全分析服务

互联网安全的风向标
网站离线数据安全分析漫谈 2012cert

More Related Content

What's hot

No sql@vip new
No sql@vip newNo sql@vip new
No sql@vip newChao Zhu
 
ELK Stack - Kibana操作實務
ELK Stack - Kibana操作實務ELK Stack - Kibana操作實務
ELK Stack - Kibana操作實務Kedy Chang
 
Sql server 2014 新功能探索
Sql server 2014  新功能探索Sql server 2014  新功能探索
Sql server 2014 新功能探索Rico Chen
 
数据库性能模型与容量规划
数据库性能模型与容量规划数据库性能模型与容量规划
数据库性能模型与容量规划freezr
 
X program-within-a-month
X program-within-a-monthX program-within-a-month
X program-within-a-monthChao Zhu
 
大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点 大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点 Chao Zhu
 
給開發人員的資料庫效能建議
給開發人員的資料庫效能建議給開發人員的資料庫效能建議
給開發人員的資料庫效能建議Rico Chen
 
Elastic stack day-1
Elastic stack day-1Elastic stack day-1
Elastic stack day-1YI-CHING WU
 
Elastic Stack 最新动态
Elastic Stack 最新动态Elastic Stack 最新动态
Elastic Stack 最新动态Elasticsearch
 
阿里开源经验分享
阿里开源经验分享阿里开源经验分享
阿里开源经验分享Joshua Zhu
 
OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案freezr
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform SecurityJazz Yao-Tsung Wang
 
Taobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qconTaobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qconYiwei Ma
 
Exadata那点事
Exadata那点事Exadata那点事
Exadata那点事freezr
 
Full Stack Monitoring with Prometheus and Grafana (Updated)
Full Stack Monitoring with Prometheus and Grafana (Updated)Full Stack Monitoring with Prometheus and Grafana (Updated)
Full Stack Monitoring with Prometheus and Grafana (Updated)Jazz Yao-Tsung Wang
 
開源技術建構訂票交易資料庫
開源技術建構訂票交易資料庫開源技術建構訂票交易資料庫
開源技術建構訂票交易資料庫José Lin
 
中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 SaacChao Zhu
 

What's hot (18)

No sql@vip new
No sql@vip newNo sql@vip new
No sql@vip new
 
ELK Stack - Kibana操作實務
ELK Stack - Kibana操作實務ELK Stack - Kibana操作實務
ELK Stack - Kibana操作實務
 
Sql server 2014 新功能探索
Sql server 2014  新功能探索Sql server 2014  新功能探索
Sql server 2014 新功能探索
 
mercury
mercurymercury
mercury
 
数据库性能模型与容量规划
数据库性能模型与容量规划数据库性能模型与容量规划
数据库性能模型与容量规划
 
X program-within-a-month
X program-within-a-monthX program-within-a-month
X program-within-a-month
 
大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点 大型电商的数据服务的要点和难点
大型电商的数据服务的要点和难点
 
給開發人員的資料庫效能建議
給開發人員的資料庫效能建議給開發人員的資料庫效能建議
給開發人員的資料庫效能建議
 
Elastic stack day-1
Elastic stack day-1Elastic stack day-1
Elastic stack day-1
 
Elastic Stack 最新动态
Elastic Stack 最新动态Elastic Stack 最新动态
Elastic Stack 最新动态
 
阿里开源经验分享
阿里开源经验分享阿里开源经验分享
阿里开源经验分享
 
OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案OTN软硬件结合数据库解决方案
OTN软硬件结合数据库解决方案
 
2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security2016-07-12 Introduction to Big Data Platform Security
2016-07-12 Introduction to Big Data Platform Security
 
Taobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qconTaobao casestudy-yufeng-qcon
Taobao casestudy-yufeng-qcon
 
Exadata那点事
Exadata那点事Exadata那点事
Exadata那点事
 
Full Stack Monitoring with Prometheus and Grafana (Updated)
Full Stack Monitoring with Prometheus and Grafana (Updated)Full Stack Monitoring with Prometheus and Grafana (Updated)
Full Stack Monitoring with Prometheus and Grafana (Updated)
 
開源技術建構訂票交易資料庫
開源技術建構訂票交易資料庫開源技術建構訂票交易資料庫
開源技術建構訂票交易資料庫
 
中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac中大型规模的网站架构运维 Saac
中大型规模的网站架构运维 Saac
 

Similar to 网站离线数据安全分析漫谈 2012cert

基礎網頁程式攻擊檢驗
基礎網頁程式攻擊檢驗基礎網頁程式攻擊檢驗
基礎網頁程式攻擊檢驗Taien Wang
 
用戶端攻擊與防禦
用戶端攻擊與防禦用戶端攻擊與防禦
用戶端攻擊與防禦Taien Wang
 
淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享vanadies10
 
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...acelyc1112009
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseJack Gao
 
1到100000000 - 分布式大型网站的架构设计
1到100000000 - 分布式大型网站的架构设计1到100000000 - 分布式大型网站的架构设计
1到100000000 - 分布式大型网站的架构设计RolfZhang
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座NTC.im(Notch Training Center)
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at TaobaoJoshua Zhu
 
WebConf 2013「Best Practices - The Upload」
WebConf 2013「Best Practices - The Upload」WebConf 2013「Best Practices - The Upload」
WebConf 2013「Best Practices - The Upload」Orange Tsai
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法Jazz Yao-Tsung Wang
 
天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011Yiwei Ma
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lakeJames Chen
 
分布式爬虫
分布式爬虫分布式爬虫
分布式爬虫drewz lin
 
弹性计算云安全(Elastic Compute Cloud Security)
弹性计算云安全(Elastic Compute Cloud Security)弹性计算云安全(Elastic Compute Cloud Security)
弹性计算云安全(Elastic Compute Cloud Security)im_yunshu
 
雲端分散架構的駭客事件與安全問題
雲端分散架構的駭客事件與安全問題雲端分散架構的駭客事件與安全問題
雲端分散架構的駭客事件與安全問題Alan Lee
 
分布式缓存与队列
分布式缓存与队列分布式缓存与队列
分布式缓存与队列XiaoJun Hong
 
曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731
曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731
曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731drewz lin
 
Hiiir 資安講座 III 用戶端攻擊與防禦
Hiiir 資安講座 III 用戶端攻擊與防禦Hiiir 資安講座 III 用戶端攻擊與防禦
Hiiir 資安講座 III 用戶端攻擊與防禦Hiiir Lab
 
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New翀 刘
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里li luo
 

Similar to 网站离线数据安全分析漫谈 2012cert (20)

基礎網頁程式攻擊檢驗
基礎網頁程式攻擊檢驗基礎網頁程式攻擊檢驗
基礎網頁程式攻擊檢驗
 
用戶端攻擊與防禦
用戶端攻擊與防禦用戶端攻擊與防禦
用戶端攻擊與防禦
 
淘宝双11双12案例分享
淘宝双11双12案例分享淘宝双11双12案例分享
淘宝双11双12案例分享
 
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
The Construction and Practice of Apache Pegasus in Offline and Online Scenari...
 
Data Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouseData Analyse Black Horse - ClickHouse
Data Analyse Black Horse - ClickHouse
 
1到100000000 - 分布式大型网站的架构设计
1到100000000 - 分布式大型网站的架构设计1到100000000 - 分布式大型网站的架构设计
1到100000000 - 分布式大型网站的架构设计
 
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
淺談物聯網巨量資料挑戰 - Jazz 王耀聰 (2016/3/17 於鴻海內湖) 免費講座
 
Hacking Nginx at Taobao
Hacking Nginx at TaobaoHacking Nginx at Taobao
Hacking Nginx at Taobao
 
WebConf 2013「Best Practices - The Upload」
WebConf 2013「Best Practices - The Upload」WebConf 2013「Best Practices - The Upload」
WebConf 2013「Best Practices - The Upload」
 
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
2015-05-20 製造業生產歷程全方位整合查詢與探勘的規劃心法
 
天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011天涯论坛的技术进化史-Qcon2011
天涯论坛的技术进化史-Qcon2011
 
Hadoop con 2015 hadoop enables enterprise data lake
Hadoop con 2015   hadoop enables enterprise data lakeHadoop con 2015   hadoop enables enterprise data lake
Hadoop con 2015 hadoop enables enterprise data lake
 
分布式爬虫
分布式爬虫分布式爬虫
分布式爬虫
 
弹性计算云安全(Elastic Compute Cloud Security)
弹性计算云安全(Elastic Compute Cloud Security)弹性计算云安全(Elastic Compute Cloud Security)
弹性计算云安全(Elastic Compute Cloud Security)
 
雲端分散架構的駭客事件與安全問題
雲端分散架構的駭客事件與安全問題雲端分散架構的駭客事件與安全問題
雲端分散架構的駭客事件與安全問題
 
分布式缓存与队列
分布式缓存与队列分布式缓存与队列
分布式缓存与队列
 
曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731
曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731
曲琳 购物搜索引擎架构的变与不变——一淘网搜索技术分享0731
 
Hiiir 資安講座 III 用戶端攻擊與防禦
Hiiir 資安講座 III 用戶端攻擊與防禦Hiiir 資安講座 III 用戶端攻擊與防禦
Hiiir 資安講座 III 用戶端攻擊與防禦
 
美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New美丽说的架构发展与变迁 New
美丽说的架构发展与变迁 New
 
Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里Qcon2013 罗李 - hadoop在阿里
Qcon2013 罗李 - hadoop在阿里
 

More from ph4nt0m

2013qcon keynote hackingforfun
2013qcon keynote hackingforfun2013qcon keynote hackingforfun
2013qcon keynote hackingforfunph4nt0m
 
Web指纹识别与快速扫描 public
Web指纹识别与快速扫描   publicWeb指纹识别与快速扫描   public
Web指纹识别与快速扫描 publicph4nt0m
 
云计算时代的安全格局变化
云计算时代的安全格局变化云计算时代的安全格局变化
云计算时代的安全格局变化ph4nt0m
 
流行应用的加密算法实现缺陷与利用
流行应用的加密算法实现缺陷与利用流行应用的加密算法实现缺陷与利用
流行应用的加密算法实现缺陷与利用ph4nt0m
 
麻烦终结者
麻烦终结者麻烦终结者
麻烦终结者ph4nt0m
 
黑客江湖 阿里十周年分享
黑客江湖 阿里十周年分享黑客江湖 阿里十周年分享
黑客江湖 阿里十周年分享ph4nt0m
 
Web应用安全:过去,现在,未来(Public Ver)
Web应用安全:过去,现在,未来(Public Ver)Web应用安全:过去,现在,未来(Public Ver)
Web应用安全:过去,现在,未来(Public Ver)ph4nt0m
 

More from ph4nt0m (7)

2013qcon keynote hackingforfun
2013qcon keynote hackingforfun2013qcon keynote hackingforfun
2013qcon keynote hackingforfun
 
Web指纹识别与快速扫描 public
Web指纹识别与快速扫描   publicWeb指纹识别与快速扫描   public
Web指纹识别与快速扫描 public
 
云计算时代的安全格局变化
云计算时代的安全格局变化云计算时代的安全格局变化
云计算时代的安全格局变化
 
流行应用的加密算法实现缺陷与利用
流行应用的加密算法实现缺陷与利用流行应用的加密算法实现缺陷与利用
流行应用的加密算法实现缺陷与利用
 
麻烦终结者
麻烦终结者麻烦终结者
麻烦终结者
 
黑客江湖 阿里十周年分享
黑客江湖 阿里十周年分享黑客江湖 阿里十周年分享
黑客江湖 阿里十周年分享
 
Web应用安全:过去,现在,未来(Public Ver)
Web应用安全:过去,现在,未来(Public Ver)Web应用安全:过去,现在,未来(Public Ver)
Web应用安全:过去,现在,未来(Public Ver)
 

网站离线数据安全分析漫谈 2012cert