盛大游戏运维体系
- 2. Agenda
盛大游戏运维体系综述
分子系统介绍
游戏运维体系未来展望
- 3. Agenda
盛大游戏运维体系综述
分子系统介绍
游戏运维体系展望
- 4. 盛大游戏运维体系发展历程
可管理
可控制
为了更好支持快速发展的业务,运维工作必须朝着规范
化、标准化、可管理的方向发展,08年起盛大也逐步引
入ITIL、安全标准等理念,打造盛大模式的运维体系
可操作
随着自动化体系日益丰富,盛大开始建立报警和监控
系统,快速准确地发现和定位故障,提高运维稳定性
自2004年开始,随着服务器数量的快速增长,盛大着手建立
游戏远程操作平台,使运维逐渐摆脱依赖人海战术的模式,
提高生产效率
- 5. 盛大游戏运维体系-四大主要部分
• 服务器虚拟化 • 盛大监控服务体
• Octopod 系
• Autopatch
• Uniweb
• 等等
自动化 自动化
管理 监控
流程管 安全管
理 理
• 事件管理 • 安全审计
• 问题管理&知识库 • 应用安全
• 变更管理 • 系统安全
• 配置管理 • 网络安全
- 6. Agenda
盛大游戏运维体系综述
分子系统介绍
游戏运维体系未来展望
- 7. 服务器远程操作平台--Octopod
自动化 自动化
Octopod是盛大自主研发的服务器远 管理 监控
程管理系统,系统管理员无需再服 流程管
理
安全管
理
务器现场即可完成所有操作。
Octopod Server
远
程
用户管理 信息管理 操作管理 补丁管理 日志管理 游戏管理
桌
面
基础框架
Octopod Client
通讯层
基础层
- 10. 盛大游戏客户端补丁自动更新系统
盛大游戏客户端补丁自动更新系统可实现用户 自动化
管理
自动化
监控
管理、版本管理、补丁上传下发及校验等 流程管 安全管
功能。 理 理
……………
DLC前台服务器组
传奇世界 冒险岛 彩虹岛
英雄年代 泡泡堂 热血传奇
任务信息 备份 DLC后台服务器组
Master Slave
管理系统
Patch文件
…………… Autopatch服务器组
SVN
- 11. 盛大业务运维监控体系
盛大业务运维监控体系有针对性地对所有可 自动化 自动化
能影响游戏运营的因素进行全方位的监控 管理 监控
和数据采集、分析,目前能展示10万多条 流程管
理
安全管
理
再现人数和性能曲线,监控覆盖率达
100%,报警有效率达70%以上。
•游戏客户端质量监控
游戏客户端
•游戏服务器端程序监控
游戏服务器端应用 游
•系统日志的收集和分析
戏
人
系统程序 数
•游戏服务器健康检查 监
和性能监控
•网络设备和流量监控 控
服务器、网络设备
硬件
•IDC网络质量监控
•IDC机房连通性监控
机房、链路
- 14. 运维安全体系
自动化 自动化
管理 监控
流程管 安全管
安全审计 理 理
内部用户登录审计、外部用户权限审计、内部用户操作行为审计
应用安全 系统安全 网络安全
•Web漏洞扫描 •补丁分发管理
•Webshell监控 •主机访问控制 •ARP攻击测试
•渗透性测试 •病毒扫描 •DDOS攻击防御
•Web代码审计 •漏洞跟踪 •网络访问控制
•网络流量分析
- 15. 运维安全-网络安全
网络安全 ARP攻击检测 DDOS攻击防御 网络访问控制 网络流量分析
ARP攻击监控 DDOS攻击 网络访问 网络流量分析
报警 防御 控制
• 自研开发每3 • 千兆级抗 • 防火墙实现 • 基于Netflow自
分钟检测一 DDOS设备 研开发
次 +ACL过滤常见 • 交换机ACL实 • 实施完成后通
攻击 现 过快速分析异
常流量
• 发现攻击及 • 旁路式全局 • 迅速定位攻击
时上报至应 DDOS流量清 类型及时响应
急响应平台 洗
- 16. 运维安全体系-系统安全
系统安全 补丁分发管理 主机访问控制 病毒扫描 漏洞跟踪与预警
补丁管理 主机访问控制 病毒扫描 漏洞跟踪
• 基于Octopod • Uinx/Linux采用 • 统一的病毒库 • 跟踪国外安全
iptables实施控 升级策略 机构最新漏洞
• 万台服务器补 制
丁快速分发安 • 统一的全网病 • 跟踪黑客群体
装与检查 • Windows采用 扫描策略 最新动向
ipsec实施控制
• 统一的事件上 • 跟踪最新0day
报应急响应平
台策略 • 及时预警采取
应对方案
- 17. 运维安全体系-应用安全
应用安全 Web漏洞扫描 Webshell监控 渗透性测试 web代码审计
Web漏洞扫描 Webshell监控 渗透性测试 网站代码审计
• 发现和消除网 • 自研开发,对 • 定期对内部系 • 通过网站上
站安全漏洞 公司网站每小 统进行安全性 线前的代码
时扫描一次 测试 检查机制
• 自动化工具定 • 查找权限问题
期扫描 • 统一的网站检 • SQL注入 • 及时处理网
测策略 • 跨站脚本 站存在安全
漏洞
• 检测报警上报 • 及时修补安全
应急响应平台 问题
- 18. 运维安全体系-安全审计
安全审计 内部用户登录审计 内部用户权限审计 内部用户操作行为审计
登录审计 权限审计 操作行为审计
• 实现对服务器登录日 • 实现对用户访问服务 • 实现对windows图形
志的审计 器权限的审计 环境屏幕录像审计
• 实现对Octopod操作
• 实现内部应用系统登 • 实现对用户访问内部 日志的审计
录日志的审计 应用系统的审计 • 实现内部应用系统操
作行为的审计
• 审计登录中存在的异 • 审计出不合理的权限
常的行为 • 消除安全隐患 • 审计异常和违规的操
作行为
- 19. 运维服务管理体系
自动化 自动化
随着系统、技术的日益复杂,维护水平要求的 管理 监控
逐步提高,盛大运维团队借鉴业界最佳实践 流程管
理
安全管
理
ITIL的理念,从人员、流程、技术等各方面着
手,逐步提升管理能力,以有限的人力支持不
断扩展的游戏数量。
调整组织结构,以适应业
务和流程的需求,并实现
量化考核
人员 以服务导向取代技
术导向
通过合适的技术,固化流
程,以及提升自动化程度 服务
参考业界最佳实践,
建设规范化流程
技术 流程
- 21. Agenda
盛大游戏运维体系综述
分子系统介绍
游戏运维体系未来展望