“游戏运维无人值守”不再是梦
2015 年1月, 应华南地区广大游戏运营技术人员的要求和热情邀请,腾讯游戏运营部运营管理中心总监刘栖铜带领蓝鲸团队先后在深圳、广州举行了两场有关蓝鲸平台自动化运维技术的交流沙龙活动,广深及周边多家知名互联网企业与蓝鲸团队面对面共同探讨游戏运营技术。此次沙龙活动以“面向运维无人值守”为主题,就腾讯游戏自动化运营体系技术进行了深入的分享和讨论。 腾讯游戏运营部运营管理中心副总监涂彦代表腾讯游戏运维开场致辞。 涂彦代表公司感谢参会人员对技术交流沙龙活动的支持,并简单的介绍了腾讯游戏技术运营团队。紧接着他从传统运维的“质量、效率、成本、安全”到基于传统运维形成的下一代运维生态体系出发,做了在“腾讯游戏大规模爆发”的背景下,作为“运维”如何才能体现出更好价值的精彩分享。并提出了通过平台的标准化、自动化、服务化,覆盖业务全生命周期的理念。 在蓝鲸主题分享正式开始之前,腾讯资深游戏运维分别从游戏的“发布、变更、故障处理、以及业务优化”等方面回顾了腾讯游戏运维多年以来的工作变革之路,为大家揭开腾讯海量游戏运维工作的神秘面纱。 蓝鲸负责人党受辉解密蓝鲸运维体系。 腾讯游戏运营部运营管理中心党受辉之前曾在东软集团为能源行业定制信息化体系,积累了多年行业级信息化解决方案的软件开发、架构设计及大型项目管理经验。 2009年加入腾讯游戏运营部,曾管理游戏运维团队,为各种不同类型的游戏及千万PCU级游戏平台设计自动化运营系统。目前负责腾讯游戏运维支撑体系的建设工作。他作为蓝鲸创始人进行了主题分享。 在运维人力有限、游戏数量巨大、变化频繁、复杂情况层出不穷、运营紧迫度只增不减的背景下,已知的传统运维平台的建设思路是无力应对的,而游戏的运营质量效率必须得到提高。同时运维人员的热情也会被日渐琐碎、枯燥、疲惫、低价值、高事故率的工作磨灭掉。作为支撑体系建设团队,一方面需要帮助公司更出色的完成业绩目标、提升运营的质量和效率,另一方面需要帮助运维人员实现转型和增值、同时为游戏运营提供更大的助力,这正是蓝鲸团队当初创建蓝鲸的两个初衷。 在需要高效、高质量的运营支撑海量游戏的巨大挑战下,凭借腾讯游戏运营支撑团队的创新思维、执着和不懈的努力,蓝鲸的理念、模式、体系平台给运维技术带来了很多新的思路,在游戏运维领域崭露头角,并得到了技术同行们的很多关注和学习的热情。蓝鲸让从事运维技术的人看到,运维也可以这样做。 蓝鲸是依托SOA理念和云技术构建的运维模式,以“原子服务集成”和“工具开放构建”的方式解决“运维基础服务”的无人值守及“运维增值服务”的低成本实现;蓝鲸体系是一套落地蓝鲸模式的技术解决方案;而蓝鲸生态是一套落地蓝鲸模式的管理解决方案。 蓝鲸不仅为游戏运营人员提供了丰富的工具SaaS服务,同时为开发者提供了PaaS服务。蓝鲸PaaS云平台提供了全流程的工具开发,调试和托管服务,降低了工具的开发门槛,普通运维经过简单培训就可以快速制作运营工具,上装到市场。同时,蓝鲸对接了大量IaaS层和运营系统层的原子操作,在ESB平台内实现灵活调度,提供给PaaS平台使用,这样运维在构建调度自动化工具的时候就不需要自己对接接口、硬编码调度逻辑了,进一步降低了工具开发门槛。这样的运营工具定制服务,非常适合需求趋于个性化的游戏业务。 整个分享从“蓝鲸是什么,蓝鲸怎么用,蓝鲸能给大家带来什么,互动答疑”四个方面来进行了展示。 蓝鲸目前可输出的服务如下图所示,包括运维的基础服务和增值服务,覆盖了游戏运营的方方面面;不仅如此,在开放的理念下,App开发者们可以在蓝鲸平台上输出更多个性化的、满足自身需求、解决自身痛点的服务。 沙龙现场气氛活跃,参会嘉宾踊跃发言提问,蓝鲸团队的开发人员现场演示了如何在蓝鲸平台上开发一个简单App的完整过程,从编码到布署上线大约只需10分钟,充分验证了运维在蓝鲸平台开发App的低成本。 之后,游戏运维代表依次演示了腾讯游戏无人值守(自动开区、自动扩缩容、故障自愈等)、运营自助服务、精细化数据视图服务的部分典型App。 现场互动答疑 参会嘉宾对蓝鲸反响强烈,现场互动非常活跃,我们节选了部分问答摘要如下: 问:蓝鲸未来的发展方向? 答:一方面,继续服务好腾讯内部自己的游戏和合作开发商;另一方面,把蓝鲸体系开放到公有云,尽可能对接更多的原子服务,让业界的公司能够享受到我们的经验积累。同时,后面我们还会尝试去开源蓝鲸框架,让大家一起来丰富蓝鲸的生态体系。 问:蓝鲸平台本身的运维是怎么做的,Agent更新机制是怎样的? 答:我们是通Docker化免运维部署,并且在高可用方面做了大量工作;Agent具有自更新功能,无需人工干预。 问:蓝鲸App有几百个,如何保证App执行的高可用、安全性和并发性? 答:高可用方面,我们实现了Docker资源动态调配;安全性方面,我们有一套成熟的App审核机制,只有通过严格审核的App才能上线到市场供人使用;并发性方面,我们采用了高并发的引擎,并且在腾讯游戏的海量运维场景中经过了验证。 问:接口调用过高导致资源耗尽的问题如何避免? 答:接口调用有次数限制,某一个App调用某接口频率过高,平台会对其进行告警直至限制访问。 腾讯游戏运营部运营管理中心总监刘栖铜对蓝鲸的展望。 刘栖铜总监从一名老运维的身份谈了对运维工作的感受,他从运维传统的搬机器上架、发布变更、故障处理等一些价值较低的工作谈起,最后谈到他对未来运维工作如何才能体现价值的思考。作为腾讯游戏运维的主要负责人,他非常希望能够通过蓝鲸平台帮助运维从传统的工作中解放出来,去做一些主动服务业务的运维增值服务,从而实现运维价值的提升。 刘栖铜也代表蓝鲸团队真诚的表达了乐于将团队成果开放出来与同行分享的意愿。并希望通过大家不断的分享交流,彼此互通有无,一起将运维工作整理出一套规范的、可复制的、可持续发展的运维体系,从而为业界做出应有的贡献。 目前蓝鲸已经开始在腾讯云进行逐步开放,借助这个开放的渠道,诚邀大家共同参与到互联网运维体系的建设中来,共同探讨如何将互联网运维做的更好。 (更多游戏资讯请访问叶子猪游戏资讯中心:http://news.yzz.cn/) [编辑:放学别走]
|
本文由叶子猪游戏资讯中心首发,仅代表发表厂商及作者观点,不代表叶子猪本身观点!