新技术和业务量爆发,运维应该如何破局,是运维团队和个人都应该思考和落地的问题。本... 展开 >
洪楷,“运维管理”专场出品人,目前主要负责腾讯自研游戏的技术运营管理工作。
腾讯游戏服务“云梯”的服务体系设计和建设第一负责人,腾讯游戏手机终端技术优化”TGPA”团队第一负责人,专注于海量用户的技术优化以及自动化技术,致力于提升业务运维的自动化,并结合智能运维建设腾讯游戏故障定位引擎“八爪鱼”,同时建设运维岗位价值体系,通过运维服务整体提升团队核心价值和技术能力,拥有十三年的运维技术实践和团队管理经验,跟随腾讯大平台运维成长,深知运维之痛,同时更了解如何从日常运维中,挖掘业务运维核心价值。
洪楷,“运维管理”专场出品人,目前主要负责腾讯自研游戏的技术运营管理工作。
腾讯游戏服务“云梯”的服务体系设计和建设第一负责人,腾讯游戏手机终端技术优化”TGPA”团队第一负责人,专注于海量用户的技术优化以及自动化技术,致力于提升业务运维的自动化,并结合智能运维建设腾讯游戏故障定位引擎“八爪鱼”,同时建设运维岗位价值体系,通过运维服务整体提升团队核心价值和技术能力,拥有十三年的运维技术实践和团队管理经验,跟随腾讯大平台运维成长,深知运维之痛,同时更了解如何从日常运维中,挖掘业务运维核心价值。
新技术和业务量爆发,运维应该如何破局,是运维团队和个人都应该思考和落地的问题。本专题将重点讨论智能时代下,AI算法中心、运维数据中心和现有系统如何进一步和智能结合,人才知识结构和团队结构如何升级以及运维如何助力产品运营。
随着企业应用规模及复杂度不断增大的同时,虚拟化、容器化和云计算等新技术不断发展并在企业落地。与此同时,创新算法、大数据、AI正快速应用到IT领域,成为企业面对IT新挑战的重要手段。IT数据复杂化、海量化的大背景下,演讲嘉宾结合在腾讯、百度的经历,通过端到端全链路监测、分析、决策及可视化为大家分享智能运维大数据决策与可视化实践。
此次演讲将分享我们面向阿里巴巴资源管理和调度方面所开发的基于数据驱动的算法。我们将讨论如何通过机器学习和最优化算法的结合加强资源管理和调度的智能决策,实现在保证稳定性的前提下压缩成本,以及在多个场景如分配率提升,碎片整理,打散容灾的具体实践。同时也会分享阿里巴巴在应用干扰检测方面的探索,及结合动态的重调度去降低干扰。
听众收益:
这是一份非常权威且科学的调查报告,它是DORA主持开展的持续了5年的DevOps行业现状调查研究。今年的报告长达80页,不仅包含了DevOps实践的定量数据,而且还定性的分析了各种DevOps能力之间的关联关系。为DevOps的实践者描绘了完整的能力成长参考模型。
主要内容:
听众收益:
腾讯游戏业务数量众多,玩法多样,虽然有着严格的研发测试流程,也难以避免会有bug或其他问题暴露在线上环境。我们通过智能化大数据监控平台的建设,采用分层接入的方案,实现了全业务的低成本实时监控接入。我们通过多维度数据建模筛选出可疑数据,再利用重度的分析模型和工具,结合日常的运营专家知识库,得以有效发现游戏经济系统运行中的异常。
听众收益: