51CTO23期技术沙龙开讲啦,4位大咖揭秘如何基于大数据实现精准快速运维

原创
网络
51CTO第23期技术沙龙在雍和宫旁边的嘉诚印象成功举办,这期沙龙的主题是“基于大数据的精准快速运维”。

【51CTO.com原创稿件】9月15日,51CTO第23期技术沙龙在雍和宫旁边的嘉诚印象成功举办,这期沙龙的主题是“基于大数据的精准快速运维”。为了能够真正帮助运维和开发人员解决在运维开发过程中遇到的难题,51CTO邀请了四位重量级嘉宾到场,他们分别是东华软件股份公司方案中心总经理曹荣海、AWS解决方案架构师王世帅、京东金融资深架构师沈建林、饿了么资深运维工程师赵欢。四位大咖的演讲吸引了百余位开发者和运维人员到场,在提问环节众人争相提问,讲师们也倾囊相授,周六这个下午的互动学习时光就在交流中悄悄流逝。

技术沙龙

  小编及时整理了四位讲师演讲的精华内容,将其分享给更多的人,希望对大家在工作中解决难题开拓思路提供一些借鉴和参考。

  东华网智曹荣海:新时代的一体化运维管理

东华软件,曹荣海

  曹荣海首先分析了目前用户在信息化运维过程中存在的几大问题和挑战,例如IT架构日益复杂,如何先于用户发现问题?新技术驱动下,一体化运维如何突破传统IT架构瓶颈?一体化运维背景下,如何提升IT服务管理的效率和规范度?他表示,在新技术的驱动下,数据采集、处理、分析、展现存在着各种各样的难题,尤其是基础数据与管理工具分散,难以实现一体化运维。

  面对这些现实运维难题,曹荣海也以东华多年来的运维管理经验和视角,分析介绍了IT运维管理的黄金三角模型,从高效的组织目标管理、丰富的运营监控手段、规范的运维流程体系三多个视角分析了监管控一体化的运维管理体系建设的思路。

  最后,曹荣海向参会者介绍了东华一体化运维管理解决方案。东华首先确定要建立以应用为中心一体化运维管理思路,然后建章立制,规范一体化运维流程,夯实一体化运维基础主数据,实现资源配置共享,最后通过建立虚拟化基础上一体化云管理平台,建立一体化智能运维巡检手段。

  据曹荣海介绍,东华一体化运维平台现在已经可以为用户构造了IT综合监控,应用性能管理、运维流程管理、数据全周期管理、云管理平台和智能巡检的和谐一体化运维服务生态环境。“东华的愿景就是与客户一起打造和谐的一体化运维服务生态。”曹荣海总结道。

  AWS王世帅:如何在AWS平台应用智能运维

王世帅

  王世帅首先介绍了什么是AIOps、AIOps的由来、人工智能、机器学习、深度学习三者的关系以及应用的场景。然后介绍了在AWS平台上如何做数据的收集与自动化处理,通过应用托管服务和无服务器架构的服务减轻运维人员的日常低级而繁复工作。

  在王世帅看来,安全运维是运维的重要组成部分,他在现场介绍了AWS针对安全运维提供的两款服务——Amazon GuardDuty和Amazon Macie。据了解,Amazon GuardDuty 是一种威胁检测服务,可持续监控恶意或未经授权的行为,从而帮助保护用户的 AWS 账户和工作负载。该服务会监控表明账户可能被盗用的活动,如异常 API 调用或潜在未授权部署。GuardDuty 还会检测可能受损的实例或来自攻击者的侦测。

  Amazon Macie 是一种安全服务,可通过机器学习自动发现、分类和保护 AWS 中的敏感数据。Amazon Macie 可识别个人身份信息 (PII) 或知识产权等敏感数据,并为您提供控制面板和警报,使您可以看到这些数据是如何被访问或移动的。这一完全托管的服务可持续监控数据访问活动异常,并在检测到未经授权的访问或意外数据泄漏风险时发出警报。

  在演讲结束时,王世帅分享了AWS在AI/ML方面提供给用户的技术栈,用户可以通过端到端的机器学习平台Amazon Sagemaker快速轻松地构建、训练和部署任何规模的机器学习模型。

  京东金融沈建林:海量服务下的精准运维

沈建林

  沈建林首先从目前中大型企业面临的服务数量不断膨胀、线上环境日益复杂、服务依赖错综复杂等运维痛点出发,详细分析了运维人员的多重诉求,如服务的依赖自动梳理、拓扑自动生成、调用实时追踪、异常明细分析、调用来源追踪、实时容量规划、问题根因分析等基本的运维诉求。

  紧接着他还分享了在业务快速发展的环境中,如何通过抽象与建模,及时响应研发团队对各种各样的业务场景的快速监控与运维,着重介绍了分类监控、比值监控、流程监控等业务监控模型的设计思路与想法。

  最后沈建林剖析了运维及监控系统的设计原则、要点、难点以及自己在产品的迭代过程中碰到的“坑”,干货满满。

  饿了么赵欢:饿了么Zookeeper异地多活自动化运维实践

赵欢

  赵欢首先向参会听众介绍了Zookeeper的服务内涵、主要功能、运行机制。然后他介绍了饿了么异地多活的部署情况。为什么要做多活?赵欢解释道,一是为了解决物理机房的容灾,因为随着业务的增长,会达到一个临界点,一旦发生故障,那么损失远远大于技术投入,而且单机房容量有限,需要突破物理限制。二是为了做用户流量的导向。

  他详细介绍了饿了么多活整体结构。目前饿了么单IDCWatch数量超过亿级,多活节点数量也超过百万+,运维难度可想而知。“由于饿了么用户90%都是通过移动端访问,手机上会带来一个经纬度,上面有用户的地理位置。一旦用户下单,饿了么会通过sharding进行流量划分,保障快速分配确保用户体验。”赵欢表示。接着他还展示了Zookeeper在饿了么的四个应用场景,以及跨机房复制架构。

  每位讲师发言后,都有开发者踊跃提问,整场活动高效又活跃,结束后走出会场的人们带着收获离开,51CTO第23期沙龙圆满结束。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:周雪 来源: 51CTO
相关推荐

2013-01-24 10:20:28

桌面运维

2011-03-28 08:51:47

51CTO沙龙Windows运维

2011-05-10 11:23:13

Windows

2011-05-10 11:28:12

安全运维

2011-04-11 13:00:05

2011-09-06 14:59:32

开发技术周刊

2011-06-20 17:08:10

安全

2011-05-10 10:37:31

Linux

2011-03-14 10:34:35

51CTO技术沙龙LinuxLAMP

2011-04-25 12:42:05

2011-06-27 19:43:12

51CTO技术沙龙网络运维

2012-07-16 14:52:39

51CTO技术沙龙

2011-01-14 10:04:35

Linux运维趋势电子杂志

2012-06-13 16:05:27

.NET

2011-08-22 10:05:07

51CTO技术沙龙

2018-06-30 17:08:40

运维新挑战Tech Neo

2012-05-23 09:35:55

技术沙龙

2011-08-22 18:27:31

服务器

2011-10-25 15:49:57

VPN

2018-03-31 17:57:00

企业应用容器化Tech Neo沙龙
点赞
收藏

51CTO技术栈公众号