微服务高可用难实现?是时候学学微服务治理了

原创
新闻 服务器
一直以来,微服务都因其易扩展、易部署、易演进、开放性强等优势被业界广泛使用,但微服务化的架构给系统带来优势的同时,也带来了一些服务治理上的困难。

【51CTO.com原创稿件】一直以来,微服务都因其易扩展、易部署、易演进、开放性强等优势被业界广泛使用,但微服务化的架构给系统带来优势的同时,也带来了一些服务治理上的困难。

尤其在近几年,随着系统规模的不断扩大和云原生技术的广泛应用,服务化的要求使系统的复杂性进一步提升,很多原有的服务治理技术和思路变得不再有效,这对大规模服务的治理提出了更大的挑战。那么在这种情况下,我们是否可以从技术创新的角度出发,尝试利用一些新技术去解决服务治理中的诸多痛点,实现服务的精细化治理。

为帮助开发人员及企业认识并解决在大规模服务治理中可能出现的系统韧性、可观测性、失败容忍性、服务注册发现及系统资源成本控制、性能优化等方面问题。我们在本届WOT全球技术创新大会“大规模服务治理”专题中,邀请到了来自百度、字节跳动、快手等一线大厂的资深技术专家,结合自身实践经验,为大家分享大规模服务治理过程中所遇到的挑战和解决之道,希望能够给大家带来一些新的启发,帮助大家找到建立完善微服务治理体系的方法。


演讲内容一


演讲主题:混沌工程在百度搜索的探索、应用和思考


演讲嘉宾:徐志明 百度搜索稳定性团队高级研发工程师


内容简介:

混沌工程提倡在生产系统上进行实验,以建立抵御故障的能力和信心。近年来,混沌工程取得了快速的发展,但在工程的具体实施方面,业界尚无标准方案,各公司在混沌工程的落地上有着自己不同的方法。百度搜索,作为国内领先的高可用系统,在混沌工程方向上也较早的进行了探索和实践。在此过程中,我们遇到并克服了诸多挑战,积累了一些经验和思考,也掌握了一些创新技术,本次分享将为大家进行上述内容的逐一介绍。

演讲提纲:

一、混沌工程简介:混沌工程的提出背景、发展历程及原则

二、百度搜索引入混沌工程的背景:


  • 百度搜索系统介绍
  • 引入混沌工程的必要性

三、百度搜索落地混沌工程的思路:


  • 故障场景的分级分类
  • 服务的韧性打分
  • 搜索的弱依赖标准
  • 故障容错能力刻画和例行巡检

四、落地方案和效果:


  • 技术层面:平台能力持续建设、搜索系统适配升级、复杂故障场景能力建设
  • 文化层面:通过能力验收、活动保障、项目支持、gameday等方式推广混沌工程文化
  • 混沌工程对百度搜索系统带来的效益

五、演讲总结与未来展望


演讲内容二


演讲主题:微服务节点分片访问技术


演讲嘉宾:马子昂 字节跳动资深架构师


内容简介:

微服务的无状态和可任意伸缩的特点为微服务体系带来了很大的灵活性。在微服务的服务发现过程中,请求方会默认获得全量的节点,复杂均衡策略同样会使用全量节点,这使得在节点数量过多时,会产生一系列问题。但有时,在保证稳定性的前提下,服务其实并不需要访问所有的节点。因此,我们在此基础上,提出了分片优化、就近优先访问等技术,并在生产上成功落地并获得了收益。本次分享我将为大家带来这些技术的实践经验。

演讲提纲:一、全实例负载均衡问题:


  • 负载均衡器的消耗
  • 订阅的信息传输压力
  • 长连失效

二、分片探索踩下的坑三、按需访问的实践四、实际稳定性与收益五、未来展望

演讲内容三


演讲主题:快手万亿级监控体系建设与场景化落地


演讲嘉宾:陈帅 快手业务监控负责人


内容简介:

快手监控体系已由每天千亿记录成长到万亿级别。在此过程中,我们遇到了诸多挑战,迫使我们在体系布局、用户体验、性能优化、成本控制、价值输出等方面不断做出改变。本次分享将向大家介绍快手监控体系建设与落地过程中面临的技术挑战和相应的解决方案。

演讲提纲:

一、监控体系布局—介绍快手基础监控、服务监控、业务监控、日志监控、Trace从采集到存储、绘图、报警的架构模型:


  • 传输与存储采用 kafka+clickhouse 方案
  • 绘图采用 Grafana 引擎
  • 报警采用基于 Grafana 报警引擎开发的异构数据源通用引擎+报警网关

二、挑战逐步突显—介绍基础监控、业务监控在流量快速增长过程中面临的集群压力、性能压力、场景多样、存储成本等问题,以及我们的实践方案:


  • 通过租户拆分、冷热分离、数据降维、查询采集、后端缓存回事、前端懒加载等方案提升查询性能
  • 通过数据降维和 Clickhouse 表结构优化降低存储成本
  • 采用 clickhouse 解决基础指标体系指标聚合和多维查询

三、生产变更故障止损 - 监控阻断:


  • 监控阻断的背景和目标:生产环境xx%的故障因变更触发引起,目标是以变更为切入点,拦截生产故障,及时止损
  • 架构设计:将诊断方、变更方分层,形成一个可扩展的标准框架,允许多方接入,提升覆盖率
  • 业务收益:拦截住多少问题上线单,评估可能拦截的故障隐患

四、全景视角定位问题 - 监控巡检:


  • 用户痛点:定位问题过程中最核心的痛点是不知道问题在哪儿
  • 监控巡检的背景和目标:帮忙用户自上而下、由大到小定位问题


☆ WOT全球技术创新大会2022 ☆

2022/4/9-4/10

WOT全球技术创新大会2022是51CTO中国技术社区为广大技术从业者精心打造的WOT2.0升级版。大会专题覆盖包括人工智能、数据安全、音视频、大数据、架构、开源、云原生、前端、研发管理、算法、金融科技、微服务等众多方向。

本届WOT大会预计1500人参会,100余家企业合作,60位专家分享。大会不仅邀请到腾讯、阿里、百度、58、大搜车等一线互联网大厂的技术专家,为大家进行独家技术干货的分享。还特别邀请到数位国内顶尖技术科学家,为大家详细解读国内重点技术创新战略及相关政策。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

责任编辑:KOL 来源: WOT2022
相关推荐

2017-09-13 13:42:09

微服务缓存架构

2021-12-29 08:30:48

微服务架构开发

2020-09-29 07:00:00

微服务API架构

2020-08-11 07:40:37

数组数据存储

2022-01-10 19:45:40

微服务GO系统

2023-05-04 07:27:20

NLP 算法微服务治理

2022-01-26 00:03:00

高可用gRPC微服务

2021-07-20 08:03:43

微服务应用程序

2022-04-20 07:48:09

微服务链路服务器

2019-10-31 09:03:12

Java集群微服务

2020-12-09 09:21:41

微服务架构数据

2020-07-29 08:30:48

微服务架构数据

2020-12-28 11:52:36

微服务数据中台去中心化

2019-09-18 09:05:58

技术SQLDevOps

2020-04-26 09:00:00

微服务架构软件开发

2022-06-12 23:36:26

微服务架构单体应用

2023-11-02 17:52:30

架构模式微服务服务治理

2017-09-25 12:11:14

高可用微服务架构

2019-09-25 09:50:29

高可用微服务系统

2021-03-05 18:05:56

JavaServerless 微服务
点赞
收藏

51CTO技术栈公众号