本文主要基于 QCon 全球软件开发大会和 ArchSummit 全球架构师峰会的演讲内容,盘点了这几年运维方向的技术发展变化。
InfoQ 网站 和 InfoQ 技术大会都专注于挖掘技术采用生命周期模型中的创新者、早期采用者以及早期大众相关的技术应用案例,致力于促进软件开发及相关领域知识与创新的传播。不同规模公司的技术在采用曲线上的确切位置可能会有所不同。
随着 AIOps 智能运维、混沌工程(Chaos Engineering)、微服务与容器运维等新技术和方向的兴起,给传统运维带来了翻天覆地的变化。AIOps 逐渐成为运维领域的热词之一,将机器学习算法应用于运维数据分析,让运维操作变得更智能。
业务复杂度越来越高,为了快速适应业务发展、提高系统部署,越来越多的公司开始进行基于容器的架构升级,用以提升运维的效率。以 Kubernetes 为主的容器编排系统中,都已内置监控、事件信息接口,通过社区提供的组件轻松获取、展示这些数据。除了监控指标(Metrics)信息外,容器化的日志(Logging)、分布式链路追踪(Tracing)等也逐渐普及。
当微服务逐渐普及,服务器集群数量上升至成千上万台后, 硬件的故障是大概率事件,路由交换等网络设备也需要定时重启维护。怎么能够保证当故障或者紧急重启发生的时候,主要服务不受影响呢?混沌工程(Chaos Engineering)这类强大的实践,正在改变着一系列超大规模运营体系的设计与工程技术实现思路,专长于解决分布式系统内的系统性不确定因素,让不可控事件变得不那么可怕。
随着云成为应用的第一运行平台,“云原生”的概念开始崭露头角,不可变基础设施(Immutable Infrastructure)概念开始为人们广泛接受,服务网格(Service Mesh)得到了快速地发展,它承载了集群内外的数据交互,随着 Istio、Conduit、Consul、Envoy、Linkerd 等逐渐在容器场景落地,构成了云原生时代的基础设施,未来各类可观察性数据可以无缝打通,可观察性的实施会变得更加简单,可以便捷地掌握集群的链路状态。