盘点准时播|想不到!智能运维的正确姿势:从临场救火到淡然饮茶( 三 )


谈及前景 , 我们留意到 , 一直在IT圈以“权威”著称的Gartner的报告也曾作出预测:智能运维于2020年将在一半以上的企业中落地并贡献生产力 。
作为传统运维与新兴AI技术的高度结合 , 且一度被誉为“朝阳产业”的智能运维 , 看起来前景一片大好 , 不错;但在技术成熟度上还有很大的提升空间 , 亟待被重视 。
尤其是近年来得到云原生微服务架构的技术洗礼 , 不知不觉也产生了诸多新变化!
或许小伙伴们多少有些了解 , 过去大家考虑的是如何达成或者提升自动化运维水平 , 快速部署上线才是王道 。
如今更多精力则集中在保证规模与满足微服务架构的运维监控方案的高可用性 , 简单点儿说就是可观察性 。
毕竟在全面云化的条件下 , 因为体量规模增大 , 业务细分的颗粒度也随之提升 , 过程中难免会涉及到上百个接口的调用 , 这就意味着仅仅依靠单纯的性能监控指标远远不够 。
而可观察性就是为了达成包括指标日志、调用链、变更数据等不同角度运维数据在内的统一 , 从各种维度观察服务运行的状态是否良好 。
本质上可以算是传统监控概念的智慧升级 , 简单说就是用智能运维的方式解决微服务架构的基础运维问题 。
正如饶琛琳所言 , 其实对于运维数据来说 , 架构创新只会带来写入介质的更改 , 比方说从本地磁盘过渡到对象存储 。
这一点不像网络抓包 , 自身依赖的环境发生改变 , 整体的基础设施也就随之变化了 。
据了解 , 日志易做的是“造福”业务运维团队的事儿 , 不同于传统数据中心基础运维 , 对于云原生微服务等一揽子创新架构上的应用支撑 , 其实早早就做好了打算 。
但他也表示 , 就算门槛不高、本质未改 , 但适当的技术调整依旧是需要的 。
毕竟新架构下的存储机制以及输出方式有了改变 , 迫切做好的是接入方式的合理适配与改造 , 以此确保动态调度的时候 , 不会影响数据采集的准确性 。
【盘点准时播|想不到!智能运维的正确姿势:从临场救火到淡然饮茶】过去在采集过程中 , 可能只需要一两个数据标签完成具体业务应用来源某台主机的区分 。
但在弹性的云原生、微服务以及容器环境下 , 需要配合pod确保映射管理以及数据采集完整等细节 , 尽可能降低底层架构改变带来性能的差异 。
目前除了像日志易一样的IT企业入局智能运维领域外 , 突破运维的智能化也成为有关科研机构的攻坚热点 。
其中不仅出炉了有较为先进的科技成果 , 从算法层面上支撑发展落地;更重要的是已经与工业界展开了密切合作 , 例如卡内基梅隆大学与Netflix公司联手 。
另外类似于以专业大数据搜索与可视化见长的Splunk , 也将智能运维管理平台的研发视为帮助用户实时了解IT架构现状的利器之一 , 通过将机器学习的数据加以转化形成有价值的运维建议广泛传播 , 同理还有科技巨头IBM以及华为等 。
当然 , 在高利润、高技术含量的驱动下 , 互联网巨头与金融行业也争相参与其中 , 比方说阿里巴巴针对智能故障管理平台的研发以及各类银行对于运维大数据平台的建设等 。
尽管多方入局 , 但与之关联的企业级智能运维建设 , 除了具备全栈式运维数据的刚性条件外 , 更重要的是寻找颇具痛点的场景来入局尝试 , 避免直接使用标准的算法通过黑盒方式解决问题 , 目前来看异常检测绝对是首当其冲的应用场景 。
这样来看 , 无论企业从运维数据中台建设还是从规模较小的场景化切入 , 运维数据的治理能力与质量提升以及机器学习技术的合理应用 , 都是加快智能运维发展的一系列必备因素 。
谈及智能运维的将来 , 饶琛琳认为AIOps早已声势浩大 , 让运维更加智慧便捷 , 没什么不可能……
—完—
量子位QbitAI·头条号签约
关注我们 , 第一时间获知前沿科技动态