专家观点|擎创科技杨辰:企业数字化转型与“智能”运维( 四 )

----专家观点|擎创科技杨辰:企业数字化转型与“智能”运维//----

  自动化的基础是既有运维事务的标准化 , 即按照一种标准程序批量执行作业 , 相当于图中的机械手 , 而智能运维是一种判断决策能力 , 它是根据对情况判断决策用哪种机械手来操作 , 即便没有机械手也并不意味着可以不做决策 , 二者并无依赖关系 。

  在运维智能化过程中可以不断发现新的规律性场景 , 因而可以持续做标准化和进一步的自动化处理 , 而在DevOps建设中也可以融入智能化的处理能力 , 比如对日志异常的实时分析诊断以及对于平台和容器指标的实时异常检测和根因分析 , 对于之后的迭代调参会十分方便 。

  根据著名心理学家丹尼尔康纳曼的著作《快思慢想》 , 人类其实具备一套伟大的运维管理机制 , 分为理性思考和直觉思考两个系统 , 而实际运行中 , 人类会不断通过理性思考过程 , 把能梳理成标准化的结果变成直觉系统可以直接运行的标准操作 , 一旦触发相关条件就立即执行相应的操作并可以不断优化 。 比如初学开车司机必须全身贯注 , 根据情况做出判断 , 而且反应很慢 , 但熟练的司机则可以随时迅速判断做出正确动作 。 实际上企业运维的成熟度目标与此十分相似 , 就是要不断将“慢想”的流程逐步转变为“快思” , 这就是智能运维和自动化运维的关系 。

  困惑五:智能运维=日志大数据分析?


专家观点|擎创科技杨辰:企业数字化转型与“智能”运维

----专家观点|擎创科技杨辰:企业数字化转型与“智能”运维//----

  日志是运维数据中很重要的一类 , 数量占比很大 , 是智能运维中应该分析处理的重要数据源之一 , 但是日志大数据分析并不等同于智能运维 。 传统日志的处理偏向事后分析 , 智能运维对日志的处理增加了事中监控乃至事前预判能力 , 这是日志分析所不具备的能力 。

  传统运维考虑的日志分析工具 , 都是偏向于事后分析 , 即事先必须了解日志结构 , 再进行相应操作把价值信息提炼出来 。 而智能运维则是提升了它这种能力 , 它能够通过算法识别日志的语义结构 , 优化日志结构化的方式 , 提升事后分析的能力 , 更重要的是还能在日志产生的过程中对其进行指标化的监控 , 并且在事前发现出现异常模式的日志 , 从而进行故障预判 , 这对于日志分析来说是一个质的飞跃 。

  智能运维考虑的是不同类别数据如指标、告警和日志等数据的相关关系和联动关系 , 并不仅仅考虑像日志这一种单独门类的数据 , 日志分析仅是智能运维所具备能力的一种而已 。 比如在具体运维过程中 , 往往需要综合利用告警、指标和日志间的相关关系来寻找问题根源 , 这就需要打通日志与其它数据的关系 。

专家观点|擎创科技杨辰:企业数字化转型与“智能”运维。  三、如何开启智能运维之旅的三点建议

  综上所述 , 结合自身运维成熟度和具体运维挑战有序开启智能运维能力建设才是硬道理 , 在起航前 , 有三个建议可以分享:

  首先 , 起步得稳 。 充分评估当前运维手段的实际情况和具体痛点 , 找到较快就能和既有运维手段相融的方案 , 一定要考虑数据平台建设的必须能力和开放性 , 不要引入多个数据孤岛 。