常见运维监控系统的技术选型( 三 )


自动识别、自主采集
云原生技术浪潮带来了混合的技术栈和高动态的服务端架构 , 我们应该重视采集器的自主能力 , 在面向复杂多变的被监控环境时 , 采集器尽可能做到对环境的自动识别 , 对指标的自主采集 。
重视高维度数据管理能力
云、容器和微服务的出现使被监控对象的数量增加了两到三个数量级 , 所以高维度的数据管理能力尤其重要 , 我们的时间序列管理技术架构应该为10亿级别时序数据个数作好充足准备 。
数据科学和机器学习的引入
我们的架构应该支持数据科学技术和机器学习技术的引入 , AIOps技术还在快速发展之中 , 很多算法和数据方法还在不断变化 , 应该为这类变化保留足够的灵活性 。
强调数据可视化
随着监控数据的数据量呈几何级数式增长 , 传统的数据展示方法很难表达大规模数据的准确涵义 , 我们应该在线图、直方图、散点图等朴素的展示方式之外积累更多适合运维大数据的数据可视化手法 。
立足运维视角 , 体现业务价值【常见运维监控系统的技术选型】运维环境承载业务运行 , 运维视角的数据必然具有业务涵义 , 比如服务请求数对应业务订单数、服务响应时间对应业务用户体验、资源利用率对应业务成本模型 , 我们应该基于监控系统的数据能力 , 深挖监控数据的业务涵义 , 对外输出监控系统的业务价值 。