盘点准时播|想不到!智能运维的正确姿势:从临场救火到淡然饮茶( 二 )
其中日志数据概念尤其广泛 , 机器产生的文本数据与具体数值都算;但涉及到场景的细分 , 用于监控的指标数据才会被经常使用到 , 例如调用链数据等 。
以日志为代表的动态数据一般按不同的使用场景保存在差异性的大数据组件中 , 例如用于分析的数据会优先保存在Hive数据库 , 用于检索的日志数据可保存在ES(即Elasticsearch)中 , 当然业界也有进行ES改造或者替换的情况 , 例如日志易Beaver 。
Beaver作为一个由C++语言编写的高性能、分布式、时序数据库 , 对包含日志及指标在内的各类时间序列机器数据采取分词索引、列式存储等方式 , 实现实时全文检索、时间范围查询和统计分析功能 , 同时也支持时序数据特有的滑窗函数、关联查询等功能 。
聚焦具体的采集过程 , 以日志易为例 , 数据类型不太会影响具体的采集过程 , 只是会对采集之后是否用于异常检测或者根因定位的算法加以区别 , 数据能否在合适的位置产生恰当的作用才是重点 。
“我们的智能运维更多是定位与分析 , 利用日志数据指标去定位故障并进一步驱动相应的自动化运维工具来修复 , 这也是业务运维的重点 。 ”智能运维领域资深技术人 , 也是日志易产品总监的饶琛琳说道 。
文章图片
以运维排障解释 , 排障关注的并不是每个设备的情况 , 而是顶层业务运行的概况;简单来说得到一个总告警是无用的 , 更多是深入底层不同的模块系统加以判断 。
比方说将不同的平台日志拿来进行快速查询 , 但如果采取对查询结果的一一尝试所消耗的时间成本就很巨大;相反若将搜集数据聚集 , 通过性能强大的搜索引擎过滤 , 再进一步凭借AI算法完成结果分类的几种模式 , 如此一来上千万条日志就会被“萃取”成几十条结果 , 时间成本大大降低 。
如此说来 , 刚刚提及的“萃取”理念倒是与日志易Lynxee系统技术初衷如出一辙 。
有资料称 , Lynxee系统应用其实是基于日志易强悍的数据检索平台功能 , 再结合前期丰富的自动化运维经验“锻造”而成的智能运维系统 , 目前主要应用在各类金融行业的用户群体中 。
文章图片
在Lynxee中 , 由于多种智能算法被提供用来自动判断运维指标的监控效果 , 就无需手动设定监控阈值 , 其中的异常检测会自动给出监控项目的健康分数 , 帮助用户主动发现和排查平常难以发现的问题 。
但更多人认为 , 实践中的异常检测就像预测股票大盘走势一样 , 概念貌似不大 , 但实际难度却不小 。 面对这样的判定 , 日志易采用了“不断加定语”的方式来循序渐进降低应用的难度 。
所谓“加定语”其实是更好地运用专业的运维知识 , 不断缩小异常检测的场景应用范围 , 指标细致到是请求量的异常还是响应时间异常等 , 从而进一步明确预处理的工作内容 。
比如性能瓶颈被检测出来后 , 就可以对这部分进行代码优化或者定向扩容;如果预测出来是设备故障 , 就可以着手更新设备;而故障预测可以帮助进行动态流量切换或者硬件替换等 。
坦白说这种理念有点儿类似于“庖丁解牛” , 从起初的目中全牛且无从下手 , 到后来的目无全牛 , 根据经脉切中要害并游刃有余 , 不困扰在某个具体的技术细节上 。
“我们实操中的智能运维不单单是一个算法平台 , 而是基于成熟的运维知识构建的流程体系化 , 其中涉及服务设备概念、监控来源常识等 , 从发现故障到加持检测算法 , 然后定位故障全流程一栈式 , 用户并不需要过多挂心来源于算法本身的种种技术问题 。 ”
对于经验与未来 , 不可否认 , 智能运维依旧存在很多令人惊喜的可能性 。 例如在成熟日志处理的基础上 , 提升算法的交互融合程度以及更多实际应用场景的拆分等 , 都是亟待完善的地方 。
- 科技犬君|vs 索尼A9G 谁强?,上半年用户喜爱手机盘点;小米电视大师65英寸OLED
- 辣妹盘点酱|华为Mate30价格感人悲惨让路,4800万像素自拍+鸿蒙华为Mate40
- 辣妹盘点酱|Hz高刷+鸿蒙OS华为Mate40,华为Mate30白菜价直呼残暴,支持144
- 辣妹盘点酱|40曝光,华为Mate30跌至冰点价抢翻天,鸿蒙+新一代旗舰华为Mate
- 辣妹盘点酱|华为mate30即将悲惨让路价崩,国产手机最期待首发鸿蒙华为mate40
- 辣妹盘点酱|Pro或使用瀑布屏2.0,华为Mate30沦为弃机彻底感人价,华为Mate40
- 辣妹盘点酱|华为Mate30旗舰跌至白菜价,鸿蒙系统+集成5G的SoC华为Mate40
- 八五美食|工资不够花?每月月光族?盘点适合上班族的8大副业!钱景可观
- :“异形”上演?被吞下后又破膛而出,为了活下去你想不到多恐怖!
- 盘点准时播|2020京东入选论文深度解析,京东AI写作能力超过人类表现,AAAI