电商的网站怎么做的好,广州工商注册流程,广东手机网站建设,重庆网络公司流程1、BAIOPS-业务智能运维
智能运维#xff08;AIOps-Algorithmic IT Operations基于算法的IT运维#xff09;是人工智能技术在IT运维领域的运用#xff0c;引用Gartner 的报告的一段话“到2020年#xff0c;将近50%的企业将会在他们的业务和IT运维方面采用AIOps#xff0c…1、BAIOPS-业务智能运维
智能运维AIOps-Algorithmic IT Operations基于算法的IT运维是人工智能技术在IT运维领域的运用引用Gartner 的报告的一段话“到2020年将近50%的企业将会在他们的业务和IT运维方面采用AIOps远远高于今天的10%”最近2-3年智能运维的概念随处可见各大互联网公司、传统IT公司、金融业等都在谈他们的智能运维设想同时也有人谈AI色变觉得人工智能只是一个愿景要落地很难。其实AI已经不是一个新的概念了百度、微软、谷歌等公司早就在10几年前开始自己的人工智能布局了到现在均已成为人工智能行业的领跑者了。
话不多说人工智能那么强大应用场景十分的广泛当然也包括运维领域而且面向业务的运维更是运维发展的热点趋势下面我就和大家就“面向业务的智能运维体系建设的探索与实践”这个话题发表下我的个人见解。
2、传统运维-痛之又痛
传统的运维中存在着诸多痛点
1被动低效的运维难以保证业务连续性 运维人员往往扮演着事后“救火”的角色待事故发生后才去处理 数据分散在多处出了故障无法快速修复业务连续性难以有效保障 随着业务复杂性不断提高人工运维的成本呈指数级增长。
2缺乏统一的运维监控体系和技术工具 针对不同运维实体的烟囱式的运维工具功能重叠、难以整合 运维的自动化程度偏低运维脚本泛滥层次化、模块化程度不足 监控、运维、告警平台林立各成体系缺乏统一化体系。
3海量的运维数据的价值无法充分挖掘 传统运维系统收集了大量的运维数据但是却缺乏有效的手段加以分析和利用 运维数据的利用仅限于简单的可视化和浅度的分析上缺乏纵向数据的关联挖掘无法快速定位故障根因 固定式的阈值告警造成了大量的误判和漏判而且人工调整阈值的方式也比较费时费力。
4缺乏全方位端到端的运维监控手段 大部分的运维监控仅停留在针对主机、网络的层面忽略了业务层面的识别手段故障的发生无法从最直接的业务层面得以发现产生预警 性能管理大多停留在服务单应用性能的管理和分析上无法提供端到端的掌控。更不用说使用云产品了云数据库的稳定性保障机制可参考。
3、业务智能运维的切入点
针对上述这些传统运维中存在的痛点智能化的运维出现必定具有划时代的意义智能运维系统的设计可以从如下几方面进行展开思考
1面向业务维度实现异常检测
业务运维是运维的大趋势需从最复杂的业务维度入手根据业务维度的指标如PV、响应时间、错误率、GC等上的异动进行异常检测提前预警
2提供业务全局关系视图
业务应用维度的复杂性是运维过程中最高的往往是二线和三线运维之间界限最模糊的区域所以智能运维可以先解决的就是向用户提供全面、清晰的业务关系视图让运维人员对业务应用的掌控得心应手
3KPI可视化与下钻定位
KPI指标可以通过丰富的可视化手段展示给运维人员业务系统的故障可以清晰的体现在可视化终端同时支持详细的下钻手段直至定位到发生故障的环节甚至代码段
4采用动态阈值思想的异常检测
避免传统固定阈值告警的弊端引入机器学习算法来进行阈值动态化的异常检测效果
5重视故障的全流程管理
故障发生时可以提供一定的手段将业务层面的KPI异常与引起故障的原因联系起来支持手动下钻之余还可以自动定位和关联
6立体化监控体系的建设
覆盖从资源、平台层、应用监控和微服务调用链的立体化的运维分析能力。 注部分内容参考互联网如有侵权请留言便于笔者及时处置。