AIOps包括使用AI和ML技术以及大数据,数据集成和自动化技术,以帮助IT运营变得更加智能和可预测。
用于IT运营的人工智能(AIOps)涉及人工智能和机器学习技术以及大数据,数据集成和自动化技术的使用,以帮助IT运营变得更加智能和可预测。
人工智能操作通过机器驱动的决策来补充手动操作。
AIOps解决方案的类型在较高的层次上,AIOps解决方案分为两个区域:域中心和域不可知,这由Gartner定义。
以域为中心的解决方案将aiop应用于特定域,例如网络监视,日志监视,应用程序监视或日志收集。
您会经常看到监视供应商宣称AIOps,但它们主要是领域不可知的,从而将AI的功能带到了他们管理的域中。
独立于域的解决方案具有广泛的操作范围,可跨域工作,监视,日志记录,云计算,基础架构等。
它们从所有域/工具获取数据,并从这些数据中学习以更准确地建立模式和推论。
数据质量和完整性AIOps的成功取决于您提供给解决方案的数据的质量和完整性。
数据越完整,就可以从模型中学到更多并提供推论。
如果您在IT性能可见性方面存在差距,则首先建议使用现代的监视或可观察性解决方案来弥补这些差距。
数据丰富的AIOps解决方案还必须了解应用程序服务和资产之间的相互关系,以便在发生警报或事件时,该工具可以考虑这些关系,以更准确地推动相关性或根本原因的推断。
大多数实现依赖于手动或外部数据将这些数据提供给aiop。
随着时间的流逝,aoop的实现和维护变得越来越麻烦和昂贵。
一些现代的AIOps工具(例如CloudFabrix)非常擅长自行发现和构建其应用程序/服务上下文拓扑,并且还可以选择将这些工具用于种子上下文或与CMDB或IT资产管理系统(ITAM)集成。
自动定期数据提要。
十大常见AIOps用例某些AIOP可以解决的常见用例或问题领域包括:1.根据异常情况或与正常行为的偏离来识别问题。
2.预测度量标准的值,以防止停机或改善操作准备状态。
3.根据症状或文本描述对警报,事件或日志进行分组或群集。
4.根据拓扑或警报属性将相关警报分组。
5.基于多个传感器或遥测数据导出应用程序或服务器的运行状态。
6.确定相关的时间序列指标或症状,以便更快地推断出根本原因。
7.查找类似的事件并加快事件的解决速度。
8.命名实体识别,丰富事件内容,并加速事件处理。
9.根据事件属性预测事件分配组。
10.使用自然语言处理的事件分类也可以使用外部服务,例如OpenAI / GPT-3。
AIOps的目标和主要优势AIOps的最终目标是实现IT转型,智能化和预测性运营。
使用AIOps工具,IT部门可以获得统一的事件情报,减少IT数据中的噪声并消除工作量,减少IT凭单的数量,更快地解决IT问题,在客户受到影响之前预测/预防停机,以及自动进行根本原因分析,加速事件的发生。
或解决问题的方法,提高了IT生产效率,并降低了总拥有成本。
编辑:lyn< jw>