前端设计除了做网站还能做什么,电商erp系统,建设工程管理有限公司,淘客助手 wordpress概述 在企业日常运维中#xff0c;我们有着大量的服务器设备#xff0c;设备故障一般可以通过常用的监控软件实现自动告警#xff0c;但如果在管理运维中我们要做的不仅仅是发现故障#xff0c;处理硬件故障#xff0c;我们还需要进一步的了解#xff0c;今年一共出现了多…概述 在企业日常运维中我们有着大量的服务器设备设备故障一般可以通过常用的监控软件实现自动告警但如果在管理运维中我们要做的不仅仅是发现故障处理硬件故障我们还需要进一步的了解今年一共出现了多少次硬件故障其中内存故障多少次硬盘故障多少次主板、CPU故障多少次到底哪台服务器故障最多这些事件可以给我们是否更换设备减少故障提供依据。 我们选用鸿鹄对服务器的日志进行收集它可以快速搜索也能够定制图表完美的解决掉这些痛点。 监控目标 收集基础架构中服务器设备的日志
监控服务器设备的登录安全
监控服务器设备的配置安全
统计服务器设备的故障情况 安装vector Vector作为数据采集器可以接收设备的syslog日志并转发鸿鹄平台。Vector配置方法参考下文 安装Vector 查看安装后vector版本确认安装成功 vector安装好后直接执行vector 时系统首先会去/usr/bin下寻找命令如果不在这个目录中就会找不到了。这个时候我们就需要为这些找不到的命令建立一个链接文件链接到/usr/bin下 具体代码请加入鸿鹄技术交流群详见鸿鹄知识库 登录鸿鹄平台数据管理新建数据集 编辑数据源名称选择数据集范围为上面创建的“switch”此时会启用 创建syslog.toml脚本需要调整字段 address 0.0.0.0:5140.0.0.0表示接收所有主机发送过来的syslog514表示接收的端口syslog默认为514
._target_table switch : 表示上文你创建的数据集名称
mode udp表示接收syslog的协议syslog默认为udp
address 172.20.6.111:9092鸿鹄的IP和相应的端口 运行修改的syslog脚本注意保持运行状态。 具体代码请加入鸿鹄技术交流群详见鸿鹄知识库 登录交换机触发syslog注登录交换机输入命令都会自动触发syslog。登录鸿鹄平台查看数据是否导入到switch数据集。如下图事件计数已经显示数据导入成功 查询下通过vector导入到switch数据集的数据 配置服务器syslog 配置系统日志服务器填写日志系统的IP端口号默认 开启警报 设置发送到日志平台的警报类型 鸿鹄查看是否收到日志 字段抽取 抽取字段的目的比如在生成图表时我要调用severity发现鸿鹄并没有提取这个字段那么我就没法调用这个字段生成图表。 IDRAC由于有自己特定的日志格式鸿鹄并不会抽取所有字段因此要针对IDRAC日志格式进行数据抽取。字段抽取的逻辑是先通过sql语句创建视图视图生成后我们就可以直接调用视图里的字段它实际日志仍旧存放在原数据集。 我们先分析下IDRAC的日志格式。我们实际的日志格式分析需要抽取的字段 idrac_syslog这里是需要新建的视图名称 switch._time 脚本中由第六行开始switch均指的需要抽取数据的原数据集这里需要根据你的数据集名称替换 where contains( switch._message, iDRAC) iDRAC指的是你要搜索到这个写日志特定的字段通过IDRAC可以限定日志里所有包含IDRAC的日志 正则表达式如何写以及测试 访问https://regex101.com/在REGULAR EXPRESSION里填写正则表达式或直接在这里写 在TESTING STRING里输入日志可以直接从鸿鹄上拷贝相关的日志 正则表达式如果是正确的会生成对应的颜色以及右下角会Match information里会显示抽取的字段名和字段内容 在高阶查询中运行成功 我们运行下搜索语句测试下同时在红色部分可以看到我们抽取出来的字段 图表展示 在图表创建部分我这边每个类型的图表只会举一个例子但会把所有的搜索语言列出来供大家参考。 仪表板新建仪表板 创建完成 日志告警等级统计 新建图表日志告警等级统计 选择图表类型饼图 查询语句这个语句可以先在查询里验证确认查找的结果是想要的 时间范围选择30天可以根据自己的情况调整 生成图表后可以查看到近30天内各种类型的告警情况。 目的比如没有error没有告警我们就可以很轻易的判断设备运行良好。也可以很容易的判断目前各个类型告警占比。 服务器数量 新建图表服务器数量 选择图表类型单值趋势图 查询语句这个语句可以先在查询里验证确认查找的结果是想要的 时间范围选择30天可以根据自己的情况调整 生成图表后可以统计所有有日志的发送到鸿鹄的服务器数量。 目的用于确认当前监控的服务器总计数量便于检查错漏主要为了图表布局的好看。 配置变更明细 新建图标配置更变明细 选择图表类型表格由于我这里需要展示明细所以选择表格的方式 查询语句这个语句可以先在查询里验证确认查找的结果是想要的 时间范围选择30天可以根据自己的情况调整 生成图表后可以查看到具体哪个时间哪个用户哪个设备做了哪些操作 目的比如在非维护时间段或者非工作时间段变更设备配置通过查询看看哪些人在这个时间段登录设备进行了哪些配置从而判断这些行为是否正常是否合规。 配置变更图表 新建图标配置更变图表 选择图表类型柱状图 查询语句这个语句可以先在查询里验证确认查找的结果是想要的 时间范围选择30天可以根据自己的情况调整 生成图表后可以查看到最近一个月哪些服务器变更了多少次配置 目的比如最近并没有故障或维护服务器配置出现变更就是异常事件通过配置更变明细可以判断这些行为是否正常是否合规。 配置变更趋势图表 新建图标配置变更趋势图表 选择图表类型线状图 查询语句这个语句可以先在查询里验证确认查找的结果是想要的 时间范围选择30天可以根据自己的情况调整 生成图表后可以查看到最近一个月服务器变更了的趋势是怎么样的 目的比如最近并没有故障或维护服务器配置出现变更就是异常事件通过配置更变明细可以判断这些行为是否正常是否合规。 搜索语句 以下列出所有本文中的搜索语句供参考 小提示搜索语句命令部分会调用抽取的字符段如果未抽取字符段会出现报错 效果图 图表创建完成后我们选择“网格布局”对图表布局进行优化调整最终效果图如下