目前使用zabbix监控平台,对监控故障收敛是否有比较好的解决办法。
这个确实非常有挑战,实现不难,但是要想得到非常好的预期效果,需要经过长时间的优化迭代。这里简要讲一下实现思路:1、将接收到的告警推入缓存或DB;2、定时从缓存或DB中拉取数据,告警的收敛核心就是去重、分组、根因分析,这里面就要按照定义的规则对数据进行预处理,最起码要实现去重和分组,实现告警信息数量的抑制;3、按照告警规则推送告警信息。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30