Open-Falcon 告警 如何实现自定义多功能告警

早早发表于:2020年01月02日 10:54:02更新于:2020年04月05日 15:52:39

Open-Falcon 是小米运维部开源的一款互联网企业级监控系统解决方案。其中有着如下的特点:


①强大灵活的数据采集:自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持、opentsdb data model like(timestamp、endpoint、metric、key-value tags)

②水平扩展能力:支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询

③高效率的告警策略管理:高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用

④高效率的graph组件:单机支撑200万metric的上报、归档、存储(周期为1分钟)

⑤高效的历史数据query组件:采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据

⑥dashboard:多维度的数据展示,用户自定义Screen

⑦高可用:整个系统无核心单点,易运维,易部署,可水平扩展

⑧开发语言: 整个系统的后端,全部golang编写,portal和dashboard使用python编写。

但是在open-Falcon中,单一的告警模式又无法满足多样化的告警需求,尤其是当告警风暴来临时,单一的告警模式不仅会致使我们焦头烂额,还会导致我们无法快速判断告警的问题所在。于是如何将告警通过用户的多样化需求达到多种化通知方式,并且有效的避免告警风暴,就成了目前的首要解决问题。


智能告警平台 Cloud Alert 睿象云自研的一款告警管理平台,就能够完美解决这个问题!用户可以将告警通过不同的需求,指定多种化通知方式,目前支持的通知方式有电话、短信、微信、邮件、APP、钉钉等;并且当告警风暴来临时,用户可以通过勾选算法智能降噪或设置告警压缩规则,使得相同类型的告警进行压缩,有效的避免告警风暴。用户也可以将不同的监控平台接入到Cloud Alert内进行统一化管理。


接下来就说下是如何设置的吧~


主要分为三大部分,首先是将Open-Falcon集成到此平台当中;其次设置分派策略,也就是指定条件(用户自定义)下的告警发生时通知的人;最后是设置通知策略,根据用户自身需求设置多元化的通知方式。


首先肯定是进入官网www.aiops.com,登录账号。

0015e0d564f7329d2491ac1bd4e5a80

一.Open-Falcon集成

1. 在Cloud Alert中创建open-Falcon应用,点击集成 — 监控工具 — open-Falcon

0015e0d564f5366c22d977a59c74f5a

2. 填写“应用名称”,点击“保存并获取应用key”

0015e0d564f58829d2cc2896e99bba3

3. 在open-Falcon中配置Cloud Alert的回调地址

(1) 登录open-Falcon,选择template模块,点击你想要绑定Cloud Alert告警平台的template name。 

0015e0d564f58699a9d0a6e69189053

(2) 在回调地址中填写类似如下URL:

http://api.aiops.com/alert/api/event/falcon/--

-- 处填入您新建应用时生成的appkey

0015e0d564f7012a9bbaea34f7c54ca

二.设置分派策略

1. 点击配置 — 分派策略 — 新建分派

0015e0d564f77a53b0bf9a5a11b53cb

2. 输入分派策略名称 — 选择应用 — 设置分派人(告警发生时通知的人),点击保存

0015e0d564f753729b83c0c5bd0caf3

这一步骤用户可以根据【告警级别】【告警内容】等条件,来添加指定条件分派通知。

三.设置通知策略

1. 点击【配置】—【通知策略】-【新建通知】

0015e0d564f6e0a7637cb8fc7a6b2e2

2. 通知策略的可选择性也是很高的,用户可选择的地方有:告警状态、告警级别、通知方式、时间设置、延迟策略、通知人等,其中的意思分别如下:


  • 告警状态:选择告警通知的状态。分别有发生时、认领时、关闭时、全选,4种选择。

  • 告警级别:选择告警通知的级别。分别有提醒、警告、严重、所有,4种选择。

  • 通知方式:选择告警通知的方式。分别有电话、短信、Open-Falcon 邮件告警、微信、APP,5种选择。

  • 时间设置:选择告警通知的时间。分别有任何时间、工作时间、非工作时间,3种选择。

  • 延迟策略:选择告警通知是否延迟。

  • 通知人:选择告警通知的人。


例如:任何时间告警发生时严重级别的告警立刻微信通知所有人。

告警状态 — 发生时;告警级别 — 严重;通知方式 — 微信;时间设置 — 任何时间;延迟策略 — 立刻;通知人 — 全选


Open-Falcon与CA告警级别映射关系

0015e0d564f427ef5a143cf39dda92d

以上的设置,就完成了open-Falcon的告警多样化的通知方式,用户也可以根据自身的需求设置多个分派策略,这样可以更加详细化通知方式。