MOCK 原型告警与通知 · 桌面优先← 控制台屏总览 · 调研文档中心
告警与通知

告警与通知

服务异常时如何、向谁通知

通知渠道

📧 邮件

zhao@acme.com · 已验证

💬 Slack

推送到团队频道

🪝 Webhook

POST 事件 JSON 到你的端点

📱 SMS / 电话 Pro🔒 升级

关键服务短信/电话告警

🎮 Discord

推送到 Discord 频道

告警规则

规则触发条件通知启用
生产服务中断连续 2 次失败邮件 + Slack编辑
延迟升高P95 延迟 > 2s 持续 5 分钟Slack编辑
依赖宕机任一订阅依赖变为异常邮件编辑

最近通知

时间(UTC)事件渠道送达
14:23api.acme.com 服务中断邮件已送达
14:23api.acme.com 服务中断Slack已送达
09:27db.acme.com 已恢复邮件已送达
昨天 23:41OpenAI API(依赖)降级Slack失败(频道未连接)
告警可靠性是监控产品的生命线:dudown 对通知做去重、重试(at-least-once)、防抖动误报,且自身多区域高可用(见调研 19 章)。