中文(UMon 云监控)
UMon 提供云资源监控与告警服务,用于对云主机、网络、数据库等关键指标进行可视化监控与异常告警,帮助你第一时间发现故障与性能问题。
常见监控指标
- 主机:CPU/内存/磁盘使用率、网络流量、连接数
- 应用:QPS、响应时间、错误率(可通过自定义上报/日志分析实现)
- 数据库:连接数、慢查询、IOPS(视产品支持)
举例:为 Web 服务设置告警
- CPU 使用率连续 5 分钟 > 80% → 告警
- 带宽突增或连接数异常 → 告警
- 错误率 > 1%(可由日志/指标上报)→ 告警
- 告警通知联动:USNS/邮件/短信(以实际支持为准)
排障建议(思路)
- 先看资源:CPU/内存是否满、磁盘是否打满、网络是否拥塞
- 再看应用:是否有错误率飙升、依赖服务超时
- 最后看变更:最近是否发布、扩缩容、规则调整
English (UMon)
UMon provides monitoring and alerting for cloud resources, helping you visualize key metrics and detect anomalies early.
Common metrics
- VM: CPU/memory/disk usage, network traffic, connections
- App: QPS, latency, error rate (via custom metrics/log analytics)
- DB: connections, slow queries, IOPS (depending on support)
Example: Alerts for a web service
- CPU > 80% for 5 minutes
- Traffic spike or abnormal connection count
- Error rate > 1%
- Notify via email/SMS/USNS (depending on integrations)
Troubleshooting approach
- Check resources first, then application errors, then recent changes