[自定义告警规则](%E8%87%AA%E5%AE%9A%E4%B9%89%E5%91%8A%E8%AD%A6%E8%A7%84%E5%88%99.md)
[示例-对主机进行监控告警](%E7%A4%BA%E4%BE%8B-%E5%AF%B9%E4%B8%BB%E6%9C%BA%E8%BF%9B%E8%A1%8C%E7%9B%91%E6%8E%A7%E5%91%8A%E8%AD%A6.md)
[部署AlertManager](%E9%83%A8%E7%BD%B2AlertManager.md)
[告警的路由与分组](%E5%91%8A%E8%AD%A6%E7%9A%84%E8%B7%AF%E7%94%B1%E4%B8%8E%E5%88%86%E7%BB%84.md)
[使用Receiver接收告警信息](%E4%BD%BF%E7%94%A8Receiver%E6%8E%A5%E6%94%B6%E5%91%8A%E8%AD%A6%E4%BF%A1%E6%81%AF.md)
[屏蔽告警通知](%E5%B1%8F%E8%94%BD%E5%91%8A%E8%AD%A6%E9%80%9A%E7%9F%A5.md)
[扩展阅读](%E6%89%A9%E5%B1%95%E9%98%85%E8%AF%BB.md)
- (一)快速开始
- 安装Prometheus
- 使用NodeExporter采集数据
- AlertManager进行告警
- Grafana数据可视化
- (二)探索PromQL
- 理解时间序列
- Metrics类型
- 初识PromQL
- PromQL操作符
- PromQL内置函数
- rate和irate
- 常见指标的PromQL
- 主机CPU使用率
- 主机内存使用率
- 主机磁盘使用率
- 主机磁盘IO
- 主机网络IO
- API的响应时间
- (三)Promtheus告警处理
- 自定义告警规则
- 示例-对主机进行监控告警
- 部署AlertManager
- 告警的路由与分组
- 使用Receiver接收告警信息
- 集成邮件系统
- 屏蔽告警通知
- 扩展阅读
- AlertManager的API
- Prometheus发送告警机制
- 实践:接收Prometheus的告警
- 实践:AlertManager
- (四)监控Kubernetes集群
- 部署Prometheus
- Kubernetes下的服务发现
- 监控Kubernetes集群
- 监控Kubelet的运行状态
- 监控Pod的资源(cadvisor)
- 监控K8s主机的资源
- KubeStateMetrics
- K8S及ETCD常见监控指标
- ETCD监控指标
- Kube-apiserver监控指标
- (五)其他
- Prometheus的relabel-config
- Target的Endpoint
- Prometheus的其他配置
- (六)BlackboxExporter
- 安装
- BlackboxExporter的应用场景
- 在Promtheus中使用BlackboxExporter
- 参考