# Prometheus 实战
v0.1.0
在过去一年左右时间里,我们使用 Prometheus 完成了对几个机房的基础和业务监控,大大提高了我们服务质量,以及 oncall 水平,在此特别感谢 Promethues 这样优秀的开源软件。
当初选择 Prometheus 并不是偶然,因为:
* Prometheus 是按照 Google SRE 运维之道的理念构建的,具有实用性和前瞻性。
* Prometheus 社区非常活跃,基本稳定在 1个月1个版本的迭代速度;从去年 v1.01 开始接触使用以来,到目前发布的 v1.6.1 以及最新最新的 v2.0 ,你会发现 Prometheus 一直在进步,在优化。
* Go 语言开发,性能不错,安装部署简单,跨平台。
* 丰富的数据收集客户端,官方提供了各种常用 exporter。
* 丰富强大的查询能力。
Prometheus 作为监控后起之秀,虽然还有做的不够好的地方,但是不妨碍我们使用和喜爱它。根据我们长期的使用经验来看,它足已满足大多数场景需求。只不过对于新东西,往往需要花费更多力气才能发挥它的最大威力而已。
本书主要根据个人过去一年多的使用经验总结而成,内容主要包括 Prometheus 基本,进阶,实战,以及 DevOps 等方面,希望对大家有所帮助。
本开源书籍既适用于具备基础 Linux 知识的运维初学者,也希望可供理解原理和实现的高级用户参考。同时,书中给出的实践案例,可供在进行实际部署监控时借鉴。
你准备好了吗?接下来就让我们一起开始这段神奇旅行吧!
## 技术交流
欢迎加入 Prometheus 技术交流 QQ 群或微信组,分享 Prometheus 资源,交流 Prometheus 技术。
* QQ 群 I (可加):465362780 申请加入请备注:prometheus 实战
## 鼓励项目
欢迎鼓励项目一杯 coffee~
- 前言
- 修订记录
- 如何贡献
- Prometheus 简介
- Prometheus 是什么?
- 为什么选择 Prometheus?
- Prometheus 安装
- 二进制包安装
- Docker 安装
- 基础概念
- 数据模型
- Metric types
- 作业与实例
- PromQL
- PromQL 基本使用
- 与 SQL 对比
- 数据可视化
- Web Console
- Grafana
- Prometheus 配置
- 全局配置
- 告警配置
- 规则配置
- 数据拉取配置
- 远程可写存储
- 远程可读存储
- 服务发现
- 配置样例
- Exporter
- 文本格式
- Golang Sample Exporter
- Python Sample Exporter
- Node Exporter 安装使用
- Node Exporter 常用查询
- 其他 Exporter 介绍
- Pushgateway
- Pushgateway 是什么?
- 如何使用 Pushgateway?
- 数据存储
- Memory Store
- Local Store
- Remote Store
- Rule
- 如何配置
- Rule 触发逻辑
- Aleretmanager
- Aleretmanager 是什么?
- 如何实现告警分组和去噪
- 通过 Email 接收告警
- 通过 OneAlert 管理告警
- 通过 Webhooks 接收告警
- 其他告警接收方案
- 使用 Prometheus 实现主机运行状态监控的完整演示
- Target 配置
- Rule 配置
- Alertmanager 配置
- 演示功能
- Prometheus Tool
- Promu 介绍和使用
- Client SDK
- Prometheus 性能调优
- 通过 Metrics 查看 Prometheus 运行状态
- 通过日志分析 Prometheus 运行状态
- 通过调整启动参数优化性能
- Prometheus 与 JVM 监控
- JVM Exporter 安装
- JVM 数据查询
- Prometheus 与容器监控
- Docker 监控
- Rocket 监控
- Prometheus 与容器编排
- Kubernetes
- Docker Swarm
- Prometheus 与 DevOps
- 如何从 0 开发一个 exporter
- 使用 Webhooks 开发一个 alert receiver
- 产品化
- 高可用方案探讨
- 集群方案
- 主从方案
- v2.0 功能洞见
- 新功能
- 新存储架构
- 常见问题收录
- 如何热加载新配置?
- 为什么重启 Prometheus 过后,数据无法查询?
- 如何删除 Pushgateway 的数据?
- 为什么内存使用这么高?
- 为什么有数据丢失?
- Prometheus 如何通过认证后拉取数据?
