Prometheus 全链路监控实战: Nginx QPS、ComfyUI 存活、GPU 指标,到 Docker-VPN 网段踩坑记录

一篇给团队新人看的「一把梭」笔记:
• 打开 Nginx 详细指标(QPS / P99 / 5xx)
• 用 Blackbox 监控 ComfyUI 是否挂掉
• GPU 机器指标怎么进 Prometheus
• Docker-Compose + VPN 网段冲突到底怎么解决
• 最后把冗长的 Prometheus YAML 缩成 1/2

能抄就抄,能跑就行

阅读更多