作者回复: 1,Prometheus生态的Webhook一般放在alertmanager里 2,我经历的公司,遇到故障的时候,大家首先想到的是如何快速止损,而非指责,如果一上来就想着指责的,要么是管理问题,要么是人员本身的职场素养太差了 3,我们是ToB公司,提供商业化监控和故障定位的解决方案,我们有交付人员负责落地产品,和ToC的公司是不同的。是否需要运维人员,不能简单的根据注册用户数量来,通常来讲,研发搞不定下载的稳定性、成本问题的时候,研发团队很大、服务模块很多的时候,通常才需要运维,当然我这也只是举例,实际考量的因素很多 4,没有计划 4,