若水清菡
2024-08-28
来自北京
如果有一天你发现业务的流量突然下降了,这个时候你的定位思路和步骤是什么?怎么做才能够以最快的速度定位到原因? 1.查看接入层的统计,对比其他业务流量变化趋势,如果发现只有这个业务流量明显下降了,可以确定是这个业务的问题,和接入层无关;用第三方拨测平台在全网对业务接口进行一下测试,排查一下网络运营商侧情况。 2.查看业务层的服务指标统计,对比现在和昨天同时间段的吞吐、响应时间等。排查是不是业务代码这边出的问题,同时回溯最近两天的服务代码、配置文件和基础组件的变更历史。 3.如果上面排查都没问题,和产品和运营同学确认业务是否有季节性周期属性,例如受学生寒暑假影响就会流量低;确认app是否进行过发版,排查app端的打点日志,排查是否因为app发的新版引起的故障。 4.所有的都做完了也没任何发现,翻看一下故障历史记录,可能能找到灵感。