最近一次线上故障的根源,是一个核心服务强依赖的第三方地理位置API。在高并发时段,该API的响应时间从50ms飙升到5s,并伴随大量超时。我们的服务作为调用方,PHP-FPM进程池迅速被打满,CPU飙升,最终导致整个用户认证链路雪崩。复盘时
2023-10-27