OTP 送达排障与升级手册
把验证码送达问题拆成库存、订单状态、取消窗口和升级材料四个步骤,减少无效重试。
# OTP 送达排障与升级手册\n\n当激活请求长时间停留在 pending,或者短信迟迟没有到达时,最有效的处理方式不是盲目反复重试,而是把问题当成一条订单工作流来拆解。成熟团队通常会先确认输入,再看实时状态,最后才决定取消、重试或升级。\n\n## 1. 先确认输入是否正确\n\n在认定送达失败之前,先检查服务编码是否对应正确目标、国家是否仍有实时库存、账户余额是否足够,以及请求是否带有独立的幂等键。很多送达异常其实来自重复下单或已经失效的服务国家组合。\n\n## 2. 区分延迟和真正失败\n\npending 不等于失败。先确认号码是否已成功分配、上游是否仍把该订单视为 active,以及当前是否已经超过预期等待窗口。如果仍在正常窗口内,应继续轮询;如果明显超时,就该进入取消或切换方案,而不是继续空等。\n\n## 3. 重试必须带来变化\n\n真正值得做的重试,通常伴随关键条件变化,比如切换国家、供应池、号码类型或业务时段。原样重复同一个请求,往往只会复现同样的问题,并增加成本。\n\n## 4. 升级时一次性带齐材料\n\n对支持团队最有价值的信息,通常是账户邮箱、requestId、目标服务、国家、问题时间线,以及下游平台的报错截图或文字。把这些材料一次性准备好,可以显著减少往返沟通。\n\n## 5. 把排障做成流程\n\n建议落库 requestId、记录重试决策、跟踪取消窗口,并明确谁负责退款和供应切换。这样送达异常才不会每次都从头排查。\n\n如果你想要一个简单顺序,可以记住这四步:确认输入、观察状态、判断取消还是重试、最后再带证据升级。