教程

WebChat / Gateway 鉴权排障树:从 token 缺失到恢复上线

针对 gateway token missing 等高频问题,给出分层排查路径与恢复动作。

高频问题

最常见的是这类错误:

  • gateway token missing
  • 鉴权通过率忽高忽低
  • 本地可用,线上请求被拒绝

参考:

5 分钟分层定位

按顺序走,不要跳步。

第 1 层:配置是否存在

  1. token 变量是否真的配置
  2. 配置键名是否和运行时读取一致
  3. 是否把示例值当成了真实值

第 2 层:运行时是否读到

  1. 进程启动日志是否显示已加载配置
  2. 多环境变量是否被覆盖
  3. 发布后是否需要重启才能生效

第 3 层:网关是否放行

  1. 代理层是否转发了鉴权头
  2. 中间层是否误删了关键字段
  3. 跨域策略是否拦截了预检请求

第 4 层:权限是否匹配

  1. token 范围是否覆盖当前接口
  2. token 是否已过期或被撤销
  3. 多租户场景是否误用了其他租户 token

快速修复动作

  1. 先替换为明确可用的测试 token 验证链路
  2. 统一 token 来源,避免本地和线上双写
  3. 把网关转发头列表显式配置并版本化
  4. 增加 token 健康检查接口用于上线前自检

验收标准

  1. gateway token missing 不再出现
  2. 连续 20 次请求鉴权全部通过
  3. 过期 token 能被稳定拒绝并给出明确错误
  4. 日志可追溯“请求 ID -> token 状态 -> 拒绝原因”

下一步

补充高频问答:

然后继续: