上下文溢出排障实操：先止血，再恢复

先判断是不是这个问题

出现下面任一症状，就按本手册处理：

参考文档：

每次报错先记这 5 个字段：

先把历史窗口收窄到可控范围（示例：最近 8-12 轮）。
目标是先恢复可用，不是一次做最优解。

把单次大请求拆成 3 段：

每段单独发起，避免“一条请求塞完整流程”。

没有 pruning 就先启用；有 pruning 但失败，就先降低历史进入量再调策略。

你现在只做第 1 段：提取关键输入，不要生成最终答案。
输出格式：
1) 关键事实（最多 8 条）
2) 缺失信息（最多 5 条）
3) 下一段需要的输入

你现在只做第 2 段：基于上一步关键事实生成草稿，不要扩展新主题。
输出格式：
1) 草稿正文
2) 待核对项

你现在只做第 3 段：检查草稿中的错误与冲突，给出修正后版本。
输出格式：
1) 发现的问题
2) 修正后的最终版本

同一类型请求连续跑 10 次，记录：

通过标准：

把这套排障并入监控：