Claude 1M Context GA:团队落地实战指南
· 阅读需 4 分钟
Claude 的 1M token context 已经不只是 beta 试验。
截至 2026 年 3 月 13 日,Anthropic 已宣布 Opus 4.6 与 Sonnet 4.6 正式 GA 支持 1M context。这会直接改变团队设计长代码、长文档工作流的方式。
这篇文章聚焦三个问题:现在到底可用到什么程度、还有哪些约束、以及如何安全上线。
到底更新了什么(含准确日期)
时间线很关键:
- 2025 年 8 月 12 日:Anthropic 宣布 Sonnet 4 进入 1M context 公测。
- 2025 年 8 月 26 日:可用性扩展,包含 Google Cloud Vertex AI。
- 2026 年 3 月 13 日:Anthropic 宣布 Opus 4.6 / Sonnet 4.6 的 1M context GA。
2026 年 3 月的 GA 更新强调了 4.6 模型的四点变化:
- 1M 全窗口按标准价格计费(无长上下文溢价)
- 各上下文长度下都使用标准吞吐策略
- 超过 200K 请求不再需要 beta header
- 单次请求最多支持 600 张图片或 PDF 页
当前模型现状(截至 2026 年 3 月 14 日)
根据 Anthropic 当前文档与公告:
-
Opus 4.6 / Sonnet 4.6
在 Claude Platform 上可直接使用 1M context,不需要context-1m-2025-08-07。 -
Sonnet 4.5 / Sonnet 4
超过 200K input tokens 仍需context-1m-2025-08-07beta header,并受层级限制与长上下文溢价影响。
这意味着:很多团队可以把长上下文流量迁移到 4.6,明显简化请求分支逻辑。
为什么工程团队要重视
1M context 不只是“prompt 变长”。
它带来的核心收益是架构复杂度下降:
- 减少上下文切块流水线
- 减少多步骤间有损摘要
- 更稳定地进行跨文件/跨文档一次性推理
- 多步 agent 会话在压缩前可维持更长上下文连续性
如果你当前系统里有大量检索拼接、手工截断、prompt 分片逻辑,4.6 的 1M context 往往可以删掉很大一部分胶水代码。