Claude 1M Context GA: 実運用ロールアウトガイド
· 約4分
Claude の 1M token context は、もはや beta 実験ではありません。
2026年3月13日時点で、Anthropic は Opus 4.6 と Sonnet 4.6 に対する 1M context の GA を発表しました。長大なコードや文書を扱うワークフロー設計が大きく変わります。
この投稿では、現在の可用性、残る注意点、そして安全な本番導入手順を整理します。
何が変わったか(正確な日付付き)
- 2025年8月12日: Sonnet 4 向け 1M context の public beta を発表
- 2025年8月26日: Google Cloud Vertex AI への提供拡大を発表
- 2026年3月13日: Opus 4.6 / Sonnet 4.6 向け 1M context GA を発表
2026年3月の GA では、4.6 モデル向けに次の4点が強調されています。
- 1M 全体で標準料金(長文脈プレミアム なし)
- 文脈長にかかわらず標準スループット
- 200K 超リクエストでも beta header 不要
- 1リクエストあたり最大 600 画像/PDF ページ
現在のモデル状況(2026年3月14日)
-
Opus 4.6 / Sonnet 4.6
Claude Platform で 1M context をそのまま利用可能。context-1m-2025-08-07は不要。 -
Sonnet 4.5 / Sonnet 4
200K を超える input tokens ではcontext-1m-2025-08-07が必要で、tier 制約と長文脈課金が残る。
そのため、長文脈トラフィックは 4.6 系へ寄せるのが実務的です。
エンジニアリング上の意味
1M context は「プロンプトが長い」だけではありません。設計負債を減らせます。
- context chunking パイプラインを削減
- ツール間の要約ロスを削減
- 複数ファイル/文書を1パスで扱いやすくなる
- compaction 前のマルチステップ会話を安定化
既存システムが retrieval stitching、手動 truncation、prompt sharding に依存しているほど効果が出ます。