2025年11月のClaude AI:「極限推論」、Skills、コンピューター操作の1か月
2025年11月、AnthropicはClaudeシリーズを「親切なチャットボット」から「エージェント同僚」へと進化させました。
Q4 で忙しいあいだに見逃したかもしれない 3 つのトピックをまとめます。
1. 「Extreme Reasoning」登場——Opus 4 と Sonnet 4 が長く考え、より良く書く
-
何が変わったか
- Claude Opus 4 が旗艦コーディングモデルに。数時間のエージェントループを前提に設計。
- Claude Sonnet 4 は 2 倍の速度と高い指示忠実度を獲得。
- 2 つのモードを用意:
- Fast(サブ秒)
- Extended-thinking(最長 5 分)。モデル自身が検索・テス ト・デバッグまで行う。
-
なぜ重要か
内部ベンチマークで SWE-bench(実在 GitHub issue)にて 3.5-Sonnet 比 42 % 向上。エージェントに反復を許すと pass@1 は 70 % 超え。
早期ユーザーは最長 7 時間の自律コーディングで、機能ブランチを人の手なしに完了したと報告 [^14^]。 -
試し方
- claude.ai(Max/Team/Enterprise)と Anthropic API で利用可能。
- UI の “Extended thinking” をオン、または API で
thinking_budget_tokensを指定。
2. Skills GA——Claude をあなたのミニ社員に
-
概要
Skills は可搬フォルダで、指示、Python/R スクリプト、ブランドガイド、SQL クエリなど、Claude がワークフローを再現するための一式を束ねる。
いわば「Excel マクロ × GPT」。バージョン管理され、席数間で共有できる。 -
20 個のプリセット付き
- 「四半期決算パーサー」(PDF から表を抜き出し CEO 要約を書く)
- 「Canva ブランドガード」(テンプレに自動トリミングし 4 サイズを出力)
- 「Jira→Slack スプリントダイジェスト」
-
対象プラン
Pro、Max、Team、Enterprise。API と Agent SDK のサポートは 11 月 18 日に提供開始 [^3^]。
3. コンピューター操作が beta を卒業——Claude がデスクトップを動かす
10 月にティーズされた 3.5 モデルが、画面を見て、カーソルを動かし、入力する能力でプロダクション水準へ。
-
11 月の新機能
- 複数アプリを跨ぐワークフロー(例:Snowflake でデータ取得→Google Slides に貼り付けて図表→PDF 書き出し)。
- OSWorld リーダーボードで視覚精度が 18 % 向上。
- SOC-2 Type II を取得し、規制業界で承認 [^15^]。
-
価格
$0.60 / 成功タスク(成功 = ユーザーが “Approve” をクリック)。無料枠は 2026 年 1 月のプロモ終了まで月 25 タスク。
見逃しがちなクイックニュース
- Web-search が beta 退出——すべての有料層で提供、引用を自動挿入 [^5^][^12^]。
- 1 時間の prompt-cache——100 万トークンのコンテキストを <$0.20 でホット維持。書籍サイズの文書に最適 [^14^]。
- Claude Code 用 GitHub Actions——サーバ不要で夜間のテスト→修正ループを実行 [^14^]。
今後
11 月 29 日にリークしたロードマップスライドから:
- Memory v2——個人無料ユーザー向けの会話間メモリ(12 月)。
- Claude 4 Haiku——200 Hz、$0.10 / 1 K tokens 未満で、組み込みデバイス向け(26 年 Q1)。
- 欧州リージョン——アイルランドで GDPR 準拠のエンドポイント提供(26 年 2 月)。
まとめ
11 月は、Claude が“完璧なプロンプト待ち”をやめ、自前のツールキットを持ち込んだ月でした。
まだ Extended-thinking や Skills を試していないなら、年末までに 30 分のサンドボックスを設けてみてください——2026 年のあなたが喜びます。
Happy building!