メインコンテンツまでスキップ

「community-feedback」タグの記事が2件件あります

全てのタグを見る

Haiku 4.5: 4 Days Later - Real Community Feedback & Deep Analysis

· 約13分
Claude Dev
Claude Dev

On October 15, Anthropic released Claude Haiku 4.5. Four days later, we've collected real feedback from Hacker News, technical blogs, and developer communities, along with performance data, to see if this model actually lives up to the hype.

Spoiler: This might be one of the most disruptive AI model releases this year.

2025年11月のClaude AI:「極限推論」、Skills、コンピューター操作の1か月

· 約3分
Claude Dev
Claude Dev

2025年11月、AnthropicはClaudeシリーズを「親切なチャットボット」から「エージェント同僚」へと進化させました。
Q4 で忙しいあいだに見逃したかもしれない 3 つのトピックをまとめます。


1. 「Extreme Reasoning」登場——Opus 4 と Sonnet 4 が長く考え、より良く書く

  • 何が変わったか

    • Claude Opus 4 が旗艦コーディングモデルに。数時間のエージェントループを前提に設計。
    • Claude Sonnet 4 は 2 倍の速度と高い指示忠実度を獲得。
    • 2 つのモードを用意:
      1. Fast(サブ秒)
      2. Extended-thinking(最長 5 分)。モデル自身が検索・テスト・デバッグまで行う。
  • なぜ重要か
    内部ベンチマークで SWE-bench(実在 GitHub issue)にて 3.5-Sonnet 比 42 % 向上。エージェントに反復を許すと pass@1 は 70 % 超え。
    早期ユーザーは最長 7 時間の自律コーディングで、機能ブランチを人の手なしに完了したと報告 [^14^]。

  • 試し方

    • claude.ai(Max/Team/Enterprise)と Anthropic API で利用可能。
    • UI の “Extended thinking” をオン、または API で thinking_budget_tokens を指定。

2. Skills GA——Claude をあなたのミニ社員に

  • 概要
    Skills は可搬フォルダで、指示、Python/R スクリプト、ブランドガイド、SQL クエリなど、Claude がワークフローを再現するための一式を束ねる。
    いわば「Excel マクロ × GPT」。バージョン管理され、席数間で共有できる。

  • 20 個のプリセット付き

    • 「四半期決算パーサー」(PDF から表を抜き出し CEO 要約を書く)
    • 「Canva ブランドガード」(テンプレに自動トリミングし 4 サイズを出力)
    • 「Jira→Slack スプリントダイジェスト」
  • 対象プラン
    Pro、Max、Team、Enterprise。API と Agent SDK のサポートは 11 月 18 日に提供開始 [^3^]。


3. コンピューター操作が beta を卒業——Claude がデスクトップを動かす

10 月にティーズされた 3.5 モデルが、画面を見て、カーソルを動かし、入力する能力でプロダクション水準へ。

  • 11 月の新機能

    • 複数アプリを跨ぐワークフロー(例:Snowflake でデータ取得→Google Slides に貼り付けて図表→PDF 書き出し)。
    • OSWorld リーダーボードで視覚精度が 18 % 向上。
    • SOC-2 Type II を取得し、規制業界で承認 [^15^]。
  • 価格
    $0.60 / 成功タスク(成功 = ユーザーが “Approve” をクリック)。無料枠は 2026 年 1 月のプロモ終了まで月 25 タスク。


見逃しがちなクイックニュース

  • Web-search が beta 退出——すべての有料層で提供、引用を自動挿入 [^5^][^12^]。
  • 1 時間の prompt-cache——100 万トークンのコンテキストを <$0.20 でホット維持。書籍サイズの文書に最適 [^14^]。
  • Claude Code 用 GitHub Actions——サーバ不要で夜間のテスト→修正ループを実行 [^14^]。

今後

11 月 29 日にリークしたロードマップスライドから:

  • Memory v2——個人無料ユーザー向けの会話間メモリ(12 月)。
  • Claude 4 Haiku——200 Hz、$0.10 / 1 K tokens 未満で、組み込みデバイス向け(26 年 Q1)。
  • 欧州リージョン——アイルランドで GDPR 準拠のエンドポイント提供(26 年 2 月)。

まとめ

11 月は、Claude が“完璧なプロンプト待ち”をやめ、自前のツールキットを持ち込んだ月でした。
まだ Extended-thinkingSkills を試していないなら、年末までに 30 分のサンドボックスを設けてみてください——2026 年のあなたが喜びます。

Happy building!