Haiku 4.5发布4天后:社区真实反馈与深度分析
10月15日,Anthropic 发布了 Claude Haiku 4.5。4天过去了,我们收集了来自 Hacker News、技术博客、开发者社区的真实反馈和性能数据,来看看这个模型到底值不值得关注。
剧透:这可能是今年最具破坏性的 AI 模型发布之一。
Posts about Claude AI and its features
查看所有标签10月15日,Anthropic 发布了 Claude Haiku 4.5。4天过去了,我们收集了来自 Hacker News、技术博客、开发者社区的真实反馈和性能数据,来看看这个模型到底值不值得关注。
剧透:这可能是今年最具破坏性的 AI 模型发布之一。
2025年11月,Anthropic 让 Claude 系列从“贴心聊天机器人”升级为“智能同事”。
以下是你在忙 Q4 时可能错过的三件大事。
更新点
意义
内部基准在 SWE-bench(真实 GitHub issue)上较 3.5-Sonnet 提升 42 %,允许 agent 迭代时 pass@1 超过 70 %。
早期用户报告最长 7 小时的自主编码,能独立完成整条功能分支 [^14^]。
如何试用
thinking_budget_tokens。是什么
Skills 是可携带的文件夹,打包指令、Python/R 脚本、品牌规范、SQL 查询——Claude 重复流程所需的一切。
就像“Excel 宏”遇上“GPT”,但可版本管理,并能在席位间共享。
自带 20 个预制包
谁能用
Pro、Max、Team、Enterprise 计划用户皆可。API 与 Agent SDK 支持已于 11 月 18 日上线 [^3^]。
10 月首度亮相的 3.5 版本,如今能看屏幕、移鼠标、敲键盘,并达到生产级。
11 月新特性
定价
$0.60 / 成功任务(成功 = 用户点击“Approve”)。免费层在 2026 年 1 月促销结束前每月 25 个任务。
Anthropic 在 11 月 29 日泄露的路线图透露:
11 月标志着 Claude 不再等待完美 prompt,而是带着自己的工具箱上班。
如果还没试过 Extended-thinking 或 Skills,抽 30 分钟开个沙盒——你的 2026 年会感谢你。
Happy building!
Anthropic 正式发布了 Claude Skills,这是一项突破性功能,允许 Claude 通过加载包含指令、脚本和资源的专门文件夹来提升特定任务的执行能力。Skills 可跨 Claude 应用、Claude Code 和 API 使用,为 AI 驱动的工作流带来了全新的定制化和可移植性水平。