Claude AI Blog: Tips, Releases and Tutorials

跳到主要内容

用 Test-Measure-Refine 打造更可靠的 Agent Skills

· 阅读需 4 分钟
Claude Dev
Claude Dev

大多数 agent skills 失败的原因其实很普通:我们改了提示词,重跑一次,就觉得“变好了”。

Anthropic 这次 Skill Creator 更新的重点,是更工程化的闭环:先测试,再度量行为,然后迭代优化。如果你在做团队内的 agent 工作流,这个变化才是真正值得关注的。

这篇文章把官方发布内容改写成开发者可以每周执行的实战流程。

选择真正能落地的 AI Agent 工作流模式

· 阅读需 5 分钟
Claude Dev
Claude Dev

大多数团队做 agent 失败,不是因为模型不够强。

真正的问题是:太早选了错误的工作流模式,编排过度、组件过多、复杂度却没有明确收益。

Anthropic 最近这篇关于常见 agent workflow patterns 的官方文章很有价值,但这篇会改写成面向生产环境开发者的版本。

如何在 Cowork 中从零构建一个插件(2026 指南)

· 阅读需 6 分钟
Claude Dev
Claude Dev

如果你想让 Cowork 真正帮你干活,插件就是关键杠杆。

截至 2026-02-28,官方路径已经很清晰:

  • Anthropic 在 2026-01-14 发布了 Cowork
  • 2026-01-20 宣布支持自定义插件的创建与共享
  • 2026-02-24 发布了面向企业的插件目录更新
  • 2026-02-25 更新了插件帮助文档

这篇指南会把官方流程和社区用户的实战经验结合起来,帮你从零做出第一个可用插件。

Claude Code 的“Remote Control”是什么?

· 阅读需 4 分钟
Claude Dev
Claude Dev

我不是那种硬核开发者。更像是:“我想让 AI 帮我做事,但别让我先啃 20 页文档。”
所以当我看到 Claude Code 刚发布了一个叫 Remote Control 的新功能时,我就很好奇。然后我又发现 AI 社区里很多人也在热议一个叫 OpenClaw 的东西。

这篇文章会用新手友好的方式拆解:到底发生了什么、真正重要的点是什么,以及你应该关注哪一个。


Claude Code 里的“Remote Control”是什么?

Claude Code 是 Anthropic 的编码工具。
新的 Remote Control 功能做了一件非常简单(但很强大)的事:

你可以在手机或浏览器上,远程控制运行在你电脑上的 Claude Code 会话。

就是这么直接。不是把工作神秘迁移到云端,也不是“你的代码突然到了某个未知地方”。

  • Claude Code 仍然运行在你的本地电脑
  • 你先启动一个任务(比如修复 bug、生成代码、重构)
  • 你扫描二维码或打开一个链接
  • 现在你就可以:
    • 看进度
    • 读输出
    • 发新的指令
      这些都可以在手机或其他设备上完成

真正干活的还是你的电脑。手机只是遥控器。


为什么这件事很重要(即使你是新手)

在这之前,用 AI 写代码的体验非常……固定在工位上

你得:

  • 坐在桌前
  • 终端一直开着
  • 一边等一边盯

有了 Remote Control:

  • 你可以先启动一个长任务
  • 去倒杯咖啡 ☕
  • 在手机上看进度
  • 必要时再推一把 AI

对新手来说,这减少了很多摩擦。它不再像“严肃的开发者工具”,而更像普通 App 的使用体验。


Remote Control 怎么工作(不讲吓人的细节)

你不需要理解内部实现。从概念上看,它是:

  1. 在本地启动 Claude Code
  2. 启用 Remote Control
  3. 从另一台设备连接
  4. 在同一个会话里持续交互

新手需要记住的重点:

  • 你的电脑必须保持开机
  • 不会有东西偷偷上传
  • 你的本地文件仍然在本地

所以从安全性和易用性来看,这让人很安心。


那么……OpenClaw 是什么?为什么大家都在聊它?

OpenClaw 是一种完全不同的存在

如果说 Claude Code 是:

“一个帮助你写代码的 AI”

那 OpenClaw 更像:

“一个可以自己替你做事的 AI 代理”

人们会用 OpenClaw 来:

  • 自动执行命令
  • 管理任务和工作流
  • 接入聊天应用(Telegram、Discord 等)
  • 不用持续等人类输入也能行动

这就是它让人兴奋的原因,也是它让一些人有点担心的原因。


新手视角对比:Claude Code vs OpenClaw

主题Claude Code(Remote Control)OpenClaw
核心思路远程控制编码任务自主型 AI 代理
运行位置你的本地机器通常本地,但非常灵活
交互方式App / 浏览器聊天应用、API
安全性高(范围受限)取决于配置
搭建难度中等
新手友好度👍👍👍⚠️

我的简短结论

  • Claude Code Remote Control = 更安全、更平稳、更聚焦
  • OpenClaw = 更强大、更灵活,但也更容易翻车

新手什么时候该选哪个?

这些情况选 Claude Code Remote Control:

  • 你想让 AI 帮你写代码
  • 你不想让自动化失控
  • 你更偏好官方、受支持的工具
  • 你希望看到并确认每一步发生了什么

这些情况再考虑 OpenClaw:

  • 你希望 AI 能主动替你执行动作
  • 你愿意学习权限和安全设置
  • 你喜欢折腾和实验
  • 你能接受更高风险换取更高能力

更大的图景(为什么这件事有意义)

我们在 2026 年看到的变化是:

  • AI 工具不再只是“聊天窗口”
  • 它们正在变成持续工作的执行者
  • 现在又开始变得移动端友好

Remote Control 展示了一条非常保守、用户友好的路径。
OpenClaw 展示的是更激进、更实验性的未来。

两者都很有意思,但对新手来说,慢一点起步通常更聪明。


一个新手的最后想法

如果你刚入门,已经被各种 AI 工具搞得有点懵:

👉 Claude Code + Remote Control 是一个很好的入口。
它很现代、很灵活,也不需要你盲目信任。

OpenClaw 很迷人,但也许更适合你更熟练之后再探索。

如果你愿意,下一篇我可以:

  • 走一遍真实工作流示例
  • 讲讲新手常见错误
  • 或者对比 Claude Code 和其他 AI 编码工具

告诉我就行 👋

Claude AI在2025年11月:“极限推理”、Skills与电脑操作

· 阅读需 3 分钟
Claude Dev
Claude Dev

2025年11月,Anthropic 让 Claude 系列从“贴心聊天机器人”升级为“智能同事”。
以下是你在忙 Q4 时可能错过的三件大事。


1. “Extreme Reasoning” 发布——Opus 4 与 Sonnet 4 思考更久,编码更强

  • 更新点

    • Claude Opus 4 成为旗帜级编码模型,适配多小时的 agent 循环。
    • Claude Sonnet 4 提速 2 倍,指令执行更精准。
    • 两种模式可选:
      1. Fast(亚秒级)
      2. Extended-thinking(最长 5 分钟),允许模型自行检索、测试与调试输出。
  • 意义
    内部基准在 SWE-bench(真实 GitHub issue)上较 3.5-Sonnet 提升 42 %,允许 agent 迭代时 pass@1 超过 70 %。
    早期用户报告最长 7 小时的自主编码,能独立完成整条功能分支 [^14^]。

  • 如何试用

    • 现已在 claude.ai(Max/Team/Enterprise)与 Anthropic API 上线。
    • 在 UI 勾选 “Extended thinking”,或在 API 中设置 thinking_budget_tokens

2. Skills 正式版——把 Claude 变成你公司的“小同事”

  • 是什么
    Skills 是可携带的文件夹,打包指令、Python/R 脚本、品牌规范、SQL 查询——Claude 重复流程所需的一切。
    就像“Excel 宏”遇上“GPT”,但可版本管理,并能在席位间共享。

  • 自带 20 个预制包

    • “季度财报解析”:从 PDF 抽表格,生成 CEO 摘要
    • “Canva 品牌卫士”:按模板裁剪,导出 4 个尺寸
    • “Jira→Slack 冲刺简报”
  • 谁能用
    Pro、Max、Team、Enterprise 计划用户皆可。API 与 Agent SDK 支持已于 11 月 18 日上线 [^3^]。


3. 电脑操作毕业出 beta——Claude 现在能驱动你的桌面

10 月首度亮相的 3.5 版本,如今能看屏幕、移鼠标、敲键盘,并达到生产级。

  • 11 月新特性

    • 多应用工作流(如从 Snowflake 拉数,贴到 Google Slides 做图,再导出 PDF)。
    • 在 OSWorld 排行榜上的视觉准确率 ↑ 18 %。
    • 通过 SOC-2 Type II,获准进入合规行业 [^15^]。
  • 定价
    $0.60 / 成功任务(成功 = 用户点击“Approve”)。免费层在 2026 年 1 月促销结束前每月 25 个任务。


你可能划过的快讯

  • Web-search 退出 beta——现已覆盖所有付费层,自动插入引用 [^5^][^12^]。
  • 1 小时 prompt-cache——保持 100 万 token 上下文热启动,成本低于 $0.20,适合书长文档 [^14^]。
  • Claude Code 的 GitHub Actions——无需服务器也能跑夜间测试-修复循环 [^14^]。

向前看

Anthropic 在 11 月 29 日泄露的路线图透露:

  • Memory v2——为个人免费用户提供跨对话记忆(12 月)。
  • Claude 4 Haiku——200 Hz,低于 $0.10 / 1 K tokens,面向嵌入式设备(26 年 Q1)。
  • 欧洲区域——在爱尔兰提供 GDPR 合规端点(26 年 2 月)。

结论

11 月标志着 Claude 不再等待完美 prompt,而是带着自己的工具箱上班。
如果还没试过 Extended-thinkingSkills,抽 30 分钟开个沙盒——你的 2026 年会感谢你。

Happy building!

Claude Skills:可定制的任务专长,随你而行

· 阅读需 10 分钟
Claude Dev
Claude Dev

Anthropic 正式发布了 Claude Skills,这是一项突破性功能,允许 Claude 通过加载包含指令、脚本和资源的专门文件夹来提升特定任务的执行能力。Skills 可跨 Claude 应用、Claude Code 和 API 使用,为 AI 驱动的工作流带来了全新的定制化和可移植性水平。

Claude Code Plugins:用一条命令扩展你的开发工作流

· 阅读需 11 分钟
Claude Dev
Claude Dev

Anthropic 正式推出了 Claude Code Plugins,这是一个革命性的扩展系统,让开发者可以通过一条简单的命令来安装和管理自定义的开发工具集合。无论你是团队负责人想要统一开发规范,还是个人开发者希望提升工作效率,Plugins 都为你提供了轻量级、灵活的解决方案。