Bessere Agent Skills mit Test-Measure-Refine
Die meisten Agent Skills scheitern aus einem banalen Grund: Wir ändern Prompts, testen einmal und nennen es „besser“.
Anthropic’s aktuelles Skill-Creator-Update setzt auf einen stärker engineering-orientierten Zyklus: zuerst testen, Verhalten messen, dann verfeinern. Wenn ihr interne Agent-Workflows baut, ist genau das die relevante Veränderung.
Dieser Beitrag übersetzt die offizielle Ankündigung in einen Entwickler-Workflow, den ihr wöchentlich ausführen könnt.