Créer de meilleurs Agent Skills avec Test-Measure-Refine
La plupart des agent skills échouent pour une raison simple : on modifie le prompt, on relance une fois, puis on conclut que c’est “mieux”.
La dernière mise à jour de Skill Creator chez Anthropic pousse une boucle plus orientée ingénierie : tester d’abord, mesurer le comportement, puis affiner. Si vous construisez des workflows d’agents en interne, c’est ce changement qui compte vraiment.
Cet article réécrit l’annonce officielle en workflow développeur exécutable chaque semaine.