Construye mejores Agent Skills con Test-Measure-Refine
La mayoría de los agent skills fallan por una razón aburrida: editamos prompts, ejecutamos una vez y decimos que “ya está mejor”.
La última actualización de Skill Creator de Anthropic empuja un bucle más de ingeniería: primero probar, luego medir comportamiento y después refinar. Si construyes workflows de agentes internos, este es el cambio que realmente importa.
Este post reescribe el anuncio oficial como un flujo para developers que puedes ejecutar cada semana.