Xây Agent Skills tốt hơn với Test-Measure-Refine
Phần lớn agent skills thất bại vì một lý do rất quen: ta chỉnh prompt, chạy lại một lần, rồi kết luận là “đã tốt hơn”.
Bản cập nhật Skill Creator mới của Anthropic đẩy một vòng lặp mang tính kỹ thuật hơn: test trước, đo hành vi, rồi refine. Nếu bạn đang xây workflow agent nội bộ, đây mới là thay đổi quan trọng.
Bài này viết lại nội dung công bố chính thức thành một workflow dành cho developer mà bạn có thể chạy mỗi tuần.