Microsoft Research Asia vừa công bố SkillOpt, một framework mã nguồn mở (giấy phép MIT) giúp tự động nâng cấp kỹ năng của AI agent bằng cách coi tài liệu hướng dẫn định dạng markdown (.md) như một đối tượng có thể huấn luyện. Công nghệ này tối ưu hóa các quy trình làm việc phức tạp của agent mà không cần can thiệp hay thay đổi trọng số (weights) của mô hình AI nền tảng bên dưới.
Bối cảnh
Thông thường, các kỹ năng của AI agent được lưu trữ dưới dạng văn bản và đưa vào ngữ cảnh của mô hình trước khi thực thi. Tuy nhiên, việc tối ưu hóa các tài liệu này là một quy trình thủ công chậm chạp và dễ xảy ra lỗi, buộc người dùng phải đoán mò các thay đổi để cải thiện hiệu suất. Theo ông Yifan Yang, Kỹ sư Nghiên cứu Cấp cao tại Microsoft Research Asia, các phương pháp tự điều chỉnh trước đây thường thiếu tính kỷ luật toán học, dẫn đến việc các kỹ năng bị lệch hướng hoặc suy giảm hiệu suất một cách âm thầm khi cố gắng sửa lỗi.
Diễn biến
Để giải quyết vấn đề này, SkillOpt áp dụng các khái niệm cốt lõi từ học sâu vào văn bản thông qua một vòng lặp đề xuất và thử nghiệm liên tục. Framework này giới hạn số lượng chỉnh sửa mỗi bước (tương tự như tốc độ học - learning rate), sử dụng một tập dữ liệu kiểm định độc lập để chỉ giữ lại các thay đổi cải thiện điểm số thực tế, và đưa các chỉnh sửa thất bại vào một bộ đệm từ chối để tránh lặp lại sai lầm. Ở cuối mỗi chu kỳ (epoch), hệ thống sẽ so sánh kết quả để giữ lại các bài học dài hạn, đóng vai trò như một thành phần quán tính (momentum) trong tối ưu hóa.
Vì sao đáng chú ý
Thử nghiệm thực tế cho thấy SkillOpt mang lại hiệu quả vượt trội trên 52 tổ hợp mô hình và công cụ kiểm thử khác nhau, giúp GPT-5.5 cải thiện trung bình 23,5 điểm so với khi không dùng kỹ năng. Đáng chú ý, các mô hình nhỏ như GPT-5.4-nano thậm chí đã tăng gấp đôi điểm số trong các tác vụ suy luận tài liệu đa phương thức. Đối với các doanh nghiệp Việt Nam, SkillOpt mở ra cơ hội tự động hóa các quy trình trích xuất dữ liệu tài liệu đòi hỏi tính chính xác cao với chi phí vận hành cực kỳ thấp (khoảng 1-5 USD để huấn luyện một kỹ năng), đồng thời các tệp kỹ năng thành phẩm rất nhỏ gọn (dưới 2.000 token) và dễ dàng chuyển đổi linh hoạt giữa các dòng mô hình khác nhau.