Nghiên cứu giải quyết vấn đề các mô hình nhỏ thường mất ổn định khi ngữ cảnh (context) mở rộng quá mức hoặc khi phải hoạt động dưới áp lực chi phí và độ trễ cao.
Diễn biến
Khung điều khiển đề xuất bao gồm hai giai đoạn: đầu tiên, mô hình nhỏ được chưng cất (distilled) để học sơ đồ đầu ra (output schema), sau đó được giám sát trực tuyến bởi một vòng lặp 'oracle-controller'. Bộ điều khiển này theo dõi tính hợp lệ của giao thức, chiếu lịch sử tích lũy vào một miền prompt khả thi và kích hoạt tinh chỉnh nhẹ (lightweight fine-tuning) khi phát hiện có sự trôi lệch (drift). Cách tiếp cận này tách biệt việc học sơ đồ giao tiếp khỏi việc thích ứng ngữ nghĩa cho tác vụ.
Vì sao đáng chú ý
Thay vì dựa vào chiều dài ngữ cảnh danh nghĩa, nghiên cứu tập trung vào việc kiểm soát 'trạng thái prompt hiệu quả' để tránh bão hòa sự chú ý (attention-induced saturation). Kết quả cho thấy độ tin cậy và hiệu quả chi phí được cải thiện rõ rệt so với các phương pháp chưng cất truyền thống. Đây là kỹ thuật quan trọng để triển khai các agent AI phức tạp trên hạ tầng phần cứng khiêm tốn hoặc các mô hình edge.