AI tools-ai 15 thg 6, 2026 4 phút đọc

Kỹ Thuật Ngữ Cảnh Hiệu Quả: LLM Agent Làm Việc Năng Suất Hơn Với Ít Thông Tin Hơn! 🚀💰

Nghiên cứu của Microsoft chỉ ra rằng việc tinh gọn ngữ cảnh tương tác công cụ thông qua chọn lọc và tóm tắt có thể cải thiện đáng kể độ tin cậy và hiệu quả của các tác nhân LLM trong quy trình làm việc doanh nghiệp, đặc biệt khi xử lý các tác vụ dài hơi.

Tier 2 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc arxiv.org

Kỹ Thuật Ngữ Cảnh Hiệu Quả: LLM Agent Làm Việc Năng Suất Hơn Với Ít Thông Tin Hơn! 🚀💰

Tóm Tắt Nhanh ⚡️

Giới Thiệu: Thách Thức Của LLM Agent Trong Doanh Nghiệp

Các mô hình ngôn ngữ lớn (LLM) ngày càng được triển khai rộng rãi như những tác nhân tự động hóa (LLM Agent) trong các quy trình làm việc phức tạp của doanh nghiệp. Tuy nhiên, chúng đối mặt với một thách thức lớn: phản hồi công cụ quá dài dòng từ các hệ thống doanh nghiệp. Điều này không chỉ gây ra tình trạng tràn ngữ cảnh (context overflow), lỗi trạng thái cũ (stale-state errors) mà còn đẩy chi phí suy luận lên cao. 🤯

Nghiên cứu mới từ Microsoft đã đào sâu vào vấn đề này, đặc biệt trong bối cảnh tự động hóa phân loại chi phí trong hệ thống Microsoft Dynamics 365 Finance and Operations. Mục tiêu là tìm ra cách để các LLM Agent có thể hoạt động hiệu quả và đáng tin cậy hơn với các tác vụ dài hơi.

Phương Pháp Tiếp Cận: Kỹ Thuật Ngữ Cảnh Sáng Tạo

Để giải quyết bài toán ngữ cảnh, nhóm nghiên cứu đã thử nghiệm và đánh giá bốn cấu hình GPT-5 khác nhau trên một bộ dữ liệu gồm 50 tác vụ phân loại chi phí khách sạn độc lập. Các cấu hình bao gồm:

* Đường cơ sở: Không sử dụng mô hình người dùng. * Lịch sử hội thoại đầy đủ: Giữ lại toàn bộ lịch sử tương tác. * Cắt tỉa ngữ cảnh: Chỉ giữ lại 5 cặp gọi/phản hồi công cụ gần nhất. * Cắt tỉa + Tóm tắt tự động: Cắt tỉa ngữ cảnh và sau đó tóm tắt nội dung còn lại.

Kết Quả Đáng Kinh Ngạc: "Ít Hơn Là Nhiều Hơn"! 📉🏆

Kết quả nghiên cứu đã đưa ra những con số rất thuyết phục về hiệu quả của việc quản lý ngữ cảnh thông minh:

* Đường cơ sở chỉ đạt tỷ lệ hoàn thành tác vụ 8.0%. * Giữ lại toàn bộ ngữ cảnh cải thiện đáng kể lên 71.0%, nhưng đi kèm với chi phí khổng lồ: tiêu thụ tới 1.480.996 token và mất 14.56 giờ để hoàn thành toàn bộ bài kiểm tra. 😱 * Việc cắt tỉa ngữ cảnh chỉ còn 5 cặp tương tác cuối cùng đã nâng tỷ lệ hoàn thành lên 79.0%, đồng thời giảm mạnh lượng token tiêu thụ xuống 535.274 và thời gian chạy chỉ còn 5.39 giờ. * Giải pháp tối ưu nhất chính là sự kết hợp giữa cắt tỉa ngữ cảnh và tóm tắt tự động. Phương pháp này không chỉ đạt tỷ lệ hoàn thành tác vụ cao nhất (91.6%) và tỷ lệ phân loại số tiền trung bình chính xác 99.64%, mà còn giữ được hiệu quả cao với 553.374 token và 5.79 giờ. ✨

Hàm Ý & Tầm Quan Trọng Cho Doanh Nghiệp 🔑

Nghiên cứu này mang đến một thông điệp rõ ràng cho các nhà phát triển và doanh nghiệp đang triển khai LLM Agent:

> "Đối với loại quy trình làm việc doanh nghiệp sử dụng công cụ này, việc giữ lại có chọn lọc các tương tác công cụ gần đây cộng với tóm tắt gọn gàng có thể cải thiện cả độ tin cậy và hiệu quả so với việc giữ lại toàn bộ lịch sử."

Điều này cho thấy rằng việc quản lý ngữ cảnh một cách thông minh không chỉ giúp giảm chi phí vận hành đáng kể mà còn nâng cao chất lượng và độ chính xác của các tác vụ do LLM Agent thực hiện. Kết quả này càng được củng cố khi thử nghiệm tương tự với Claude Sonnet 4.5 cũng cho thấy hiệu quả tương tự.

Kalera News nhận định: Trong một kỷ nguyên mà chi phí token và hiệu suất mô hình là yếu tố then chốt, việc tối ưu hóa cách LLM Agent xử lý ngữ cảnh là không thể thiếu. Nghiên cứu này không chỉ là một bước tiến về mặt học thuật mà còn cung cấp một lộ trình thực tế để xây dựng các LLM Agent mạnh mẽ, tiết kiệm và đáng tin cậy hơn cho thế giới doanh nghiệp. 💡💼

---

Nguồn: Less Context, Better Agents: Efficient Context Engineering for Long-Horizon Tool-Using LLM Agents