Các nhà nghiên cứu vừa giới thiệu Arbor, một khung đa tác vụ (multi-agent framework) mới tích hợp cấu trúc tìm kiếm cây (tree search) làm lớp nhận thức cho các agent tự hành. Phương pháp này giúp hệ thống tự động hóa tối ưu hóa hiệu năng suy luận của mô hình ngôn ngữ lớn (LLM) một cách vượt trội so với các giải pháp hiện tại.
Diễn biến
Theo tài liệu công bố trên arXiv, Arbor không hoạt động trên các mục tiêu cô lập mà duy trì một cây tìm kiếm rõ ràng chứa các giả thuyết được chấm điểm. Cấu trúc này đóng vai trò như bộ nhớ làm việc chung giữa các agent, liên tục phát triển qua mỗi lần đo lường và coi các thất bại là tín hiệu chẩn đoán để định hình hướng khám phá tiếp theo. Kiến trúc của Arbor kết hợp giữa một agent Điều phối (Orchestrator) phân quyền cho các Chuyên gia chuyên môn (Domain Specialists) và một agent Phản biện (Critic) để kiểm soát tính ổn định thông qua phân tích nguyên nhân gốc rễ. Sự phân tách kỹ năng cứng (chuyên môn) và kỹ năng mềm (giao thức phối hợp) cho phép hệ thống tự vận hành các chiến dịch tối ưu hóa kéo dài nhiều ngày liên tục.
Vì sao đáng chú ý
Đối với cộng đồng phát triển AI tại Việt Nam, tối ưu hóa chi phí và hiệu năng phần cứng luôn là bài toán lớn. Kết quả thử nghiệm cho thấy Arbor giúp cải thiện hiệu năng Pareto giữa băng thông và độ trễ (throughput-latency) lên tới 193% so với các cấu hình tối ưu sẵn từ nhà cung cấp phần cứng. Đáng chú ý, một agent đơn lẻ không có khung hỗ trợ này nhanh chóng bị giới hạn ở mức cải thiện 33% và gặp lỗi không thể phục hồi chỉ sau vài giờ. Nghiên cứu này chứng minh rằng việc phối hợp đa tác vụ có cấu trúc chặt chẽ có thể thay thế một phần công sức tối ưu hóa thủ công của cả một đội ngũ kỹ sư phần cứng và phần mềm.