Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 2 phút đọc

🌲 Arbor: Khung đa tác vụ tối ưu hóa suy luận LLM bằng tìm kiếm cây

Khung Arbor mới sử dụng tìm kiếm cây cấu trúc giúp tăng hiệu năng suy luận LLM lên tới 193% nhờ sự phối hợp chặt chẽ giữa các agent chuyên biệt.

Tier 2 · nguồn 99% độ tin cậy Đã được duyệt
Nguồn gốc arxiv.org

Các nhà nghiên cứu vừa giới thiệu Arbor, một khung đa tác vụ (multi-agent framework) mới tích hợp cấu trúc tìm kiếm cây (tree search) làm lớp nhận thức cho các agent tự hành. Phương pháp này giúp hệ thống tự động hóa tối ưu hóa hiệu năng suy luận của mô hình ngôn ngữ lớn (LLM) một cách vượt trội so với các giải pháp hiện tại.

Diễn biến

Theo tài liệu công bố trên arXiv, Arbor không hoạt động trên các mục tiêu cô lập mà duy trì một cây tìm kiếm rõ ràng chứa các giả thuyết được chấm điểm. Cấu trúc này đóng vai trò như bộ nhớ làm việc chung giữa các agent, liên tục phát triển qua mỗi lần đo lường và coi các thất bại là tín hiệu chẩn đoán để định hình hướng khám phá tiếp theo. Kiến trúc của Arbor kết hợp giữa một agent Điều phối (Orchestrator) phân quyền cho các Chuyên gia chuyên môn (Domain Specialists) và một agent Phản biện (Critic) để kiểm soát tính ổn định thông qua phân tích nguyên nhân gốc rễ. Sự phân tách kỹ năng cứng (chuyên môn) và kỹ năng mềm (giao thức phối hợp) cho phép hệ thống tự vận hành các chiến dịch tối ưu hóa kéo dài nhiều ngày liên tục.

Vì sao đáng chú ý

Đối với cộng đồng phát triển AI tại Việt Nam, tối ưu hóa chi phí và hiệu năng phần cứng luôn là bài toán lớn. Kết quả thử nghiệm cho thấy Arbor giúp cải thiện hiệu năng Pareto giữa băng thông và độ trễ (throughput-latency) lên tới 193% so với các cấu hình tối ưu sẵn từ nhà cung cấp phần cứng. Đáng chú ý, một agent đơn lẻ không có khung hỗ trợ này nhanh chóng bị giới hạn ở mức cải thiện 33% và gặp lỗi không thể phục hồi chỉ sau vài giờ. Nghiên cứu này chứng minh rằng việc phối hợp đa tác vụ có cấu trúc chặt chẽ có thể thay thế một phần công sức tối ưu hóa thủ công của cả một đội ngũ kỹ sư phần cứng và phần mềm.