Bỏ qua đến nội dung chính
Về trang chủ
AI 1 phút đọc

Tách biệt khả năng cập nhật và khả năng hưởng lợi trong các tác nhân LLM tự tiến hóa

Nghiên cứu từ arXiv (2605.30621) chỉ ra rằng khả năng cập nhật "harness" của một tác nhân không đồng nghĩa với việc nó sẽ hưởng lợi từ đó. Các mô hình tầm trung thường hưởng lợi nhiều nhất từ việc tự tiến hóa.

Tier 2 · nguồn 89% độ tin cậy Đã được duyệt
Nguồn gốc arxiv.org

Tóm tắt nhanh

Nghiên cứu từ arXiv (2605.30621) chỉ ra rằng khả năng cập nhật "harness" (prompt, kỹ năng, bộ nhớ) của một tác nhân không đồng nghĩa với việc nó sẽ hưởng lợi từ đó. Các mô hình tầm trung thường hưởng lợi nhiều nhất từ việc tự tiến hóa, trong khi các mô hình mạnh (như Claude 4.6 Opus) có mức tăng trưởng không quá vượt trội so với các mô hình nhỏ hơn.

Vì sao đáng chú ý

Gợi ý rằng nên đầu tư tài nguyên vào năng lực giải quyết tác vụ của agent thay vì chỉ tập trung vào bộ phận tiến hóa (evolver).

Nguồn

- https://arxiv.org/abs/2605.30621