Tách biệt khả năng cập nhật và khả năng hưởng lợi trong các tác nhân LLM tự tiến hóa
Nghiên cứu từ arXiv (2605.30621) chỉ ra rằng khả năng cập nhật "harness" của một tác nhân không đồng nghĩa với việc nó sẽ hưởng lợi từ đó. Các mô hình tầm trung thường hưởng lợi nhiều nhất từ việc tự tiến hóa.
Nghiên cứu từ arXiv (2605.30621) chỉ ra rằng khả năng cập nhật "harness" (prompt, kỹ năng, bộ nhớ) của một tác nhân không đồng nghĩa với việc nó sẽ hưởng lợi từ đó. Các mô hình tầm trung thường hưởng lợi nhiều nhất từ việc tự tiến hóa, trong khi các mô hình mạnh (như Claude 4.6 Opus) có mức tăng trưởng không quá vượt trội so với các mô hình nhỏ hơn.
Vì sao đáng chú ý
Gợi ý rằng nên đầu tư tài nguyên vào năng lực giải quyết tác vụ của agent thay vì chỉ tập trung vào bộ phận tiến hóa (evolver).