DynaSchedBench: Giải mã 'Nghịch lý Quan sát' của LLM trong lập lịch động
Nghiên cứu mới giới thiệu DynaSchedBench, bộ benchmark chuẩn hóa cho bài toán lập lịch công việc động (DFJSP), vạch trần hạn chế của các agent AI khi tiếp cận quá nhiều dữ liệu.
Nguồn arxiv.org