Ra mắt PostTrainBench v1.0: Benchmark đánh giá AI agent trong giai đoạn hậu đào tạo
PostTrainBench v1.0 cung cấp bộ tiêu chuẩn mới để đo lường khả năng của các AI agent trong việc thực hiện các nhiệm vụ hậu đào tạo cho mô hình ngôn ngữ.
Nguồn x.com