Cộng đồng AI vừa đón nhận physics-intern, một framework (harness) được thiết kế riêng để tối ưu khả năng giải quyết các vấn đề khoa học cho LLM. Kết quả thử nghiệm cho thấy những bước tiến ấn tượng về độ chính xác.
Diễn biến
Theo báo cáo từ dự án, physics-intern giúp Gemini 3.1 Pro tăng điểm số từ 17.7 lên 31.4, vượt qua cả GPT 5.5 Pro trong các bài test chuyên sâu. Framework này hoạt động bằng cách bao bọc mô hình gốc và sử dụng một subagent chuyên trách để thúc đẩy quá trình suy luận (reasoning) thay vì chỉ dựa vào khả năng dự đoán từ tiếp theo thông thường.
Vì sao đáng chú ý
Đây là minh chứng cho thấy cấu trúc hệ thống (agentic workflow) quan trọng không kém gì kích thước mô hình. Đối với các kỹ sư và nhà nghiên cứu tại Việt Nam, giải pháp này mở ra hướng đi mới: thay vì chờ đợi mô hình lớn hơn, chúng ta có thể tối ưu hóa các mô hình hiện có thông qua các harness chuyên dụng để giải quyết các bài toán kỹ thuật khó.