AI tools-ai 8 thg 6, 2026 1 phút đọc

physics-intern: Framework giúp Gemini 3.1 Pro 'vượt mặt' GPT 5.5 Pro trong khoa học

Một công cụ mới mang tên physics-intern giúp các mô hình ngôn ngữ lớn như Gemini 3.1 Pro tăng mạnh hiệu suất giải quyết các bài toán vật lý và khoa học nhờ cơ chế subagent chuyên dụng.

Tier 1 · nguồn 99% độ tin cậy Đã được duyệt

Gemini Physics Intern Reasoning Benchmark Open Source

Nguồn gốc x.com

Cộng đồng AI vừa đón nhận physics-intern, một framework (harness) được thiết kế riêng để tối ưu khả năng giải quyết các vấn đề khoa học cho LLM. Kết quả thử nghiệm cho thấy những bước tiến ấn tượng về độ chính xác.

Diễn biến

Theo báo cáo từ dự án, physics-intern giúp Gemini 3.1 Pro tăng điểm số từ 17.7 lên 31.4, vượt qua cả GPT 5.5 Pro trong các bài test chuyên sâu. Framework này hoạt động bằng cách bao bọc mô hình gốc và sử dụng một subagent chuyên trách để thúc đẩy quá trình suy luận (reasoning) thay vì chỉ dựa vào khả năng dự đoán từ tiếp theo thông thường.

Vì sao đáng chú ý

Đây là minh chứng cho thấy cấu trúc hệ thống (agentic workflow) quan trọng không kém gì kích thước mô hình. Đối với các kỹ sư và nhà nghiên cứu tại Việt Nam, giải pháp này mở ra hướng đi mới: thay vì chờ đợi mô hình lớn hơn, chúng ta có thể tối ưu hóa các mô hình hiện có thông qua các harness chuyên dụng để giải quyết các bài toán kỹ thuật khó.