Hugging Face vừa giới thiệu một mô hình lập luận (reasoning model) có kích thước 30B-A3B, ghi nhận kết quả ấn tượng đạt cấp độ huy chương vàng trong các kỳ đánh giá Olympic Vật lý (IPhO) và Toán học (IMO/USAMO).
Diễn biến
Mô hình này đạt được kết quả "Gold-medal level" trực tiếp tại IPhO, và tại IMO/USAMO thông qua cơ chế tự xác thực (self-verification) và tinh chỉnh (refinement) trong thời gian chạy thử nghiệm (test-time). Thành công này đến từ một "công thức scaling" đơn giản và thống nhất dành cho việc tìm kiếm các chứng minh (proof search), giúp mô hình giải quyết được các bài toán phức tạp đòi hỏi tư duy logic cao.
Vì sao đáng chú ý
Việc các mô hình ngôn ngữ lớn (LLM) chinh phục được các kỳ thi đỉnh cao như IMO và IPhO cho thấy sự tiến bộ vượt bậc trong khả năng lập luận logic của AI. Đối với cộng đồng nghiên cứu và phát triển AI tại Việt Nam, đây là minh chứng cho việc tối ưu hóa thuật toán tìm kiếm và scaling có thể tạo ra đột phá về trí tuệ mà không nhất thiết phải dựa hoàn toàn vào việc tăng quy mô tham số một cách cực đoan.