Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 2 phút đọc

Claude Fable 5 đánh bại GPT-5.5 trên bài test toán FrontierMath siêu khó 🧠

AI mới của Anthropic đạt độ chính xác tới 88% ở cấp độ khó nhất của FrontierMath, vượt qua OpenAI và đánh dấu bước tiến lớn trong tư duy toán học.

Tier 1 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc the-decoder.com

Anthropic vừa ghi nhận một cột mốc ấn tượng khi mô hình trí tuệ nhân tạo Claude Fable 5 đạt độ chính xác 88% trong các bài toán khó nhất thuộc bộ dữ liệu FrontierMath. Kết quả này vượt qua đối thủ GPT-5.5 của OpenAI khoảng 13 điểm phần trăm, tạo nên một bước nhảy vọt đáng kể trong cuộc đua năng lực suy luận phức tạp.

Diễn biến

Theo báo cáo từ The Decoder, điểm số của Claude Fable 5 thể hiện sự tiến bộ vượt bậc so với phiên bản tiền nhiệm Opus 4.5 vốn chỉ đạt dưới 10% vào đầu năm 2026. Trong khi đó, mô hình GPT-5.5 mới nhất của OpenAI đạt mức độ chính xác khoảng 75% trên cùng một phân khúc đề thi siêu khó. Sự bứt phá này cho thấy tốc độ cải tiến khả năng giải toán của các mô hình ngôn ngữ lớn (LLM) đang diễn ra nhanh hơn dự kiến.

Bối cảnh

FrontierMath được biết đến là một trong những bộ tiêu chuẩn khắt khe nhất hiện nay để đánh giá năng lực toán học chuyên sâu của AI. Các bài toán tại đây không chỉ đòi hỏi khả năng tính toán cơ học mà cần đến tư duy logic và suy luận trừu tượng cấp độ cao. Việc nâng tỷ lệ chính xác từ dưới 10% lên gần 90% chỉ trong thời gian ngắn cho thấy kiến trúc mô hình mới đã khắc phục tốt các điểm yếu về tính toán logic.

Vì sao đáng chú ý

Đối với cộng đồng công nghệ, kết quả này chứng minh rằng AI đang dần tiệm cận năng lực của các chuyên gia toán học thực thụ thay vì chỉ dừng lại ở mức hỗ trợ cơ bản. Dù cần thêm các thử nghiệm thực tế để kiểm chứng khả năng ứng dụng diện rộng, sự thống trị hiện tại của Claude Fable 5 trước OpenAI đang tái định hình lại bản đồ cạnh tranh trong phân khúc mô hình AI cao cấp.