OpenAI, gã khổng lồ AI, vừa chính thức hé lộ dòng mô hình thế hệ kế tiếp của mình, GPT-5.6, bắt đầu với bản xem trước giới hạn dành cho các đối tác đáng tin cậy qua Codex và API.
Gia Đình Mô Hình GPT-5.6: Ba Tầng Sức Mạnh 💥
Không giống các bản phát hành trước, OpenAI ra mắt thế hệ GPT-5.6 với ba tầng riêng biệt, được thiết kế để phù hợp với các khối lượng công việc và cấu hình chi phí khác nhau:
* GPT-5.6 Sol ($5.00 / 1M input, $30.00 / 1M output): Mô hình tiên phong hàng đầu của OpenAI và là hệ thống AI mạnh mẽ nhất của họ cho đến nay. Sol sở hữu "chế độ suy luận tối đa" (max reasoning mode) mới, cho phép mô hình dành nhiều thời gian tính toán hơn để giải quyết các thách thức phức tạp về lập kế hoạch, lập trình và toán học. * GPT-5.6 Terra ($2.50 / 1M input, $15.00 / 1M output): Một mô hình cân bằng được thiết kế cho các quy trình làm việc hàng ngày hiệu quả, mang lại hiệu suất tương đương GPT-5.5 với mức giá giảm đáng kể. * GPT-5.6 Luna ($1.00 / 1M input, $6.00 / 1M output): Mô hình nhanh nhất và giá cả phải chăng nhất trong gia đình GPT-5.6, được tối ưu hóa cho các tác vụ khối lượng lớn, độ trễ thấp.
Suy Luận Nâng Cao, Lập Trình Tác Tử & Điểm Chuẩn Kỹ Thuật 🧠
GPT-5.6 Sol thiết lập một tiêu chuẩn mới trên nhiều điểm chuẩn có độ phức tạp cao, thể hiện những bước nhảy vọt đáng kể trong suy luận và sử dụng công cụ:
* Lập trình & Phối hợp công cụ: Trên Terminal-Bench 2.1, vốn kiểm tra quy trình làm việc tác tử dòng lệnh yêu cầu lập kế hoạch đa bước phức tạp, thực thi lặp lại và phối hợp các công cụ CLI khác nhau, GPT-5.6 Sol vượt trội so với tất cả các mô hình tiên phong khác. * Bộ gen & Sinh học: Trên GeneBench v1, một điểm chuẩn đánh giá các phân tích sinh học và bộ gen định lượng dài hạn, GPT-5.6 Sol đạt được kết quả mạnh mẽ hơn GPT-5.5 trong khi sử dụng ít token hơn đáng kể. * An ninh mạng: Trên ExploitBench, GPT-5.6 Sol mang lại hiệu suất an ninh mạng cạnh tranh so với các mô hình chuyên biệt như Mythos Preview, nhưng chỉ hoạt động với 1/3 chi phí token. Trên ExploitGym của UC Berkeley, các mô hình Sol, Terra và Luna thể hiện khả năng an ninh mạng mạnh mẽ khi sức mạnh tính toán suy luận tăng lên.
Nâng Cấp Giá Cả & Bộ Đệm Lời Nhắc (Prompt Caching) 💰
Để hỗ trợ các yêu cầu ngữ cảnh khổng lồ của các quy trình làm việc tác tử, OpenAI đang giới thiệu các cải tiến bộ nhớ đệm lời nhắc rõ ràng trong GPT-5.6. Các mô hình hiện hỗ trợ các điểm ngắt bộ đệm rõ ràng và thời gian lưu trữ tối thiểu là 30 phút.
Theo cấu trúc thanh toán mới: * Đọc từ bộ đệm lời nhắc được giảm giá 90%. * Ghi vào bộ đệm lời nhắc được tính phí ở mức 1.25 lần tỷ lệ đầu vào không có bộ đệm.
An Toàn Triển Khai & Hợp Tác 🤝
Trong tài liệu System Card đi kèm, OpenAI lưu ý rằng mặc dù GPT-5.6 Sol cho thấy những cải tiến mạnh mẽ về khả năng, nó vẫn được căn chỉnh chặt chẽ với các giao thức an toàn. Trong thử nghiệm của Irregular, GPT-5.6 Sol đã chứng minh khả năng mạnh mẽ trong phòng thủ an ninh (xác định và vá lỗi lỗ hổng) nhưng vẫn an toàn trước các cuộc tấn công mạng đầu cuối, không bao giờ vượt qua ngưỡng an toàn "Cyber Critical" theo Khung Chuẩn Bị của OpenAI.
Ngoài ra, OpenAI đã hợp tác với Cerebras để triển khai GPT-5.6 Sol trên phần cứng CS-3 của Cerebras vào tháng 7, với tốc độ dự kiến đạt tới 750 token mỗi giây (tps) đáng kinh ngạc, mở ra những giới hạn mới cho các quy trình làm việc tác tử theo thời gian thực.