Chào mừng đến với Kalera News! Hôm nay, chúng ta sẽ bóc tách một chiến lược định giá đầy 'khéo léo' của Anthropic với mô hình mới nhất của họ.
Claude Sonnet 5: Tăng Giá 'Ngầm' Sau Tỷ Lệ Token Không Đổi?
Nguồn: The Decoder Ngày: 1 tháng 7 năm 2026
Theo một báo cáo từ The Decoder, dù Claude Sonnet 5 của Anthropic được công bố với mức giá token trên giấy tờ không đổi so với phiên bản tiền nhiệm, nhưng các thử nghiệm độc lập của Artificial Analysis đã phơi bày một sự thật gây sốc: mô hình này tiêu tốn token nhiều hơn đáng kể, khiến chi phí thực tế cho mỗi tác vụ đắt đỏ hơn cả mô hình cao cấp Opus 4.8 của chính Anthropic! 🤯 Sự tăng vọt chi phí này đến từ sự kết hợp của một bộ mã hóa (tokenizer) 'dày đặc' hơn và hành vi 'agentic' cao, chạy nhiều vòng lặp hơn đáng kể cho mỗi tác vụ.
Hiệu Năng vs. Chi Phí: Thực Tế Phũ Phàng! 💸
Trên lý thuyết, giá Sonnet 5 khớp với Sonnet 4.6. Tuy nhiên, trong các bài kiểm tra thực tế (như Artificial Analysis Intelligence Index), chi phí thực sự cho mỗi tác vụ lại kể một câu chuyện hoàn toàn khác:
| Mô hình | Giá Trên Giấy (Đầu vào / Đầu ra mỗi triệu token) | Chi phí Thực Tế mỗi Tác Vụ | | :--- | :--- | :--- | | Claude Sonnet 4.6 | $3.00 / $15.00 | $1.20 | | Claude Opus 4.8 | $5.00 / $25.00 | $1.97 | | Claude Sonnet 5 | $3.00 / $15.00* | $2.29 |
Lưu ý: Anthropic đang áp dụng mức giá khuyến mãi $2/$10 mỗi triệu token đến ngày 1 tháng 9 năm 2026, nhưng phân tích này sử dụng mức giá tiêu chuẩn.
#### Tại Sao Sonnet 5 Lại Đắt Đỏ Hơn? 🤔
1. Lượng Đầu Ra Tăng Vọt: Ở cài đặt hiệu suất tối đa ("max"), Sonnet 5 tiêu thụ khoảng 40% token đầu ra nhiều hơn mỗi tác vụ so với Sonnet 4.6. 2. Hành Vi "Agentic" Mạnh Mẽ Hơn: Trong các bài kiểm tra công việc tri thức dựa trên agent (như AA-Briefcase và GDPval-AA), Sonnet 5 chạy số vòng lặp agent gấp ba lần so với phiên bản tiền nhiệm.
Bảng Xếp Hạng Hiệu Năng Benchmark 🏆
Trong Chỉ Số Thông Minh Artificial Analysis v4.1, Claude Sonnet 5 đạt 53 điểm, đứng vị trí thứ năm chung cuộc.
#### Bảng Xếp Hạng Chỉ Số Thông Minh:
1. Claude Fable 5: 60 điểm (Lưu ý: Mới được khôi phục khả dụng toàn cầu sau hai tuần bị chính phủ cấm vì lỗi "jailbreak") 2. Claude Opus 4.8: 56 điểm 3. GPT-5.5 (xhigh): 55 điểm 4. Claude Opus 4.7: 54 điểm 5. Claude Sonnet 5 / GPT-5.5 (high) [Đồng hạng]: 53 điểm
#### Kết Quả Benchmark Cụ Thể:
* CritPt (Lý luận vật lý tiên phong): Đạt 17% (tăng 14 điểm so với Sonnet 4.6, nhưng vẫn kém GLM-5.2, Claude Opus, Fable và GPT-5.5 cao cấp). * Terminal-Bench v2.1: +9 điểm so với Sonnet 4.6. * Humanity's Last Exam: +10 điểm so với Sonnet 4.6. * SciCode: +7 điểm so với Sonnet 4.6.
Mô Hình Tăng Giá 'Ngầm' Của Anthropic: Một Lịch Sử Lặp Lại! 🤫
Đây không phải là lần đầu tiên Anthropic thực hiện việc tăng giá hiệu quả trong khi vẫn giữ nguyên tỷ lệ token danh nghĩa:
* Tiền Lệ Opus 4.7: Khi Opus 4.7 ra mắt, Anthropic đã giới thiệu một bộ mã hóa mới, cắt cùng một văn bản thành "khoảng 30% token nhiều hơn". * Xác Minh Từ Nhà Phát Triển: Nhà phát triển Abhishek Ray đã đo lường được mức tăng 1.325x đến 1.47x trong việc tạo token cho các lời nhắc (prompt) giống hệt nhau, trong khi một phân tích cộng đồng từ hơn 483 lượt gửi cho thấy mức tăng trung bình 37.4% token trên mỗi yêu cầu.
> "Các mô hình của Anthropic liên tục đắt đỏ hơn qua mỗi thế hệ, đôi khi tăng đáng kể, nhưng bảng giá chính thức lại không phản ánh điều đó. Kiểu tăng chi phí ẩn này rất khó chấp nhận khi các đối thủ cạnh tranh Trung Quốc như Deepseek V4 Pro và GLM-5.2 cung cấp hiệu suất cạnh tranh với một phần nhỏ chi phí..." - The Decoder bình luận về chiến lược này.
Ảnh Hưởng Thị Trường & Nhu Cầu Về Các Chỉ Số Mới 📊
Khi các mô hình AI agentic thực hiện nhiều vòng lặp suy luận tự động hơn "sau hậu trường", việc định giá dựa trên số lượng token thô đang dần mất đi tính hữu ích như một chỉ số kinh doanh.
* Cạnh Tranh Giá Rẻ Ấn Tượng: Các đối thủ như Deepseek V4 Pro và GLM-5.2 đang cung cấp hiệu suất tầm trung cực kỳ cạnh tranh. Deepseek thậm chí đã áp dụng vĩnh viễn mức chiết khấu 75%, định giá token đầu ra của họ thấp hơn ít nhất 34 lần so với GPT-5.5. * Kêu Gọi Hành Động Từ Ngành: Ngành công nghiệp AI cần chuyển sang các mô hình định giá minh bạch hơn, chẳng hạn như chi phí trên mỗi tác vụ tiêu chuẩn hoặc chi phí trên mỗi công việc thực tế, thay vì chỉ dựa vào số lượng token thô. Đây là lúc cần thay đổi để người dùng có cái nhìn rõ ràng hơn về chi phí thực sự! 💡