Thị trường AI đang chứng kiến sự cạnh tranh quyết liệt về tốc độ thực thi. Anthropic vừa cập nhật Claude Code với chế độ "Fast mode", trong khi Google Gemini Flash 3.2 đang được người dùng chuyên nghiệp đánh giá cao về hiệu quả chi phí và hiệu suất.
Diễn biến
Theo Anthropic, chế độ Fast mode mặc định sử dụng mô hình Opus 4.7, mang lại tốc độ phản hồi nhanh hơn 2,5 lần so với thông thường. Người dùng có thể kích hoạt bằng lệnh /fast, đổi lại chi phí trên mỗi token sẽ cao hơn. Ở một diễn biến khác, chuyên gia Bindu Reddy từ Abacus.ai cho biết họ đã chuyển 70% các tác vụ tự động từ GPT sang Gemini Flash 3.2 vì mô hình của Google đã đủ mạnh và nhanh để thay thế các mô hình lớn hơn.
Vì sao đáng chú ý
Cuộc đua hiện tại không chỉ dừng lại ở "AI thông minh nhất" mà đã chuyển sang "AI hiệu quả nhất". Với các lập trình viên Việt Nam, Claude Code Fast mode sẽ giúp giảm thời gian chờ đợi khi code. Đồng thời, sự phổ biến của Gemini Flash 3.2 cho thấy Google đang thành công trong việc chiếm lĩnh phân khúc mô hình nhỏ, nhanh, giá rẻ – vốn là lựa chọn ưu tiên của các startup đang tối ưu hóa chi phí vận hành.