Tóm tắt nhanh
Tốc độ phát triển của Local AI đang khiến giới công nghệ phấn khích. Thử nghiệm thực tế cho thấy mô hình Qwen 3.6 (phiên bản 27B và 35B) có thể chạy cực nhanh trên các dòng phần cứng phổ thông như AMD hay NVIDIA RTX 4070, xóa bỏ nghi ngờ về khả năng triển khai AI mạnh mẽ tại chỗ.
Điểm đáng chú ý
- Hiệu suất ấn tượng: 87 tok/s (Qwen 3.6 27B trên AMD) và 70 tok/s (Qwen 3.6 35B trên RTX 4070 12GB). - Xu hướng Local: Khẳng định tương lai của AI nằm ở việc xử lý cục bộ, đảm bảo quyền riêng tư và tốc độ. - Tiến triển nhanh: Khả năng tối ưu hóa phần mềm và phần cứng đang diễn ra với tốc độ chóng mặt.