Tag

#Llama CPP

Tổng hợp 4 bài Kalera News liên quan đến Llama CPP — viết tiếng Việt, có dẫn nguồn gốc.

AI · tools-ai 8 thg 6, 2026

llama.cpp hỗ trợ Multi-Token Prediction cho Qwen3.6: Bước nhảy vọt về hiệu năng

Cột mốc mới cho AI cục bộ khi llama.cpp chính thức hỗ trợ Multi-Token Prediction (MTP) cho dòng Qwen3.6, giúp tăng tốc độ xử lý vượt bậc trên phần cứng phổ thông.

Nguồn x.com

AI 30 thg 5, 2026

Llama.cpp ra mắt trang chủ chính thức - Tối ưu trải nghiệm chạy AI cục bộ

Llama.cpp chính thức ra mắt website llama.app kèm trình cài đặt đa nền tảng chỉ bằng một dòng lệnh, giúp việc tiếp cận AI chạy trên máy cá nhân trở nên dễ dàng hơn bao giờ hết.

Nguồn x.com

AI 25 thg 5, 2026

Llama.cpp hỗ trợ MTP: Tăng tốc AI cục bộ thêm 78% 🚀

Bản cập nhật llama.cpp hỗ trợ Multi-Token Prediction (MTP) giúp mô hình Qwen3.6-27B đạt tốc độ 45 token/giây trên phần cứng tầm trung, thúc đẩy xu hướng tự vận hành AI.

Nguồn x.com

AI 22 thg 5, 2026

llama.cpp ra mắt Model Router: Thay thế hoàn toàn Ollama cho việc chuyển đổi mô hình

Bản cập nhật mới của llama.cpp tích hợp sẵn bộ điều hướng mô hình (Model Router), cho phép chuyển đổi tức thì giữa các mô hình trên đĩa mà không cần khởi động lại server.

Nguồn x.com