vLLM nâng cấp lên phiên bản V1: Ưu tiên tính chính xác để tối ưu chi phí GPU ⚡
ServiceNow AI và Hugging Face chính thức nâng cấp thư viện vLLM từ V0 lên V1, tập trung vào việc cải thiện độ chính xác trong học tăng cường (RL) giúp giảm đáng kể chi phí hạ tầng.
Nguồn huggingface.co