Marlin-2B: Mô hình Vision-Language siêu nhỏ giúp trích xuất thông tin từ video
Marlin-2B là mô hình VLM mã nguồn mở chỉ với 2 tỷ tham số nhưng có khả năng phân tích video mạnh mẽ, cạnh tranh trực tiếp với các mô hình lớn hơn như Gemini-2.5-flash.
Nguồn x.com