LongCat vừa chính thức ra mắt một mô hình talking-avatar (avatar biết nói) mã nguồn mở mới, được đánh giá là đạt mức hiệu suất hàng đầu (SOTA) hiện nay. Mô hình đi kèm giấy phép MIT, cho phép cộng đồng phát triển và ứng dụng rộng rãi trong các sản phẩm thương mại.
Bối cảnh
Sự kiện này đánh dấu một bước tiến quan trọng trong lĩnh vực sinh video từ khuôn mặt. Nhóm phát triển cũng đã phát hành một không gian trải nghiệm (Space) trên Hugging Face để cộng đồng có thể dùng thử trực tiếp. Với giấy phép MIT, rào cản pháp lý được gỡ bỏ, mở đường cho các dự án sáng tạo từ giáo dục đến giải trí.
Vì sao đáng chú ý
Độ ấn tượng của mô hình mở ra nhiều cơ hội kinh doanh mới như xây dựng gia sư AI có khuôn mặt sống động, hệ thống lồng tiếng tự động (dubbing) hay các agent lập trình có khả năng giao tiếp qua video. Việc một mô hình chất lượng cao như vậy được mở nguồn giúp các startup Việt Nam dễ dàng tiếp cận và tùy biến mà không phụ thuộc vào các API đóng đắt đỏ.