Microsoft vừa chính thức phát hành Lens, một mô hình text-to-image mới, trên nền tảng Hugging Face, hướng tới hiệu quả trong huấn luyện và chất lượng ảnh đầu ra cao.
Diễn biến
Mô hình Lens có kích thước 3,8 tỷ tham số, được thiết kế để cân bằng giữa chi phí tính toán và khả năng sinh ảnh chi tiết. Điểm nổi bật của Lens là khả năng tạo ra hình ảnh có độ phân giải cao lên đến 1440x1440 pixel, đồng thời duy trì quy trình huấn luyện hiệu quả hơn so với các mô hình cùng phân khúc.
Vì sao đáng chú ý
Sự ra đời của Lens cho thấy xu hướng tối ưu hóa các mô hình generative AI để có thể chạy trên hạ tầng vừa phải mà vẫn giữ được chất lượng cao. Đối với các startup AI tại Việt Nam, Lens cung cấp thêm một lựa chọn mã nguồn mở mạnh mẽ để tích hợp vào các sản phẩm sáng tạo nội dung hoặc thiết kế.