AI 6 thg 6, 2026 1 phút đọc

Microsoft ra mắt Lens — Mô hình Text-to-Image 3.8 tỷ tham số

Microsoft phát hành mô hình Lens trên Hugging Face, một model sinh ảnh từ văn bản với 3,8 tỷ tham số, hỗ trợ độ phân giải lên đến 1440x1440.

Tier 1 · nguồn 99% độ tin cậy Đã được duyệt

Microsoft Model Release Text TO Image Huggingface

Nguồn gốc x.com

Microsoft vừa chính thức phát hành Lens, một mô hình text-to-image mới, trên nền tảng Hugging Face, hướng tới hiệu quả trong huấn luyện và chất lượng ảnh đầu ra cao.

Diễn biến

Mô hình Lens có kích thước 3,8 tỷ tham số, được thiết kế để cân bằng giữa chi phí tính toán và khả năng sinh ảnh chi tiết. Điểm nổi bật của Lens là khả năng tạo ra hình ảnh có độ phân giải cao lên đến 1440x1440 pixel, đồng thời duy trì quy trình huấn luyện hiệu quả hơn so với các mô hình cùng phân khúc.

Vì sao đáng chú ý

Sự ra đời của Lens cho thấy xu hướng tối ưu hóa các mô hình generative AI để có thể chạy trên hạ tầng vừa phải mà vẫn giữ được chất lượng cao. Đối với các startup AI tại Việt Nam, Lens cung cấp thêm một lựa chọn mã nguồn mở mạnh mẽ để tích hợp vào các sản phẩm sáng tạo nội dung hoặc thiết kế.