PrismML chính thức công bố Bonsai Image 4B, một dòng mô hình tạo ảnh mới được tối ưu hóa đặc biệt cho các thiết bị cá nhân, từ máy tính xách tay đến điện thoại di động.
Bối cảnh
Các mô hình tạo ảnh truyền thống thường đòi hỏi GPU mạnh mẽ và dung lượng VRAM lớn, gây khó khăn cho việc triển khai trên thiết bị đầu cuối. Bonsai Image 4B giải quyết vấn đề này bằng cách sử dụng kiến trúc 1-bit và Ternary (tam phân). Kỹ thuật này giúp nén trọng số mô hình cực mạnh mà vẫn giữ được chất lượng hình ảnh đáng kể.
Diễn biến
Theo PrismML, dòng mô hình này được thiết kế để chạy suy luận khuếch tán (diffusion inference) tốc độ cao mà không cần kết nối đám mây. Việc đưa mô hình 4 tỷ tham số xuống môi trường 1-bit giúp giảm đáng kể mức tiêu thụ điện năng và tài nguyên tính toán, biến việc tạo ảnh AI trở nên riêng tư và tức thời hơn.
Vì sao đáng chú ý
Đối với người dùng tại Việt Nam, xu hướng "AI cục bộ" (Local AI) đang ngày càng quan trọng do lo ngại về quyền riêng tư và chi phí duy trì API. Bonsai Image 4B mở ra cơ hội cho các nhà phát triển ứng dụng di động tích hợp khả năng sáng tạo hình ảnh trực tiếp vào app mà không phụ thuộc vào hạ tầng server đắt đỏ.