Cognitive Lab ra mắt bộ dữ liệu tài liệu mở NayanaOCR với 1 triệu ảnh 📄
Bộ dữ liệu NayanaOCR chứa hơn 1 triệu ảnh tài liệu trên 22 ngôn ngữ, hỗ trợ tối ưu hóa hiệu quả các mô hình OCR đa ngôn ngữ và đa nhiệm.
Nguồn x.com
Tag
Tổng hợp 2 bài Kalera News liên quan đến Dataset — viết tiếng Việt, có dẫn nguồn gốc.
Bộ dữ liệu NayanaOCR chứa hơn 1 triệu ảnh tài liệu trên 22 ngôn ngữ, hỗ trợ tối ưu hóa hiệu quả các mô hình OCR đa ngôn ngữ và đa nhiệm.
Hugging Face Dataset Leaderboard vừa bổ sung tính năng lọc kết quả benchmark theo dải tham số (parameter range), giúp người dùng dễ dàng tìm kiếm model tối ưu theo kích thước phần cứng.