🚨 Bê Bối AI Chấn Động: Rio-3.5-Open-397B Là Hàng Đạo Nhái Hay Tự Đào Tạo?
Cộng đồng AI toàn cầu đang xôn xao trước một bê bối lớn liên quan đến mô hình ngôn ngữ lớn (LLM) mang tên prefeitura-rio/Rio-3.5-Open-397B. Mô hình này được công ty CNTT đô thị của chính quyền Rio de Janeiro (IplanRIO) công bố gần đây, tự hào là một mô hình 397B được "tự đào tạo" với kỹ thuật tiên tiến. Tuy nhiên, các phân tích kỹ thuật chuyên sâu từ tổ chức Nex-AGI đã chỉ ra một sự thật gây sốc: Rio-3.5-Open-397B thực chất là một sản phẩm đạo nhái hoàn toàn, được tạo ra bằng cách trộn trực tiếp (element-wise merge) các trọng số của mô hình Nex-N2 Pro 397B và mô hình cơ sở Qwen3.5-397B-A17B của Alibaba, theo tỷ lệ khoảng 0,6 Nex / 0,4 Qwen, mà không hề có bất kỳ dấu vết tự đào tạo hay tinh chỉnh nào!
🕵️♀️ Bằng chứng không thể chối cãi #1: Mô hình tự "tố cáo" danh tính thật
Một trong những bằng chứng mạnh mẽ nhất đến từ việc gỡ bỏ prompt hệ thống được mã hóa cứng "You are Rio" (Bạn là Rio). Khi không bị ràng buộc bởi prompt này, mô hình Rio-3.5-Open-397B đã tự nhận là "Nex, đến từ Nex-AGI" trong 79% số lần thử nghiệm, trong khi tỷ lệ tự nhận là "Rio" chỉ là 0%. Đáng chú ý hơn, mô hình còn có thể đọc vanh vách lịch sử thành lập và câu chuyện thương hiệu độc quyền của Nex-AGI từng chữ một. Điều này rõ ràng chứng minh rằng IplanRIO chỉ thực hiện trộn mô hình (weight interpolation) và đã "quên" làm sạch hoặc đào tạo lại danh tính của mô hình, khiến phần căn chỉnh (alignment) và nhận diện của Nex-N2 Pro chiếm ưu thế hoàn toàn.
📊 Bằng chứng không thể chối cãi #2: Phân tích nội suy Tensor trọng số tinh vi
Phân tích sâu hơn về kiến trúc và trọng số của Rio-3.5-Open-397B càng củng cố thêm cáo buộc đạo nhái. Mọi tensor trọng số (weight tensor) trong mô hình này đều tuân theo một tỷ lệ tuyến tính chính xác 0,6 Nex / 0,4 Qwen, với độ lệch chuẩn cực kỳ nhỏ trên hàng nghìn phân phối tiêu chuẩn. Hiện tượng này xảy ra đồng nhất trên toàn bộ 60 lớp mạng và mọi thành phần cấu tạo (bao gồm ma trận chiếu tự chú ý self-attention, các lớp MLP và cổng projection). Các chuyên gia nhấn mạnh rằng, các mô hình tự tinh chỉnh thông thường không thể nào được giải thích bằng phép nội suy tuyến tính hoàn hảo đến mức độ như vậy, điều này chỉ có thể xảy ra khi một mô hình được tạo ra bằng cách trộn trọng số trực tiếp từ các mô hình khác.
🔔 Hồi chuông cảnh tỉnh cho các dự án AI công cộng
Trước bê bối này, IplanRIO từng tự hào tuyên bố mô hình Rio 3.5 Open 397B của họ vượt trội hơn cả Qwen 3.7 Plus của gã khổng lồ Alibaba trên 4 trong 5 bài kiểm tra benchmark, đặc biệt là Terminal-Bench 2.1 nhờ kỹ thuật "SwiReasoning" tự phát triển. Giờ đây, bê bối "lấy râu ông nọ cắm cằm bà kia" này đã dấy lên những làn sóng chỉ trích gay gắt về tính trung thực học thuật và uy tín của các dự án AI do ngân sách công tài trợ. Đây là một lời nhắc nhở nghiêm khắc về tầm quan trọng của sự minh bạch, trách nhiệm giải trình và đạo đức trong phát triển AI, đặc biệt khi liên quan đến nguồn vốn công và niềm tin của cộng đồng. Sự việc này không chỉ làm ảnh hưởng đến hình ảnh của IplanRIO mà còn đặt ra câu hỏi lớn về tiêu chuẩn đạo đức và kiểm duyệt trong lĩnh vực AI đang phát triển như vũ bão.