AI tools-ai Tech 16 thg 6, 2026 4 phút đọc

AI Dễ Dàng Bị Tuyên Truyền Nga Lừa Gạt? 🤖 Điểm Chuẩn Mới Hé Lộ Sự Thật Đáng Báo Động!

Một điểm chuẩn mới của Viện Ngôn ngữ Estonia đã đánh giá mức độ các mô hình AI dễ bị tuyên truyền Nga lừa gạt, cho thấy các mô hình Claude của Anthropic vượt trội trong khi Mistral lại xếp hạng thấp.

Tier 2 · nguồn 99% độ tin cậy Auto-priority

Nguồn gốc the-decoder.com

🤖 AI Dễ Bị "Mắc Bẫy" Tuyên Truyền Nga Đến Mức Nào? Điểm Chuẩn Mới "Lật Tẩy" Sự Thật!

Viện Ngôn ngữ Estonia vừa công bố một điểm chuẩn (benchmark) đột phá nhằm đo lường mức độ dễ bị ảnh hưởng của các mô hình ngôn ngữ AI trước các chiến dịch tuyên truyền của Nga. Nghiên cứu này đặt ra câu hỏi quan trọng về khả năng phân biệt thông tin sai lệch của trí tuệ nhân tạo, đặc biệt trong bối cảnh địa chính trị phức tạp hiện nay.

🧪 Phương Pháp Đánh Giá Chặt Chẽ

Cuộc thử nghiệm đã kiểm tra 60 mô hình AI với tổng cộng 75 câu hỏi được đưa ra bằng ba ngôn ngữ khác nhau, bao gồm 14 câu chuyện tuyên truyền phổ biến. Các câu hỏi được thiết kế với ba sắc thái: trung lập, có định kiến và mang tính thao túng. Mỗi câu trả lời của mô hình sẽ được chấm điểm từ 1 đến 5, trong đó điểm 1 cho thấy mô hình lặp lại các luận điểm của Nga – một dấu hiệu đáng báo động về việc tiếp nhận thông tin sai lệch.

Để đảm bảo tính khách quan, mô hình Claude Opus 4.5 đã được hiệu chỉnh và sử dụng làm công cụ đánh giá, đồng thời được xác thực bởi các chuyên gia chống tin giả từ tổ chức Propastop. Quan trọng hơn, trong quá trình thử nghiệm, các mô hình AI không được phép truy cập internet hay bất kỳ công cụ bên ngoài nào, đảm bảo rằng điểm chuẩn này chỉ phản ánh khả năng nội tại của mô hình trong việc nhận diện và bác bỏ tuyên truyền.

🏆 Ai Dẫn Đầu Cuộc Đua Chống Tin Giả?

Không ngoài dự đoán, các mô hình của Anthropic đã khẳng định vị thế dẫn đầu trong việc phát hiện thông tin sai lệch từ Nga. Cụ thể, Claude Fable 5 (hiện chỉ khả dụng ngoài Hoa Kỳ) đạt điểm số ấn tượng 95.2, theo sau là Claude Opus 4.7. Đây là một tín hiệu tích cực cho Anthropic trong cuộc chiến chống lại tin giả.

Các vị trí tiếp theo thuộc về Nemotron 3 của Nvidia và Qwen 3.6 Plus của Alibaba, cho thấy nỗ lực của nhiều "ông lớn" công nghệ trong việc xây dựng AI đáng tin cậy.

📉 "Cú Vấp" Đáng Tiếc Của Mistral AI

Tuy nhiên, không phải tất cả các mô hình đều thể hiện tốt. Các mô hình của Mistral, bao gồm cả phiên bản mới nhất Medium 3.5, lại nằm trong nhóm một phần ba cuối bảng. Kết quả này đặc biệt gây thất vọng khi Mistral đang định vị mình là một lựa chọn thay thế châu Âu cho các nhà cung cấp từ Mỹ và Trung Quốc, và hiện đang trong quá trình đàm phán vòng gọi vốn 3 tỷ euro với định giá 20 tỷ euro.

Kết quả này cũng tương đồng với một nghiên cứu của Newsguard trước đó, cho thấy Mistral có tỷ lệ thông tin sai lệch ổn định ở mức 36.67%. Điều này đặt ra câu hỏi lớn về khả năng cạnh tranh và độ tin cậy của các mô hình chủ lực của Mistral, đặc biệt khi chúng đã phải vật lộn để bắt kịp các đối thủ.

⚠️ Mối Đe Dọa Từ Tuyên Truyền Nga Là Có Thật

Nghiên cứu này một lần nữa khẳng định rằng mối đe dọa từ tuyên truyền và thông tin sai lệch là rất hiện hữu. Các mạng lưới của Nga như "Pravda" đang chủ động "nuôi dưỡng" các hệ thống AI bằng hàng triệu bài viết sai sự thật. Gần đây, OpenAI cũng đã phải chặn một chiến dịch của Nga sử dụng ChatGPT để phát tán tuyên truyền trước cuộc bầu cử liên bang ở Đức.

Việc các mô hình AI có khả năng bị thao túng bởi thông tin sai lệch cho thấy một lỗ hổng nghiêm trọng, đòi hỏi các nhà phát triển và người dùng phải hết sức cảnh giác. Việc xây dựng AI có khả năng phân biệt sự thật và tuyên truyền sẽ là chìa khóa để bảo vệ không gian thông tin trong tương lai. 🌍