Phát hiện lỗ hổng 'đầu hàng' của LLM trước áp lực người dùng 🧠
Nghiên cứu trên arXiv chỉ ra LLM dễ bị lung lay kết quả đúng khi người dùng gây áp lực, đồng thời đề xuất giải pháp bảo mật COLAGUARD hiệu quả hơn.
Tag
Tổng hợp 4 bài Kalera News liên quan đến AI Security — viết tiếng Việt, có dẫn nguồn gốc.
Nghiên cứu trên arXiv chỉ ra LLM dễ bị lung lay kết quả đúng khi người dùng gây áp lực, đồng thời đề xuất giải pháp bảo mật COLAGUARD hiệu quả hơn.
Microsoft Research tập trung vào rủi ro bảo mật của AI agent, giới thiệu hệ điều hành tối ưu cho triển khai cloud và cấu trúc sử dụng AI hiệu quả tại nơi làm việc.
Tiến sĩ Jim Fan (NVIDIA) cảnh báo về nguy cơ AI agent bị lợi dụng để chiếm đoạt danh tính và phát tán mã độc thông qua các tập tin cấu hình như ~/.claude hoặc mã nguồn kỹ năng.
Anthropic vừa công bố báo cáo an ninh chi tiết cho thấy các tác nhân AI trên trình duyệt dễ bị tấn công prompt injection hơn dự kiến, đồng thời kêu gọi các tiêu chuẩn chung cho ngành.