Định Tuyến Định Nghĩa Trước Định Tuyến Năng Lực: Một Khung Khoa Học Thiết Kế Để Đánh Giá Các Khẳng Định Về AGI (DAF-AGI) 🧐
* Tác giả: J. E. Aguilera Briones (Nghiên cứu sinh hậu tiến sĩ, Đại học Nghiên cứu Quốc tế Mexico) * Nguồn: arXiv:2606.12713v1 (Phiên bản in sẵn 1.7, tháng 6 năm 2026)
---
Tóm Lược Điều Hành 💡
Thuật ngữ Trí tuệ Tổng Quát Nhân tạo (AGI) hiện đang thiếu một định nghĩa duy nhất, thống nhất và ổn định. Các định nghĩa và tiêu chuẩn đánh giá cạnh tranh nhau đã đưa ra những phán quyết "có" và "không" mâu thuẫn đối với cùng một hệ thống AI. Bài viết này xem xét sự thiếu rõ ràng này như một vấn đề thiết kế và quản trị cực kỳ quan trọng.
Sử dụng Phương pháp Nghiên cứu Khoa học Thiết kế (DSRM), tác giả giới thiệu DAF-AGI (Khung Định Tuyến Định Nghĩa cho AGI), một khuôn frameworks khái niệm cấp độ hai được thiết kế để đánh giá sự phù hợp phán quyết của các định nghĩa AGI. Bài viết lập luận rằng sự định tuyến định nghĩa có tính ưu tiên logic so với sự định tuyến năng lực khi xét đến việc kích hoạt các quy định, quyền hợp đồng và chính sách công.
Bài viết cũng giới thiệu khái niệm chủ quyền định nghĩa—khả năng thể chế của các thể chế "tiếp nhận định nghĩa" (đặc biệt ở các quốc gia phía Nam bán cầu) để tranh luận, chứng nhận và sửa đổi các danh mục công nghệ nhập khẩu thay vì chấp nhận chúng một cách mù quáng từ các nhà phát triển thương mại.
---
Vấn Đề Cốt Lõi: AGI Không Có Tiêu Chuẩn Tham Chiếu Chung 🤯
Trong hai thập kỷ qua, lĩnh vực AI đã xem "AGI" như thể việc có thêm bằng chứng về năng lực sẽ làm rõ nghĩa của nó. Thay vào đó, thuật ngữ này lại nằm trên một ranh giới của những cam kết không tương thích.
Ba khuôn khổ nổi bật từ năm 2024–2025 minh họa sự phân kỳ này: 1. "Các cấp độ AGI" của Google DeepMind: Phân tách độ sâu hiệu suất khỏi bề rộng tính tổng quát, xếp các mô hình tiên tiến hiện tại vào "AGI Mới Nổi" (bậc thang đầu tiên) và dành "AGI Có Năng Lực" cho một giai đoạn mà chưa hệ thống công khai nào đạt được. 2. Đề xuất Trắc nghiệm Tâm lý (33 tác giả): Đặt nền tảng AGI trong lý thuyết Cattell-Horn-Carroll (CHC), định nghĩa nó là khả năng thích ứng nhận thức của một người trưởng thành có giáo dục tốt. Đề xuất này nhận thấy một hồ sơ "gồ ghề" ở các mô hình hiện tại: mạnh về kiến thức dày đặc, nhưng thiếu hụt nghiêm trọng về các bộ máy cơ bản như trí nhớ dài hạn. 3. ARC-AGI của François Chollet: Hoàn toàn bác bỏ hiệu suất, định nghĩa trí tuệ là hiệu quả của việc tiếp thu kỹ năng trong các nhiệm vụ mới lạ. Bài dự thi tốt nhất năm 2025 chỉ đạt 24% trên tập hợp các vấn đề riêng tư mà con người giải quyết dễ dàng.
> "Đây không phải là ba ước tính về một đại lượng. Chúng là ba đại lượng khác nhau."
Sức Mạnh Của Định Nghĩa 👑
Ai kiểm soát định nghĩa về AGI sẽ kiểm soát thời điểm tuyên bố "chúng ta đã đạt được". Thời điểm này kích hoạt hoặc trì hoãn quy định, sắp xếp lại các ưu tiên nghiên cứu công cộng, dịch chuyển giá trị thị trường và viết lại các hợp đồng thương mại (ví dụ: quyền cấp phép IP).
---
Khung DAF-AGI: Giải Pháp Tiên Phong 🛠️
DAF-AGI là một tạo tác khái niệm được thiết kế để làm cho các bất đồng định nghĩa trở nên rõ ràng, có thể so sánh và có thể quy kết. Nó bao gồm năm tiêu chí nhận thức được chấm điểm và một kiểm toán quản trị có cấu trúc.
1. Năm Tiêu Chí Nhận Thức (C1–C5)
Các định nghĩa được chấm điểm theo thứ tự là Cao (H), Một phần (P), hoặc Thấp (L):
* C1 — Khả năng Vận hành được: Định nghĩa có thể biến thành một bài kiểm tra mà các bên có thẩm quyền đồng ý về kết quả không? Nó yêu cầu các điều kiện áp dụng rõ ràng để một hệ thống có thể đạt hoặc không đạt. * C2 — Tính Tổng quát: Định nghĩa có xác định tính rộng khắp các miền khác nhau một cách vật chất là cấu thành không? Điều này phải được chỉ định từ trước thông qua một phân loại cố định hoặc yêu cầu chuyển giao sang các điều kiện không chuẩn bị, ngăn chặn người tuyên bố chọn phân phối nhiệm vụ thuận lợi sau đó. * C3 — Tính Rõ ràng về Quyền tự trị: Định nghĩa có nêu rõ liệu việc tự đặt mục tiêu có được yêu cầu, loại trừ hay phân cấp không? (Im lặng được chấm Thấp; bao gồm rõ ràng hoặc loại trừ rõ ràng đều được chấm Cao). * C4 — Tiêu chuẩn Tham chiếu & Chỉ định Lớp So sánh: Tiêu chuẩn cơ sở nào xác định thành tựu? Nếu tương đối với con người, nó phải chỉ rõ những con người nào (ví dụ: người trưởng thành trung bình, chuyên gia trong lĩnh vực, người trưởng thành có học thức) trong điều kiện chi phí và nỗ lực nào. * C5 — Tính Ổn định Thủ tục: Cùng một quy tắc có mang lại một cách giải thích có thể so sánh theo thời gian không? Các sửa đổi phải được đánh số phiên bản, có hiệu lực trong tương lai và bảo toàn nhật ký kiểm toán.
2. Kiểm Toán Quản Trị (C6) 📊
C6 không được chấm điểm theo thứ tự; nó là một bài đọc định tính có cấu trúc bao gồm năm thành phần: * Tác giả: Ai đã viết tiêu chí này? * Lợi ích Vật chất: Những lợi ích tài chính, quy định hoặc danh tiếng nào gắn liền với phán quyết? * Cơ quan Chứng nhận: Ai được trao quyền để tuyên bố tiêu chí đã được đáp ứng? * Xác minh Bên ngoài: Có sự kháng cáo hoặc xác minh độc lập nào không? * Cơ quan Sửa đổi: Ai có thể sửa đổi quy tắc và theo yêu cầu công bố nào?
---
Chủ Quyền Định Nghĩa: Quyền Tự Quyết Công Nghệ 🌍
Bài viết giới thiệu chủ quyền định nghĩa như một thành phần hỗ trợ của chủ quyền thuật toán: khả năng thể chế của các thể chế "tiếp nhận định nghĩa" (như các quốc gia ở phía Nam bán cầu hoặc các khu vực công phi thương mại) để tranh luận, chứng nhận và sửa đổi các danh mục công nghệ nhập khẩu dưới sự giám sát công khai, thay vì chấp nhận một cách mù quáng các tiêu chuẩn thương mại do các nhà phát triển thương mại ở các khu vực thu nhập cao đưa ra.