Bỏ qua đến nội dung chính
Về trang chủ
AI tools-ai 7 phút đọc

architect-loop: Giải pháp phối hợp Claude Fable 5 và GPT-5.5 Codex, tiết kiệm tới 80% token nhờ kiến trúc Architect-Builder

Dự án mã nguồn mở architect-loop giới thiệu phương pháp phối hợp liên nhà cung cấp (cross-vendor) đột phá, sử dụng Claude Fable 5 làm kiến trúc sư điều phối và GPT-5.5 Codex làm lập trình viên thực thi, giúp tối ưu hóa 80% chi phí token.

Tier 2 · nguồn 99% độ tin cậy Auto-priority
Nguồn gốc github.com

Trong các hệ thống phát triển phần mềm bằng AI, chi phí token và giới hạn ngữ cảnh (context window) luôn là rào cản lớn nhất đối với các dự án phức tạp. Việc để một mô hình ngôn ngữ lớn (LLM) vừa tự lên kế hoạch, vừa viết code và tự sửa lỗi trong cùng một phiên làm việc thường gây ra hiện tượng phình to token cực kỳ nhanh chóng.

Để giải quyết vấn đề này, nhà nghiên cứu bảo mật và kỹ sư AI Dan McInerney đã giới thiệu architect-loop — một khung tác nhân (agent framework) nghiên cứu độc lập dành cho Claude Code. Dự án giới thiệu mô hình hợp tác liên nhà cung cấp (cross-vendor) độc đáo: sử dụng Claude Fable 5 làm "Kiến trúc sư" (Architect) để điều phối, đánh giá và GPT-5.5 Codex làm "Thợ xây" (Builder) để thực thi.

Đặc biệt, hệ thống hoạt động hoàn toàn dựa trên các gói đăng ký trả phí cố định sẵn có của người dùng mà không yêu cầu bất kỳ API key hay hóa đơn tính phí theo token nào.

---

Nguyên lý cốt lõi: Tách biệt vai trò Architect và Builder

Kiến trúc cốt lõi của architect-loop dựa trên sự phân rã nhiệm vụ rõ rệt giữa hai thực thể:

1. Architect (Claude Fable 5): Chỉ tập trung vào việc đánh giá, lên kế hoạch, thiết kế các ranh giới kiểm thử (acceptance gates) và nghiệm thu kết quả. Fable hoạt động trong các phiên làm việc cực kỳ ngắn và không bao giờ viết code trực tiếp. 2. Builder (GPT-5.5 Codex): Chịu trách nhiệm thực thi các tác vụ lập trình độc lập hoặc nghiên cứu sâu dưới sự điều khiển của Architect. Codex chạy song song, không cần giám sát trong nhiều giờ thông qua CLI chuyên dụng.

Bằng cách tách biệt phần "tư duy thiết kế" đắt đỏ khỏi phần "gõ code thực thi" tốn nhiều token, architect-loop giúp tiết kiệm tới 80% chi phí token của Fable so với việc để Fable tự thực hiện toàn bộ quy trình từ đầu đến cuối.

---

Vòng lặp xây dựng đột phá của `/architect`

Quy trình hoạt động của lệnh /architect diễn ra qua 3 bước khép kín và bảo mật:

[ Fable (Architect) ] │ 1. Thiết kế spec & đóng băng Gate ▼ [ docs/gates/ ] │ ┌─────────────────────┼─────────────────────┐ ▼ ▼ ▼ [ Nhánh tạm 1 ] [ Nhánh tạm 2 ] [ Nhánh tạm 3 ] Codex Builder 1 Codex Builder 2 Codex Builder 3 │ │ │ └─────────────────────┼─────────────────────┘ ▼ 2. Trả về kết quả thô (Không truy cập Git) │ ▼ [ Fable (Architect) ] 3. Chạy Gate & tích hợp mã nguồn

1. Thiết kế Spec & Khóa cổng nghiệm thu (Gates): Trước khi bất kỳ Builder nào bắt đầu, Fable sẽ chia nhỏ một Pull Request thành từ 1 đến 4 luồng xử lý song song với các tập hợp tệp độc lập, đồng thời ghi đè các điều kiện nghiệm thu vào thư mục docs/gates/. Để đảm bảo an toàn, các tệp kiểm thử này ở chế độ chỉ đọc. Nếu Builder cố tình chỉnh sửa tệp gate, toàn bộ tiến trình sẽ bị hủy bỏ ngay lập tức. 2. Xử lý song song cô lập: Hệ thống kích hoạt một tiến trình codex exec độc lập cho mỗi luồng, chạy trong các Git worktree riêng biệt. Điểm độc đáo là quy tắc "The Argue Rule" (Quy tắc Tranh luận): các Builder bắt buộc phải phản biện lại bản đặc tả (spec) trước khi viết code; việc im lặng làm theo sẽ bị coi là một lỗi hệ thống. Các Builder chỉ có quyền sửa các file được khai báo và không thể commit trực tiếp vào mã nguồn chính. 3. Nghiệm thu và Tích hợp: Fable tự mình chạy các lệnh kiểm thử nghiệm thu (coi báo cáo thành công của Builder chỉ là thông tin tham khảo). Fable sau đó xem xét các thay đổi so với ý định thiết kế ban đầu và tiến hành tích hợp trong một phiên làm việc hoàn toàn mới (kiểm thử chéo phiên mang lại chất lượng mã vượt trội so với kiểm thử trong cùng phiên).

---

Triết lý "Repo-as-Memory" (Kho lưu trữ là Bộ nhớ)

Trái ngược với các hệ thống AI lưu trữ bộ nhớ trong cơ sở dữ liệu vector phức tạp bên ngoài hoặc bộ nhớ đệm ngữ cảnh ngắn hạn, architect-loop coi chính kho lưu trữ Git là nguồn sự thật duy nhất về bộ nhớ.

Mọi ngữ cảnh, tiến độ và tài liệu bàn giao được duy trì trong: * Tệp tin docs/HANDOFF.md (một bảng mục lục ngắn gọn được cắt tỉa và cập nhật sau mỗi phiên làm việc). * Các thư mục docs/gates/docs/lanes/. * Lịch sử Git commits.

Nguyên tắc tối cao của hệ thống: "Cái gì không có trong repo thì coi như chưa từng tồn tại."

---

Lệnh tìm kiếm sâu `/architect-research`

Không chỉ dừng lại ở việc lập trình, dự án còn cung cấp lệnh /architect-research <chủ đề> để thực hiện nghiên cứu sâu theo phương pháp "Scout-first" (Trinh sát trước):

1. Giai đoạn Trinh sát (Scout Pass): Một tác nhân Codex giá rẻ thực hiện khoảng 10 lượt tìm kiếm nhanh để phác thảo thuật ngữ chuyên ngành, các hệ thống/tài liệu load-bearing, các chuyên gia hàng đầu và ranh giới vấn đề. 2. Thiết kế luồng nghiên cứu (Lane Design): Fable thiết kế từ 3 đến 6 luồng nghiên cứu chuyên sâu dựa trên các thư viện chiến thuật có sẵn: thu thập trích dẫn học thuật, khai thác mô hình thực tế từ sản xuất, phát hiện công nghệ tiềm năng so với quảng cáo thổi phồng. 3. Thu thập thông tin có kỷ luật: Các nhà nghiên cứu Codex chạy với giới hạn ngân sách tìm kiếm nghiêm ngặt. Mọi kết quả đầu ra bắt buộc phải tuân thủ định dạng: URL + Ngày tháng + Trích dẫn gốc + Thẻ độ tin cậy. Nguyên tắc cốt lõi: "Thông báo KHÔNG TÌM THẤY tốt hơn là tự suy diễn". 4. Xác thực chéo: Mọi tuyên bố quan trọng bắt buộc phải được xác thực bởi ít nhất 2 nguồn độc lập trước khi được Fable tổng hợp thành tài liệu PRD hoàn chỉnh cung cấp cho vòng lặp xây dựng mã nguồn.

---

Đánh giá và Triển vọng

Sự xuất hiện của architect-loop chứng minh một xu hướng quan trọng trong phát triển phần mềm bằng AI: Sự phân rã và phối hợp liên nền tảng. Việc kết hợp điểm mạnh về khả năng thiết kế lý luận sắc bén của dòng mô hình Claude (Fable 5) với khả năng thực thi bền bỉ, tiết kiệm của các mô hình chuyên biệt lập trình (Codex) mở ra hướng đi mới giúp các nhóm phát triển nhỏ hoặc lập trình viên độc lập có thể vận hành các hệ thống AI đại lý mạnh mẽ mà không lo gánh nặng chi phí API.