Bức tranh tổng thể
⚡ Vấn đề gốc rễ
Năm 2025 là năm AI agents chứng minh khả năng viết code. Năm 2026 là năm mọi người nhận ra: agent không phải phần khó — phần khó là hệ thống xung quanh agent. OpenAI Codex team đã ship một ứng dụng production với hơn 1 triệu dòng code mà không có một dòng nào do con người viết — nhưng engineers vẫn phải thiết kế toàn bộ hệ thống để AI làm điều đó đáng tin cậy.
4 tầng tư duy từ abstract đến concrete — mỗi tầng build trên tầng trước:
BMAD Method
Multi-agent workflow có cấu trúc
BMAD giao các vai trò AI agent chuyên biệt phản chiếu một real development team. Mỗi agent hoạt động với context được thu hẹp chặt chẽ — chỉ nhận artifacts cần thiết để làm việc. Không phải tidiness tổ chức, đây là chiến lược có chủ đích để dùng context window hiệu quả.
- BMAD Master — điều phối workflow
- Product Manager — viết PRD
- Analyst — nghiên cứu yêu cầu
- Architect — thiết kế hệ thống
- UX Designer — user flow & UI spec
- Scrum Master — tạo sprint story
- Developer — triển khai code
- QA Engineer — kiểm thử
- Tech Writer — tài liệu hóa
Brief → PRD → Architecture
→ Stories → Implementation
→ Review → Deploy
Hỗ trợ Claude Code, Cursor, Windsurf. Auto-detect platform.
💡 Core Insight
Nếu traditional AI coding giống jazz ứng tấu — ad-hoc prompting, hy vọng kết quả nhất quán — thì BMAD là cây đũa chỉ huy dàn nhạc: biến tương tác AI rời rạc thành workflow được điều phối, sẵn sàng cho production.
⚠️ Hạn chế
Learning curve cao. Thiết kế cho team 50+ người — có sprint ceremonies, story points, stakeholder syncs. Overkill cho solo dev hoặc dự án nhỏ. Context bleeding giữa workflows nếu không cấu hình đúng.
BMAD trên OpenClaw
ErwanLorteau/BMAD_Openclaw
Full plugin, fresh context mỗi workflow, không context bleeding. Có YOLO (autonomous) và Interactive mode.
BMadClaw
34+ workflows, local models cho task đơn giản, cloud cho complex. Checkpoint tracking & auto fallback.
Inject SOUL.md
Trích xuất BMAD agent prompts → inject vào SOUL.md của OpenClaw agents. Đơn giản nhất, không phá vỡ setup hiện tại.
Harness Engineering
Thiết kế hệ thống kiểm soát agent
Harness Engineering là discipline thiết kế environments, constraints và feedback loops để AI coding agents hoạt động đáng tin cậy ở scale. Được Mitchell Hashimoto (đồng sáng lập HashiCorp, tác giả Terraform) đặt tên vào đầu 2026, sau đó OpenAI chính thức hóa.
"Khi agent mắc lỗi, engineer phải build một giải pháp đảm bảo agent không bao giờ lặp lại lỗi đó nữa."
— Mitchell Hashimoto, HashiCorp founderOS cho AI Agent
Model = CPU
Context window = RAM
Harness = OS ← đây
Agent = Application
- Context Engineering — đúng thông tin đến đúng agent đúng lúc
- Guides — CLAUDE.md, .cursorrules — constraint mềm, prompt-based
- Sensors — linter, CI gate, test suite — constraint cứng, deterministic
🔑 Điểm khác biệt cốt lõi
Nói với agent "hãy theo coding standards" trong prompt → probabilistic compliance, agent có thể bỏ qua.
Gắn linter tự động block PR khi standards bị vi phạm → deterministic constraint, agent KHÔNG THỂ bỏ qua.
Harness Engineering chính thức hóa sự phân biệt này.
📊 Tại sao cần thiết
95% enterprise AI pilots không mang lại ROI đo lường được. Chỉ 12% tổ chức có data đủ chất lượng cho AI. Gartner dự báo 40% agentic AI projects bị hủy trước 2027. AI-generated code tạo 10,000+ security findings mới mỗi tháng (tăng 10x so với 12/2024).
GSD — Get Shit Done
Context isolation cho Claude Code
GSD giải quyết đúng một vấn đề: Context Rot — chất lượng output giảm dần khi context window đầy. Thay vì một session dài dần tệ đi, GSD spawn các Claude instance mới cho mỗi task. Mỗi subagent nhận 200K token context window sạch hoàn toàn.
✅ GSD Fix: Main session giữ ở 30–40%. Mọi heavy lifting đều do subagents thực hiện trong fresh 200K context riêng. Task thứ 50 có chất lượng ngang task thứ 1.
- /gsd-new-project — interview → spec → roadmap
- /gsd-map-codebase — phân tích existing code trước
- /gsd-discuss-phase — capture decisions trước khi plan
- /gsd-plan — research → plan → verify loop
- /gsd-ship — execute + atomic commit
- /gsd-forensics — diagnostic khi workflow fail
- Deterministic logic in code, not prompts — file check, config load dùng Node.js script
- Aggressive atomicity — mỗi plan 2–3 tasks, fit trong 50% context
- Goal-backward verification — "điều gì phải TRUE?" không phải "đã làm gì?"
Auto-detect runtime. Hỗ trợ Claude Code, Cursor, Gemini CLI, Codex, Windsurf, v14 runtimes...
🌊 Wave Execution
Tasks độc lập chạy song song (Wave 1: 3 plans cùng lúc). Tasks phụ thuộc đợi Wave trước xong. PLAN.md không chỉ là document — nó IS executable instruction, subagents đọc trực tiếp.
⚠️ Lưu ý quan trọng
Token rất nặng — nhiều user burn hết Pro plan nhanh. Dùng /gsd:quick cho task nhỏ. Với codebase có sẵn: LUÔN chạy /gsd-map-codebase trước. Minimal install: 700 tokens (giảm 94% so với 12,000 mặc định).
Các phương pháp khác
Kiro IDE
Agentic IDE build quanh Spec-Driven Development. 3 bước bắt buộc: Requirements → Design → Tasks. Dùng EARS notation để tạo acceptance criteria rõ ràng. Agent Hooks: event-driven automation khi save file (test update, README refresh, security scan tự động). Multi-model: Claude Sonnet, DeepSeek, Qwen...
GitHub Spec Kit
Python CLI open source phổ biến nhất cho spec-driven development. Hỗ trợ 30+ AI coding agents (Claude Code, GitHub Copilot, Amazon Q...). Cộng đồng lớn, dễ tích hợp vào CI/CD pipeline có sẵn. Static-spec tool — không tự sync khi code thay đổi.
Agentsway
Framework hàn lâm từ University of Colombo & Sri Jayewardenepura. Nhận định: Agile, Kanban, ShapeUp được thiết kế cho human-centric teams và ngày càng không đủ khi AI agents tham gia. Agentsway giới thiệu lifecycle có cấu trúc với human orchestration, governance và privacy-preserving collaboration.
Agentic Engineering
Không phải tool hay framework — là tư duy. Engineers không viết code nữa mà orchestrate AI agents để plan, write, test và ship code dưới sự giám sát có cấu trúc. OpenAI Codex: 1M+ dòng code, 0 dòng do người viết. Engineers thiết kế hệ thống, không thiết kế code.
Taxonomy: 2 loại khác nhau hoàn toàn
METHODOLOGY FRAMEWORKS
BMAD, GSD, Hermes — hệ thống prompts, personas và workflows. Không cần library cụ thể. Chạy được trên bất kỳ AI interface nào. Đánh giá bằng assumptions có đúng trong thực tế không.
CODE FRAMEWORKS
LangGraph, CrewAI, AutoGen, Mastra — thư viện kỹ thuật. Đánh giá bằng API surface, performance, community support. Cần install, configure, maintain dependencies.
So sánh chi tiết
| Tiêu chí | BMAD | GSD | Harness Eng. | Kiro |
|---|---|---|---|---|
| Bản chất | Framework / Methodology | Context isolation system | Discipline / Tư duy | IDE + SDD platform |
| Scope | Toàn bộ SDLC | Implementation phase | Bất kỳ agentic system | Greenfield projects |
| Ceremony | Cao (PRD, sprint...) | Rất thấp | Không có | Trung bình |
| Core innovation | Role specialization | Fresh subagent contexts | Deterministic constraints | Living spec + hooks |
| Target | Team → Enterprise | Solo dev / nhóm nhỏ | Enterprise production | Team có AWS |
| OpenClaw | ✅ Plugin sẵn | ⚡ Manual config | ✅ Principles áp dụng | ❌ IDE riêng |
| Autonomous mode | YOLO mode | skip-permissions | Human-on-the-loop | Agent hooks |
| Token cost | Cao | Rất cao (nhiều subagents) | N/A (CI/CD) | Trung bình |
🎯 Cách chúng bổ sung nhau
BMAD = thiết kế quy trình làm việc (ai làm gì, theo thứ tự nào, dùng artifact gì)
Harness Engineering = thiết kế môi trường kiểm soát (agent không được làm gì)
GSD = quản lý context chất lượng trong quá trình thực thi
Production-grade system cần cả ba. Không có cái nào thay thế cái nào.
Áp dụng cho OpenClaw
Setup khuyến nghị
Với hạ tầng OpenClaw đang build, 3 phương pháp trên giải quyết 3 bài toán khác nhau trong cùng một hệ thống.
Inject BMAD Principles
Trích xuất BMAD agent prompts (Analyst, PM, Architect...) → inject vào SOUL.md của OpenClaw agents. Không phá vỡ setup hiện tại.
Harness Engineering
Thiết kế TOOLS.md với deterministic rules. Mỗi agent lỗi → fix permanent. Áp dụng cho Gigago/Visana automation workflows.
GSD cho development
Khi build feature mới (Chrome Extension, n8n pipeline...) — GSD xử lý context isolation giữa các Claude sessions. Autonomous qua đêm.
- Gigago eSIM automation — GSD `/gsd-new-project` → spec → autonomous build → GSD giữ quality qua 100+ tasks
- Visana Chrome Extension — BMAD Architect agent thiết kế architecture → Developer agent implement → QA verify
- OpenClaw agent development — BMAD SOUL.md injection cho mỗi specialized agent (analyst, coder, tester)
- Cost control API Tier 3 — GSD minimal install (700 tokens), local models cho simple tasks (BMadClaw pattern)
- Multi-agent coordination (15 agents) — BMAD task sharding model: artifact-driven handoff giữa agents
- n8n MCP workflows — Harness Engineering: deterministic constraints trong n8n nodes thay vì prompt-based instructions
💰 Priority nếu muốn thử ngay hôm nay
1. GSD — `npx get-shit-done-cc@latest` trên Mac mini, thử với một feature nhỏ của Gigago
2. BMAD SOUL.md inject — copy Analyst + Architect prompt từ BMAD repo → thêm vào SOUL.md của OpenClaw agents
3. Harness principles — áp dụng khi có bug pattern lặp lại: fix permanent thay vì fix từng lần