// Research Notes · May 2026

AI Agentic Dev Methodologies

Tổng hợp các phương pháp phát triển phần mềm hướng AI đang định hình ngành công nghệ 2025–2026: từ BMAD, Harness Engineering, GSD đến bức tranh toàn cảnh.

Frameworks 6+
Concepts 4 tầng
OpenClaw compatible
01

Bức tranh tổng thể

⚡ Vấn đề gốc rễ

Năm 2025 là năm AI agents chứng minh khả năng viết code. Năm 2026 là năm mọi người nhận ra: agent không phải phần khó — phần khó là hệ thống xung quanh agent. OpenAI Codex team đã ship một ứng dụng production với hơn 1 triệu dòng code mà không có một dòng nào do con người viết — nhưng engineers vẫn phải thiết kế toàn bộ hệ thống để AI làm điều đó đáng tin cậy.

4 tầng tư duy từ abstract đến concrete — mỗi tầng build trên tầng trước:

🎯
Agentic Engineering
Triết lý tổng quát nhất — engineer là director, không phải coder. Andrej Karpathy, Feb 2026.
ABSTRACT
🧠
Context Engineering
Lý thuyết nền tảng — đúng thông tin → đúng agent → đúng thời điểm. Karpathy, Dec 2025.
THEORY
📋
Spec-Driven Development
Phương pháp luận — đừng prompt AI để viết code, hãy đưa specification và để agents implement.
METHODOLOGY
🔧
BMAD / GSD / Harness / Kiro...
Tools & frameworks cụ thể — implementation thực tế của các tầng trên.
CONCRETE
02

BMAD Method

BREAKTHROUGH METHOD FOR AGILE AI-DRIVEN DEVELOPMENT

Multi-agent workflow có cấu trúc

BMAD giao các vai trò AI agent chuyên biệt phản chiếu một real development team. Mỗi agent hoạt động với context được thu hẹp chặt chẽ — chỉ nhận artifacts cần thiết để làm việc. Không phải tidiness tổ chức, đây là chiến lược có chủ đích để dùng context window hiệu quả.

Open Source MIT License Claude Code Cursor OpenClaw
9 Specialized Agents
  • BMAD Master — điều phối workflow
  • Product Manager — viết PRD
  • Analyst — nghiên cứu yêu cầu
  • Architect — thiết kế hệ thống
  • UX Designer — user flow & UI spec
  • Scrum Master — tạo sprint story
  • Developer — triển khai code
  • QA Engineer — kiểm thử
  • Tech Writer — tài liệu hóa
Workflow

Brief → PRD → Architecture
→ Stories → Implementation
→ Review → Deploy

Cài đặt
npx bmad-method install

Hỗ trợ Claude Code, Cursor, Windsurf. Auto-detect platform.

💡 Core Insight

Nếu traditional AI coding giống jazz ứng tấu — ad-hoc prompting, hy vọng kết quả nhất quán — thì BMAD là cây đũa chỉ huy dàn nhạc: biến tương tác AI rời rạc thành workflow được điều phối, sẵn sàng cho production.

⚠️ Hạn chế

Learning curve cao. Thiết kế cho team 50+ người — có sprint ceremonies, story points, stakeholder syncs. Overkill cho solo dev hoặc dự án nhỏ. Context bleeding giữa workflows nếu không cấu hình đúng.

BMAD trên OpenClaw

Plugin v3

ErwanLorteau/BMAD_Openclaw

Full plugin, fresh context mỗi workflow, không context bleeding. Có YOLO (autonomous) và Interactive mode.

Cost Optimized

BMadClaw

34+ workflows, local models cho task đơn giản, cloud cho complex. Checkpoint tracking & auto fallback.

Recommended

Inject SOUL.md

Trích xuất BMAD agent prompts → inject vào SOUL.md của OpenClaw agents. Đơn giản nhất, không phá vỡ setup hiện tại.

03

Harness Engineering

AGENT = MODEL + HARNESS — LANGCHAIN, FEB 2026

Thiết kế hệ thống kiểm soát agent

Harness Engineering là discipline thiết kế environments, constraints và feedback loops để AI coding agents hoạt động đáng tin cậy ở scale. Được Mitchell Hashimoto (đồng sáng lập HashiCorp, tác giả Terraform) đặt tên vào đầu 2026, sau đó OpenAI chính thức hóa.

Discipline Not a framework Production Focus Enterprise

"Khi agent mắc lỗi, engineer phải build một giải pháp đảm bảo agent không bao giờ lặp lại lỗi đó nữa."

— Mitchell Hashimoto, HashiCorp founder
Analogy

OS cho AI Agent

Model = CPU
Context window = RAM
Harness = OS ← đây
Agent = Application

3 Thành phần chính
  • Context Engineering — đúng thông tin đến đúng agent đúng lúc
  • Guides — CLAUDE.md, .cursorrules — constraint mềm, prompt-based
  • Sensors — linter, CI gate, test suite — constraint cứng, deterministic

🔑 Điểm khác biệt cốt lõi

Nói với agent "hãy theo coding standards" trong prompt → probabilistic compliance, agent có thể bỏ qua.

Gắn linter tự động block PR khi standards bị vi phạm → deterministic constraint, agent KHÔNG THỂ bỏ qua.

Harness Engineering chính thức hóa sự phân biệt này.

📊 Tại sao cần thiết

95% enterprise AI pilots không mang lại ROI đo lường được. Chỉ 12% tổ chức có data đủ chất lượng cho AI. Gartner dự báo 40% agentic AI projects bị hủy trước 2027. AI-generated code tạo 10,000+ security findings mới mỗi tháng (tăng 10x so với 12/2024).

04

GSD — Get Shit Done

BY TÂCHES (LEX CHRISTOPHERSON) · 59,600 GITHUB STARS · MAY 2026

Context isolation cho Claude Code

GSD giải quyết đúng một vấn đề: Context Rot — chất lượng output giảm dần khi context window đầy. Thay vì một session dài dần tệ đi, GSD spawn các Claude instance mới cho mỗi task. Mỗi subagent nhận 200K token context window sạch hoàn toàn.

Solo Dev Friendly 14 Runtimes MIT License Token Heavy
Context Rot — Vấn đề GSD giải quyết
0–30%
Peak quality — toàn diện, nhớ mọi thứ
50%+
Bắt đầu vội — cắt góc, "I'll be concise"
70%+
Hallucination — quên requirements

GSD Fix: Main session giữ ở 30–40%. Mọi heavy lifting đều do subagents thực hiện trong fresh 200K context riêng. Task thứ 50 có chất lượng ngang task thứ 1.

6 Core Commands
  • /gsd-new-project — interview → spec → roadmap
  • /gsd-map-codebase — phân tích existing code trước
  • /gsd-discuss-phase — capture decisions trước khi plan
  • /gsd-plan — research → plan → verify loop
  • /gsd-ship — execute + atomic commit
  • /gsd-forensics — diagnostic khi workflow fail
3 Nguyên tắc kỹ thuật
  • Deterministic logic in code, not prompts — file check, config load dùng Node.js script
  • Aggressive atomicity — mỗi plan 2–3 tasks, fit trong 50% context
  • Goal-backward verification — "điều gì phải TRUE?" không phải "đã làm gì?"
Cài đặt
npx get-shit-done-cc@latest

Auto-detect runtime. Hỗ trợ Claude Code, Cursor, Gemini CLI, Codex, Windsurf, v14 runtimes...

🌊 Wave Execution

Tasks độc lập chạy song song (Wave 1: 3 plans cùng lúc). Tasks phụ thuộc đợi Wave trước xong. PLAN.md không chỉ là document — nó IS executable instruction, subagents đọc trực tiếp.

⚠️ Lưu ý quan trọng

Token rất nặng — nhiều user burn hết Pro plan nhanh. Dùng /gsd:quick cho task nhỏ. Với codebase có sẵn: LUÔN chạy /gsd-map-codebase trước. Minimal install: 700 tokens (giảm 94% so với 12,000 mặc định).

05

Các phương pháp khác

AWS · 2025

Kiro IDE

Agentic IDE build quanh Spec-Driven Development. 3 bước bắt buộc: Requirements → Design → Tasks. Dùng EARS notation để tạo acceptance criteria rõ ràng. Agent Hooks: event-driven automation khi save file (test update, README refresh, security scan tự động). Multi-model: Claude Sonnet, DeepSeek, Qwen...

GitHub · 93,000⭐

GitHub Spec Kit

Python CLI open source phổ biến nhất cho spec-driven development. Hỗ trợ 30+ AI coding agents (Claude Code, GitHub Copilot, Amazon Q...). Cộng đồng lớn, dễ tích hợp vào CI/CD pipeline có sẵn. Static-spec tool — không tự sync khi code thay đổi.

Academic · Oct 2025

Agentsway

Framework hàn lâm từ University of Colombo & Sri Jayewardenepura. Nhận định: Agile, Kanban, ShapeUp được thiết kế cho human-centric teams và ngày càng không đủ khi AI agents tham gia. Agentsway giới thiệu lifecycle có cấu trúc với human orchestration, governance và privacy-preserving collaboration.

Karpathy · Feb 2026

Agentic Engineering

Không phải tool hay framework — là tư duy. Engineers không viết code nữa mà orchestrate AI agents để plan, write, test và ship code dưới sự giám sát có cấu trúc. OpenAI Codex: 1M+ dòng code, 0 dòng do người viết. Engineers thiết kế hệ thống, không thiết kế code.

MindStudio · 38 methodology frameworks được so sánh

Taxonomy: 2 loại khác nhau hoàn toàn

METHODOLOGY FRAMEWORKS

BMAD, GSD, Hermes — hệ thống prompts, personas và workflows. Không cần library cụ thể. Chạy được trên bất kỳ AI interface nào. Đánh giá bằng assumptions có đúng trong thực tế không.

CODE FRAMEWORKS

LangGraph, CrewAI, AutoGen, Mastra — thư viện kỹ thuật. Đánh giá bằng API surface, performance, community support. Cần install, configure, maintain dependencies.

06

So sánh chi tiết

Tiêu chí BMAD GSD Harness Eng. Kiro
Bản chất Framework / Methodology Context isolation system Discipline / Tư duy IDE + SDD platform
Scope Toàn bộ SDLC Implementation phase Bất kỳ agentic system Greenfield projects
Ceremony Cao (PRD, sprint...) Rất thấp Không có Trung bình
Core innovation Role specialization Fresh subagent contexts Deterministic constraints Living spec + hooks
Target Team → Enterprise Solo dev / nhóm nhỏ Enterprise production Team có AWS
OpenClaw ✅ Plugin sẵn ⚡ Manual config ✅ Principles áp dụng ❌ IDE riêng
Autonomous mode YOLO mode skip-permissions Human-on-the-loop Agent hooks
Token cost Cao Rất cao (nhiều subagents) N/A (CI/CD) Trung bình

🎯 Cách chúng bổ sung nhau

BMAD = thiết kế quy trình làm việc (ai làm gì, theo thứ tự nào, dùng artifact gì)
Harness Engineering = thiết kế môi trường kiểm soát (agent không được làm gì)
GSD = quản lý context chất lượng trong quá trình thực thi

Production-grade system cần cả ba. Không có cái nào thay thế cái nào.

07

Áp dụng cho OpenClaw

MAC MINI M4 · STATIC IP 192.168.68.61 · 15 CONCURRENT AGENTS

Setup khuyến nghị

Với hạ tầng OpenClaw đang build, 3 phương pháp trên giải quyết 3 bài toán khác nhau trong cùng một hệ thống.

Bước 1 · Nhanh nhất

Inject BMAD Principles

Trích xuất BMAD agent prompts (Analyst, PM, Architect...) → inject vào SOUL.md của OpenClaw agents. Không phá vỡ setup hiện tại.

Bước 2 · Kiểm soát

Harness Engineering

Thiết kế TOOLS.md với deterministic rules. Mỗi agent lỗi → fix permanent. Áp dụng cho Gigago/Visana automation workflows.

Bước 3 · Build mới

GSD cho development

Khi build feature mới (Chrome Extension, n8n pipeline...) — GSD xử lý context isolation giữa các Claude sessions. Autonomous qua đêm.

Use Cases cụ thể
  • Gigago eSIM automation — GSD `/gsd-new-project` → spec → autonomous build → GSD giữ quality qua 100+ tasks
  • Visana Chrome Extension — BMAD Architect agent thiết kế architecture → Developer agent implement → QA verify
  • OpenClaw agent development — BMAD SOUL.md injection cho mỗi specialized agent (analyst, coder, tester)
  • Cost control API Tier 3 — GSD minimal install (700 tokens), local models cho simple tasks (BMadClaw pattern)
  • Multi-agent coordination (15 agents) — BMAD task sharding model: artifact-driven handoff giữa agents
  • n8n MCP workflows — Harness Engineering: deterministic constraints trong n8n nodes thay vì prompt-based instructions

💰 Priority nếu muốn thử ngay hôm nay

1. GSD — `npx get-shit-done-cc@latest` trên Mac mini, thử với một feature nhỏ của Gigago
2. BMAD SOUL.md inject — copy Analyst + Architect prompt từ BMAD repo → thêm vào SOUL.md của OpenClaw agents
3. Harness principles — áp dụng khi có bug pattern lặp lại: fix permanent thay vì fix từng lần