Cómo funciona SpecBox Engine

Pipeline completo de desarrollo spec-driven con orquestación multi-agente. 108 tools MCP, 13 skills, 12 agentes.

3 comandos. Software verificado. Evidencia auditable.

Describes qué construir con /prd. El engine planifica con /plan. Implementa con /implement. Quality gates verifican cada paso. Self-healing corrige errores automáticamente. Tú revisas la PR.

Ejemplo real: de idea a PR en 3 pasos

Así funciona: 3 comandos, software verificado

$ /prd "Sistema de reservas para restaurante"

Generando PRD...

┌─ US-001: Reservar mesa online

│ ├─ UC-001: Seleccionar fecha y hora (4 ACs)

│ └─ UC-002: Cancelar reserva (2 ACs)

└─ Quality Gate: PASS (12/12 ACs son específicos y medibles)

$ /plan

Analizando PRD (4 US, 12 UC, 38 AC)...

┌─ Fase 1: Database schema + RLS

├─ Fase 2: API (12 endpoints)

├─ Fase 3: UI (Stitch designs)

└─ Fase 4: E2E Playwright

Estimado: ~6h con SpecBox. Sin SpecBox: 3-5 días.

$ /implement

[Orchestrator] Creando rama feat/US-001

[AG-03] Migraciones: create_bookings_table ✓

[AG-01] Implementando UC-001 from Stitch design...

[AG-04] Tests: 24/24 passing, coverage 87%

[AG-08] Quality Gate: GO ✓

[AG-09] Acceptance: 12/12 AC ACCEPTED

→ PR #47 creada, lista para review

El Pipeline

$ /prd

Genera el Product Requirements Document con User Stories, Use Cases, y Acceptance Criteria. Definition Quality Gate valida que cada criterio sea específico, medible y testable.

$ /plan

Analiza el PRD, genera plan técnico con fases, componentes UI, y diseños Stitch. VEG genera directivas visuales adaptadas a la audiencia.

$ /implement

Autopilot: crea rama, ejecuta fases secuenciales, design-to-code, quality gates entre fases, acceptance testing, y PR automática.

Deep Dive — Todo lo que hay dentro

12 Agentes Especializados

Cada fase del pipeline tiene agentes con roles definidos. El Orquestador NUNCA escribe código — solo coordina, delega, y consolida.

🎯 Orchestrator

Orquestador

Coordinador principal. NUNCA escribe código. Planifica, delega, consolida en Engram.

AG-01

Feature Generator

Genera estructura completa de features por stack (BLoC, App Router, FastAPI).

🎨 AG-02

UI/UX Designer

Interfaces, responsiveness, VEG Motion. Trabaja desde diseños Stitch.

🗄️ AG-03

DB Specialist

Supabase, Neon, Firebase. Migraciones, RLS policies, schemas.

🧪 AG-04

QA Validation

Tests unitarios, integración, widget. Coverage 85%+, edge cases.

🔄 AG-05

n8n Specialist

Workflows de automatización, triggers, webhooks, error handling.

✏️ AG-06

Design Specialist

Google Stitch MCP, VEG enrichment. Genera y edita diseños UI.

📊 AG-07

Apps Script

Google Apps Script (clasp + TypeScript). Web Apps, Add-ons, Triggers.

🔍 AG-08

Quality Auditor

Verificación independiente. Lint, coverage, arquitectura. Emite GO/NO-GO.

AG-09a

Acceptance Tester

Genera .feature + step definitions Gherkin. Captura evidencia visual (screenshots, traces).

⚖️ AG-09b

Acceptance Validator

Validación independiente de AC. Emite ACCEPTED / CONDITIONAL / REJECTED.

🐛 AG-10

Developer Tester

Procesa feedback humano de testing manual. Crea GitHub issues, vincula a AC-XX.

13 Agent Skills

Comandos auto-descubribles que se activan cuando son relevantes. Cada skill es un workflow completo.

/prd Genera PRD + Work Item
/plan Plan técnico + Stitch + VEG
/implement Autopilot end-to-end
/quality-gate Quality gates adaptativos
/feedback Feedback de testing manual
/explore Exploración read-only
/adapt-ui Mapeo de componentes UI
/optimize-agents Auditoría del sistema agéntico
/check-designs Compliance Stitch retroactivo
/acceptance-check Validación standalone de AC
/quickstart Tutorial interactivo (<5 min)
/remote Gestión remota (iPhone/WhatsApp)
/release Auditoría + version bump + push

108 Herramientas de Automatización

Servidor MCP unificado. Backend-agnostic: funciona con Trello, Plane, o sin API externa.

Cada herramienta es una operación atómica que los agentes usan para gestionar tu proyecto: crear PRDs, ejecutar tests, mover tarjetas, verificar calidad, generar evidencia.

13 módulos: engine, plans, quality, skills, features, telemetry, hooks, onboarding, state, spec-driven, migration, stitch, heartbeat.

21
spec-driven
US/UC/AC backend-agnostic
20
state
Checkpoints, healing, sessions
13
stitch
Stitch MCP proxy completo
10
onboarding
Register, upgrade, matrix
8
telemetry
Sessions, events, dashboard
7
features
In-progress, designs, VEG
5
migration
Trello ↔ Plane bidireccional
4
quality
Baselines, logs, evidence
3
engine
Versión, status, reglas
3
plans
List, read, architecture
3
hooks
List, config, source
2
skills
Discovery + read

Quality Gates y Self-Healing

1

Retry

Reintento automático del paso fallido.

2

Patch

Corrección quirúrgica del error detectado.

3

Rollback

Reversión al último checkpoint estable.

4

Intervención Humana

Escalación al desarrollador con diagnóstico.

Pipeline Integrity

Enforcement a nivel de hooks que hace imposible escribir código sin UC activo.

"El incidente embed-build (marzo 2026): un agente implementó 9 Use Cases sin el pipeline, dejando Trello vacío y sin trazabilidad. Ese fue el día que nacieron los HARD BLOCKS."

🛡️

spec-guard.sh bloquea Write/Edit en src/ sin UC activo

🚫

commit-spec-guard.sh bloquea commits en main/master

🎨

design-gate.sh bloquea UI sin diseños Stitch previos

💀

Anti-main guard: ERROR FATAL si se implementa en main

Sala de Máquinas

Dashboard embebido (React 19 + Vite) que muestra el estado de todos tus proyectos: telemetría de sesiones, self-healing events, quality baselines, spec-driven boards, acceptance tests, y E2E results. Cada usuario despliega su propia instancia — no hay servidor central.

Sala de Máquinas Dashboard

Multi-Backend

3 backends intercambiables con la misma interfaz (25 métodos). Migración bidireccional entre ellos.

📋
Trello Boards con US/UC/AC cards
✈️
Plane Cloud o self-hosted (CE)
📁
FreeForm JSON local, sin API externa

Servicios de Infraestructura

Patrones integrados para 5 servicios: cada uno con guías de configuración, best practices, y integración con el pipeline.

Supabase
🐘 Neon
💳 Stripe
🔥 Firebase
🔄 n8n

Stacks Soportados

💙 Flutter
🐍 Python
⚛️ React
🔓 FreeForm