Cómo funciona SpecBox Engine
Pipeline completo de desarrollo spec-driven con orquestación multi-agente. 108 tools MCP, 13 skills, 12 agentes.
3 comandos. Software verificado. Evidencia auditable.
Describes qué construir con /prd. El engine planifica con /plan. Implementa con /implement. Quality gates verifican cada paso. Self-healing corrige errores automáticamente. Tú revisas la PR.
Ejemplo real: de idea a PR en 3 pasos
Así funciona: 3 comandos, software verificado
$ /prd "Sistema de reservas para restaurante"
Generando PRD...
┌─ US-001: Reservar mesa online
│ ├─ UC-001: Seleccionar fecha y hora (4 ACs)
│ └─ UC-002: Cancelar reserva (2 ACs)
└─ Quality Gate: PASS (12/12 ACs son específicos y medibles)
$ /plan
Analizando PRD (4 US, 12 UC, 38 AC)...
┌─ Fase 1: Database schema + RLS
├─ Fase 2: API (12 endpoints)
├─ Fase 3: UI (Stitch designs)
└─ Fase 4: E2E Playwright
Estimado: ~6h con SpecBox. Sin SpecBox: 3-5 días.
$ /implement
[Orchestrator] Creando rama feat/US-001
[AG-03] Migraciones: create_bookings_table ✓
[AG-01] Implementando UC-001 from Stitch design...
[AG-04] Tests: 24/24 passing, coverage 87%
[AG-08] Quality Gate: GO ✓
[AG-09] Acceptance: 12/12 AC ACCEPTED
→ PR #47 creada, lista para review
El Pipeline
Genera el Product Requirements Document con User Stories, Use Cases, y Acceptance Criteria. Definition Quality Gate valida que cada criterio sea específico, medible y testable.
Analiza el PRD, genera plan técnico con fases, componentes UI, y diseños Stitch. VEG genera directivas visuales adaptadas a la audiencia.
Autopilot: crea rama, ejecuta fases secuenciales, design-to-code, quality gates entre fases, acceptance testing, y PR automática.
Deep Dive — Todo lo que hay dentro
12 Agentes Especializados
Cada fase del pipeline tiene agentes con roles definidos. El Orquestador NUNCA escribe código — solo coordina, delega, y consolida.
Orquestador
Coordinador principal. NUNCA escribe código. Planifica, delega, consolida en Engram.
Feature Generator
Genera estructura completa de features por stack (BLoC, App Router, FastAPI).
UI/UX Designer
Interfaces, responsiveness, VEG Motion. Trabaja desde diseños Stitch.
DB Specialist
Supabase, Neon, Firebase. Migraciones, RLS policies, schemas.
QA Validation
Tests unitarios, integración, widget. Coverage 85%+, edge cases.
n8n Specialist
Workflows de automatización, triggers, webhooks, error handling.
Design Specialist
Google Stitch MCP, VEG enrichment. Genera y edita diseños UI.
Apps Script
Google Apps Script (clasp + TypeScript). Web Apps, Add-ons, Triggers.
Quality Auditor
Verificación independiente. Lint, coverage, arquitectura. Emite GO/NO-GO.
Acceptance Tester
Genera .feature + step definitions Gherkin. Captura evidencia visual (screenshots, traces).
Acceptance Validator
Validación independiente de AC. Emite ACCEPTED / CONDITIONAL / REJECTED.
Developer Tester
Procesa feedback humano de testing manual. Crea GitHub issues, vincula a AC-XX.
13 Agent Skills
Comandos auto-descubribles que se activan cuando son relevantes. Cada skill es un workflow completo.
/prd Genera PRD + Work Item /plan Plan técnico + Stitch + VEG /implement Autopilot end-to-end /quality-gate Quality gates adaptativos /feedback Feedback de testing manual /explore Exploración read-only /adapt-ui Mapeo de componentes UI /optimize-agents Auditoría del sistema agéntico /check-designs Compliance Stitch retroactivo /acceptance-check Validación standalone de AC /quickstart Tutorial interactivo (<5 min) /remote Gestión remota (iPhone/WhatsApp) /release Auditoría + version bump + push 108 Herramientas de Automatización
Servidor MCP unificado. Backend-agnostic: funciona con Trello, Plane, o sin API externa.
Cada herramienta es una operación atómica que los agentes usan para gestionar tu proyecto: crear PRDs, ejecutar tests, mover tarjetas, verificar calidad, generar evidencia.
13 módulos: engine, plans, quality, skills, features, telemetry, hooks, onboarding, state, spec-driven, migration, stitch, heartbeat.
Quality Gates y Self-Healing
Retry
Reintento automático del paso fallido.
Patch
Corrección quirúrgica del error detectado.
Rollback
Reversión al último checkpoint estable.
Intervención Humana
Escalación al desarrollador con diagnóstico.
Pipeline Integrity
Enforcement a nivel de hooks que hace imposible escribir código sin UC activo.
"El incidente embed-build (marzo 2026): un agente implementó 9 Use Cases sin el pipeline, dejando Trello vacío y sin trazabilidad. Ese fue el día que nacieron los HARD BLOCKS."
spec-guard.sh bloquea Write/Edit en src/ sin UC activo
commit-spec-guard.sh bloquea commits en main/master
design-gate.sh bloquea UI sin diseños Stitch previos
Anti-main guard: ERROR FATAL si se implementa en main
Sala de Máquinas
Dashboard embebido (React 19 + Vite) que muestra el estado de todos tus proyectos: telemetría de sesiones, self-healing events, quality baselines, spec-driven boards, acceptance tests, y E2E results. Cada usuario despliega su propia instancia — no hay servidor central.
Multi-Backend
3 backends intercambiables con la misma interfaz (25 métodos). Migración bidireccional entre ellos.
Servicios de Infraestructura
Patrones integrados para 5 servicios: cada uno con guías de configuración, best practices, y integración con el pipeline.