docs(plan): issues 0120-0123 — mejora workflow subagentes

Plan en 4 olas para cerrar gaps detectados en revision critica: - 0120 piloto fn-orquestador (chart_demo e2e_checks) - 0121 cobertura e2e_checks masiva (fn-recopilador batch) - 0122 fn-revisor + auto-apply ampliado (desbloquea fase 5) - 0123 /flow run + fn-meta-orquestador + fn-priorizador Dep-chain: 0120 -> 0121 -> 0122 -> 0123. Cada uno con Acceptance verificable programaticamente para que /autonomous-task pueda converger. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-18 21:41:02 +02:00
parent a192ee0695
commit 93520c4319
4 changed files with 265 additions and 0 deletions
@@ -0,0 +1,78 @@
+---
+id: "0120"
+title: "fn-orquestador: piloto verde end-to-end sobre chart_demo"
+status: pendiente
+type: chore
+domain:
+  - meta
+  - registry-quality
+scope: agent
+priority: alta
+depends: []
+blocks:
+  - "0121"
+  - "0122"
+  - "0123"
+related:
+  - "0069"
+  - "0068"
+created: 2026-05-18
+updated: 2026-05-18
+tags: [orquestador, autonomous, e2e_checks, piloto]
+---
+
+# 0120 — Piloto verde de fn-orquestador
+
+## Problema
+
+`fn-orquestador` (issue 0069) tiene spec completa con 11 reglas duras, worktree aislado, paths protegidos y watchdog. Pero `task_runs` esta vacio: ningun piloto verde documentado. Memoria del "piloto 1" registra contaminacion del main repo (origen de las reglas 9/10/11). Sin un task_run con `status=done` y PR mergeado, el comando `/autonomous-task` es promesa, no herramienta. Las olas 0121-0123 dependen de que esto funcione.
+
+## Decision
+
+Ejecutar `/autonomous-task` sobre un target acotado y verificable: anadir bloque `e2e_checks` minimo al `app.md` de `chart_demo` y validar que `fn-analizador` corre la suite verde. Documentar el `task_run` entero (iteraciones, proposals, eventos) para auditar comportamiento real del orquestador.
+
+### Target
+
+`apps/chart_demo/` — app C++ ImGui pequeña, sin `e2e_checks` declarado, con `--self-test` ya implementado por el framework `fn::run_app`.
+
+### Bloque `e2e_checks` esperado
+
+```yaml
+e2e_checks:
+  - id: build
+    cmd: "cmake --build cpp/build/windows --target chart_demo -j"
+    timeout_s: 300
+  - id: self_test
+    cmd: "./cpp/build/windows/apps/chart_demo/chart_demo --self-test"
+    timeout_s: 30
+```
+
+## Tareas
+
+1. Confirmar pre-condiciones del orquestador (migration 006, autonomous_protected_paths.json, gh auth, master limpio).
+2. Lanzar `/autonomous-task 0120 --dry-run` para audit.
+3. Lanzar `/autonomous-task 0120 --max-iterations 5 --max-minutes 30`.
+4. Recoger output: `task_run_id`, branch `auto/0120-*`, log de iteraciones, proposals aplicadas/skipped, URL del PR draft.
+5. Verificar `git -C /home/lucas/fn_registry status --short` igual a baseline (regla 11 sandbox breach).
+6. Post-mortem: si fallo en alguna iteracion, anotar en seccion `## Hallazgos` y refinar `fn-orquestador/SKILL.md` o `autonomous_loop.md` si corresponde.
+
+## Acceptance
+
+- [ ] `sqlite3 apps/agent_runner_api/operations.db "SELECT id, status FROM task_runs WHERE issue_id='0120'"` devuelve >=1 fila con `status=done`.
+- [ ] `apps/chart_demo/app.md` contiene bloque `e2e_checks:` con al menos `build` + `self_test`.
+- [ ] `fn-analizador` corrida sobre `chart_demo` reporta `checks_pass=checks_total` (todo verde).
+- [ ] PR draft existe en Gitea con branch `auto/0120-*` apuntando a `master`.
+- [ ] `git -C /home/lucas/fn_registry status --short` antes/despues del piloto identico (excluyendo solo este `.md` cerrado).
+- [ ] Documento de post-mortem en `## Hallazgos` con: iteraciones totales, tiempo total, proposals creadas, decisiones del orquestador.
+
+## DoD
+
+User-facing surface:
+- **Donde**: PR draft visible en Gitea `dataforge/fn_registry/pulls`.
+- **Latencia**: <30 min total.
+- **Como vuelve**: lectura del `task_run` via `mcp__registry__fn_doctor` o tab Monitor del registry_dashboard.
+- **Onboarding (1 parrafo)**: "Para lanzar orquestador autonomo sobre un issue trivial, ejecuta `/autonomous-task <NNNN>`. Tras converger, abre PR draft. Si falla, lee `task_runs.events_json` para reconstruir las decisiones."
+
+## Hallazgos
+
+(Rellenar tras ejecucion)
@@ -0,0 +1,57 @@
+---
+id: "0121"
+title: "Cobertura e2e_checks: design-e2e batch sobre apps sin contrato"
+status: pendiente
+type: chore
+domain:
+  - registry-quality
+  - meta
+scope: registry
+priority: alta
+depends:
+  - "0120"
+blocks:
+  - "0122"
+related:
+  - "0068"
+created: 2026-05-18
+updated: 2026-05-18
+tags: [e2e_checks, recopilador, batch, coverage]
+---
+
+# 0121 — Cobertura e2e_checks masiva via fn-recopilador batch
+
+## Problema
+
+Regla `e2e_validation.md` define el contrato `e2e_checks` en `app.md` para que `fn-analizador` (fase 4) pueda validar. Hoy solo ~12 apps lo declaran. >20 apps sin contrato hacen que el bucle reactivo opere amputado: fase 4 colapsa, fase 5 no recibe input. `/autonomous-task` no puede converger sobre la mayoria de apps por falta de gate.
+
+## Decision
+
+Lanzar `fn-recopilador` en modo `design-e2e <app>` en paralelo sobre TODAS las apps sin `e2e_checks` declarado. Cada output es propuesta de bloque YAML para anadir al `app.md` correspondiente. Humano (o `/autonomous-task` por app) aplica via PR.
+
+Anadir subcomando `fn doctor e2e-coverage` que lista apps sin contrato y devuelve % de coverage.
+
+## Tareas
+
+1. Listar apps sin `e2e_checks:` con `grep -L`.
+2. Spawn `fn-recopilador design-e2e <app>` en paralelo (1 mensaje, N tool_use blocks) para cada app sin contrato.
+3. Recoger propuestas, una por app, en `dev/proposals_e2e_checks_0121/<app>.yaml` (carpeta efimera).
+4. Implementar `fn doctor e2e-coverage` en `cmd/fn/doctor.go` + funcion auxiliar `audit_e2e_coverage_go_infra` via `fn-constructor`.
+5. Aplicar propuestas: editar `app.md` de cada app (manual o autonomous-task por lote).
+6. Re-ejecutar `fn doctor e2e-coverage` y validar coverage >=80%.
+
+## Acceptance
+
+- [ ] `fn doctor e2e-coverage --json` existe y reporta coverage actual.
+- [ ] Coverage >=80% (>=80% de apps en `apps/`, `cpp/apps/`, `projects/*/apps/` con `e2e_checks` declarado).
+- [ ] Para cada app con `e2e_checks` nuevo: `fn-analizador` corrida produce `e2e_runs` con `checks_total>0`.
+- [ ] Funcion `audit_e2e_coverage_go_infra` indexada en registry.db con `uses_functions` declarado.
+- [ ] PR mergeado a master con cambios en N `app.md` + nuevo doctor subcomando.
+
+## DoD
+
+User-facing surface:
+- **Donde**: `fn doctor e2e-coverage` en terminal + tab Monitor del registry_dashboard (KPI coverage %).
+- **Latencia**: report en <5s.
+- **Como vuelve**: `fn doctor` rutinario tras cada deploy.
+- **Onboarding**: "Antes de cerrar issue que toca app, comprobar `fn doctor e2e-coverage` para que la coverage no baje."
@@ -0,0 +1,65 @@
+---
+id: "0122"
+title: "fn-revisor + auto-apply ampliado: desbloquear fase 5"
+status: pendiente
+type: feature
+domain:
+  - meta
+  - registry-quality
+scope: agent
+priority: alta
+depends:
+  - "0121"
+blocks:
+  - "0123"
+related:
+  - "0069"
+  - "0086"
+created: 2026-05-18
+updated: 2026-05-18
+tags: [revisor, mejorador, proposals, auto-apply, autonomous]
+---
+
+# 0122 — fn-revisor + ampliar filtro auto-aplicable del orquestador
+
+## Problema
+
+`fn-mejorador` (fase 5) abre proposals con evidencia, pero el filtro auto-aplicable del orquestador solo cubre `bug_fix`, `e2e_check_add`, `doc_update`, `capability_tag_add`. La mayoria de proposals reales son `new_function` / `refactor` / `improve_function` → quedan `pending` para humano → cola se acumula sin cerrar (3+ proposals pendientes hoy). El bucle reactivo aprende pero no actua.
+
+Ampliar el filtro sin un revisor automatico = kamikaze. Necesitamos un agente `fn-revisor` que actue como gate pre-PR sobre `auto/*`: code review caveman, severity-tagged, sin scope creep.
+
+## Decision
+
+1. **Crear `fn-revisor`** como subagente nuevo (`.claude/agents/fn-revisor/SKILL.md`). Modelo sonnet. Tools: Read, Grep, Bash (read-only). Output formato: `path:line: <emoji> <severity>: <problema>. <fix>.`. Adaptar prompt de `caveman:cavecrew-reviewer` al contexto fn (registry-first, reglas duras, etc.).
+2. **Ampliar filtro auto-aplicable** del orquestador para incluir `new_function` con condiciones:
+   - fn-constructor crea la funcion en el worktree.
+   - Tests de la funcion pasan en el worktree.
+   - NO toca apps existentes (solo crea bajo `functions/<domain>/`).
+   - `fn-revisor` da veredicto `pass`.
+3. **Cron `purge_pending_proposals`**: dagu daily que lee proposals `pending` > 14 dias, las marca `stale`, notifica via matrix (flow 0007).
+
+## Tareas
+
+1. Escribir `.claude/agents/fn-revisor/SKILL.md` con plantilla caveman + reglas fn.
+2. Editar `.claude/agents/fn-orquestador/SKILL.md`: anadir `new_function` al filtro con condiciones explicitas.
+3. Editar `.claude/rules/autonomous_loop.md`: documentar ampliacion + rol de revisor.
+4. Crear `bash/functions/pipelines/purge_pending_proposals.sh` + `.md` via `fn-constructor`.
+5. Crear DAG dagu `purge_pending_proposals.yaml` en `~/dagu/` (skill `dagu-auto`).
+6. Test: crear proposal `new_function` ficticia, lanzar `/autonomous-task` sobre issue dummy que la dispare, verificar que orquestador aplica + revisor revisa + PR draft sale.
+
+## Acceptance
+
+- [ ] `.claude/agents/fn-revisor/SKILL.md` existe + comparte estilo con `caveman-reviewer`.
+- [ ] Orquestador aplica proposal `new_function` cuando condiciones cumplen.
+- [ ] `fn-revisor` invocado por orquestador antes de `git commit` en `auto/*`.
+- [ ] Pipeline `purge_pending_proposals_bash_pipelines` indexado.
+- [ ] DAG dagu activo: `dagu status purge_pending_proposals` muestra ultima ejecucion <24h.
+- [ ] `pending_proposals` (telemetria UserPromptSubmit) <=1 tras 1 semana.
+
+## DoD
+
+User-facing surface:
+- **Donde**: PR drafts en Gitea + tab Monitor "Proposals" del dashboard + matrix bot notifica purgas.
+- **Latencia**: revisor responde <2 min por PR.
+- **Como vuelve**: `mcp__registry__fn_proposal action="list"`.
+- **Onboarding**: "Si abriste proposal y no fue auto-aplicada, fn-revisor explica por que en su output. Lee y decide: aprobar manual o tunear condicion."
@@ -0,0 +1,65 @@
+---
+id: "0123"
+title: "/flow run + fn-meta-orquestador: ejecutar flows + paralelo issues autonomos"
+status: pendiente
+type: feature
+domain:
+  - meta
+  - dev-ux
+scope: agent
+priority: media
+depends:
+  - "0122"
+blocks: []
+related:
+  - "0069"
+  - "0102"
+created: 2026-05-18
+updated: 2026-05-18
+tags: [flows, runner, meta-orquestador, paralelo, priorizador]
+---
+
+# 0123 — Flows ejecutables + meta-orquestador paralelo
+
+## Problema
+
+1. 12 flows declarados en `dev/flows/`, 0 cerrados. Fase 2 (`/flow run`) NUNCA implementada. Flows son docs estaticos sin musculo ejecutivo. Ningun subagente los consume.
+2. `parallel-fix-issues` lanza N agentes Claude vanilla en worktrees. `fn-orquestador` lanza 1 issue autonomo en worktree. NO existe combinacion: N issues autonomos coordinados respetando dep-graph.
+3. `/work today` prioriza con regla fija (prio+deps+DoD%). NO usa errores e2e, blast radius ni huerfanas para reordenar.
+
+## Decision
+
+Tres piezas:
+
+1. **`/flow run <NNNN>`**: ejecuta Acceptance checkboxes como steps. Cada step = `./fn run <id>` o subagent call. Logea en `data_factory.runs` + `e2e_runs`.
+2. **`/fix-flow <NNNN>`**: simetrico a `/fix-issue`. Cierra DoD del flow ejecutando Acceptance + abriendo issues si falla algun step.
+3. **`fn-meta-orquestador`** (subagente nuevo): lee `dev/issues/` con `status=pendiente` + dep-graph + telemetria. Spawn N `fn-orquestador` en worktrees paralelos respetando deps. Reusa `parallel-fix-issues/scripts/setup-worktrees.sh`.
+4. **`fn-priorizador`** (subagente nuevo): lee issues + telemetria call_monitor (error_rate, blast radius, huerfanas, violations). Output: top-N reordenado para `/work today`.
+5. **`fn doctor issues` + `fn doctor flows`**: valida TAXONOMY allowlist + DoD presente + user-facing surface declarada.
+
+## Tareas
+
+1. Implementar `/flow run` en `.claude/commands/flow.md` + parser de Acceptance + dispatcher de steps.
+2. Implementar `/fix-flow` espejando `/fix-issue` adaptado al frontmatter de flows.
+3. Escribir `.claude/agents/fn-meta-orquestador/SKILL.md` con dep-graph resolver + spawner paralelo.
+4. Escribir `.claude/agents/fn-priorizador/SKILL.md` que consulta `call_monitor.operations.db` + `task_runs`.
+5. Anadir subcomandos `fn doctor issues` + `fn doctor flows` con funciones auxiliares via `fn-constructor`.
+6. Test: lanzar `/fix-flow 0001` (hn-top-stories) end-to-end + verificar acceptance.
+
+## Acceptance
+
+- [ ] `/flow run 0001` ejecuta cada step y reporta pass/fail por step.
+- [ ] `/fix-flow 0001` cierra DoD verde y mueve a `dev/flows/completed/`.
+- [ ] `fn-meta-orquestador` lanza N orquestadores paralelos sobre issues sin dep entre si.
+- [ ] `fn-priorizador` output incluye senal de telemetria (no solo prio+deps).
+- [ ] `fn doctor issues --json` detecta drift TAXONOMY.
+- [ ] `fn doctor flows --json` detecta flows sin DoD ni user-facing surface.
+- [ ] 1 flow real cerrado (`status=done` + en `completed/`).
+
+## DoD
+
+User-facing surface:
+- **Donde**: `/flow run` + `/work today` en terminal + tab Work del dashboard.
+- **Latencia**: `/flow run` reporta progreso live por step.
+- **Como vuelve**: `/work today` cada manana muestra top reordenado.
+- **Onboarding**: "Para arrancar el dia, `/work today`. Para cerrar un flow, `/fix-flow <NNNN>`. Para lanzar varios issues a la vez, `fn-meta-orquestador` via skill o spawn manual."