Indexa las 58 funciones del stack ComfyUI (grupos comfyui + comfyui-skill + comfyui-judge) por capacidad: txt2img, img2img/inpaint, controlnet, skills/multiestilo-LoRA, video, upscale/detail, 3D, juez/calidad y operación/infra. Cada capacidad mapea a sus builders/pipelines del registry, grafos UI y skills. Añade fila en docs/capabilities/INDEX.md. El catálogo navegable con los grafos en disco (reorganizados en subcarpetas por capacidad bajo ~/ComfyUI/user/default/workflows/) vive fuera del repo en ~/ComfyUI/CAPABILITIES.md (no versionado). Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
8.6 KiB
ComfyUI — mapa de capacidades de generación
Vista de pájaro de qué sabemos generar con ComfyUI, organizada por capacidad. Es el índice de entrada al stack ComfyUI: cruza cada capacidad con las funciones del registry que la implementan, los grafos UI cargables y las skills (recetas) que la materializan.
Las tres páginas madre detalladas siguen siendo la fuente de verdad por grupo:
- comfyui.md — grupo
comfyui: builders de workflow, ejecución HTTP, UI vía CDP, I/O. - comfyui-skill.md — grupo
comfyui-skill: recetas de estilo versionadas. - comfyui-judge.md — grupo
comfyui-judge: panel multi-juez de calidad.
El catálogo navegable con los grafos concretos en disco (subcarpetas por capacidad, cómo cargar
cada uno) vive fuera del repo, junto a la instalación: ~/ComfyUI/CAPABILITIES.md. Este doc es
su contraparte versionable: el mapa capacidad → grupo de funciones que sí pertenece a fn_registry.
Filtros MCP: mcp__registry__fn_search query="" tag="comfyui" (y tag="comfyui-skill",
tag="comfyui-judge").
Las capacidades de un vistazo
| # | Capacidad | Qué resuelve | Builders / pipelines clave | Grafo UI | Skills |
|---|---|---|---|---|---|
| 01 | txt2img | prompt → imagen (SD1.5/SDXL/Flux) | build_txt2img, build_flux, build_sdxl_refiner, txt2img_oneshot |
✅ ×2 | — |
| 02 | img2img / inpaint | imagen → imagen, regenerar zona enmascarada | build_img2img, build_inpaint |
✅ | — |
| 03 | controlnet | generación guiada por mapa (depth/pose/canny) | build_controlnet |
✅ | — |
| 04 | skills (multiestilo/LoRA) | recetas de estilo reproducibles con {subject} |
build_skill_workflow, inject_lora, generate_with_skill_oneshot, harvest_civitai_skill_oneshot |
✅ ×2 | ✅ ×2 |
| 05 | video | imagen/texto → vídeo (SVD, LTX, Wan) | build_img2vid, build_video |
✅ | — |
| 06 | upscale / detail | ampliar y recuperar detalle (ESRGAN, hires-fix, FaceDetailer) | build_upscale, build_hires_fix, inject_hires_fix, build_facedetailer |
— | — |
| 07 | 3D | imagen/texto → malla 3D (Hunyuan3D) + limpieza | build_image_to_3d, build_textured_3d_multiview, image_to_3d_oneshot, text_to_3d_oneshot, mesh_cleanup_oneshot |
— | — |
| 08 | juez / calidad | puntuar lo generado (gate de DoD y bucle de mejora) | judge_image, score_aesthetic, score_clip_alignment, critique_image_llm |
— | — |
| 09 | operación / infra | server, modelos, cola, encolar/esperar, I/O de workflows | ensure_server, submit_workflow, wait_result, validate_workflow, download_model, run_foreign_workflow_oneshot |
— | — |
Las capacidades 01-05 ya tienen grafo UI cargable; 06-08 están cubiertas por funciones del registry pero sin grafo UI todavía (se añade su subcarpeta cuando aparezca el primero). 09 es la maquinaria transversal que habilita el resto, no una capacidad de generación.
Mapa capacidad → funciones del registry
01 · txt2img
comfyui_build_txt2img_workflow_py_ml(pura) — SD1.5/SDXL: CheckpointLoader → CLIPTextEncode×2 → KSampler → VAEDecode → SaveImage.comfyui_build_flux_workflow_py_ml(pura) — Flux: UNETLoader + DualCLIPLoader + VAELoader, guía por FluxGuidance.comfyui_build_sdxl_refiner_workflow_py_ml(pura) — SDXL base+refiner (2 KSamplerAdvanced encadenados).comfyui_txt2img_oneshot_py_pipelines— prompt → PNG en disco (build + submit + wait + fetch).
02 · img2img / inpaint
comfyui_build_img2img_workflow_py_ml(pura) — LoadImage → VAEEncode → KSampler (denoise<1).comfyui_build_inpaint_workflow_py_ml(pura) — LoadImage + LoadImageMask → VAEEncodeForInpaint.
03 · controlnet
comfyui_build_controlnet_workflow_py_ml(pura) — ControlNetLoader → ControlNetApply sobre el condicionamiento positivo.
04 · skills (multiestilo / LoRA)
comfyui_build_skill_workflow_py_ml(pura) — compila una receta (recipe.json) a workflow, sustituye{subject}, encadena LoRAs + post-proceso.comfyui_inject_lora_py_ml(pura) — insertaLoraLoaderen un workflow ya construido (encadenable).comfyui_generate_with_skill_oneshot_py_pipelines— skill + subject → PNG juzgado.comfyui_harvest_civitai_skill_oneshot_py_pipelines— Civitai → skill candidata.comfyui_export_skill_template_py_ml— skill → template API + grafo UI cargable.comfyui_extract_recipe_from_png_py_ml— destila un PNG de Civitai en receta candidata.- CRUD + telemetría:
comfyui_list_skills_py_ml,comfyui_load_skill_py_ml,comfyui_save_skill_py_ml,comfyui_update_skill_score_py_ml,comfyui_bump_skill_version_py_ml.
05 · video
comfyui_build_img2vid_workflow_py_ml(pura) — SVD: condicionamiento por CLIP_VISION (sin prompt de texto).comfyui_build_video_workflow_py_ml(pura) — txt2video LTX-Video 2B o Wan2.1 1.3B.
06 · upscale / detail
comfyui_build_upscale_workflow_py_ml(pura) — ESRGAN (model) o reescalado pixel (latent).comfyui_build_hires_fix_workflow_py_ml(pura) — hires-fix 2 pasadas (UltimateSDUpscale por tiles + Remacri).comfyui_inject_hires_fix_py_ml(pura) — inyecta la 2ª pasada en un workflow ya construido.comfyui_build_facedetailer_workflow_py_ml(pura) — FaceDetailer (detecta caras YOLO y las regenera).
07 · 3D
comfyui_build_image_to_3d_workflow_py_ml(pura) — imagen → GLB (Hunyuan3D-2 nativo, 9 nodos).comfyui_build_textured_3d_multiview_workflow_py_ml(pura) — malla texturizada PBR multi-vista (Hunyuan3DWrapper).comfyui_build_view_3d_workflow_py_ml(pura) — visor 3D nativo (Load3D) para orbitar un GLB existente.comfyui_generate_views_from_image_py_ml— sintetiza vistas novel-view (StableZero123/SV3D).- Pipelines:
comfyui_image_to_3d_oneshot_py_pipelines,comfyui_text_to_3d_oneshot_py_pipelines,comfyui_mesh_cleanup_oneshot_py_pipelines. - Mallas:
comfyui_simplify_mesh_py_ml,comfyui_make_watertight_py_ml,comfyui_install_3d_model_py_ml. - Relación: el grupo img-to-3d es la vía ligera (relieve por profundidad) que produce el GLB que mesh-3d renderiza; ComfyUI/Hunyuan3D es la vía pesada de malla volumétrica real.
08 · juez / calidad
comfyui_judge_image_py_ml— panel agregador (estético + CLIP + LLM-vision), veredicto por mayoría.comfyui_score_aesthetic_py_ml— score estético LAION-V2 (0-10).comfyui_score_clip_alignment_py_ml— fidelidad prompt↔imagen vía CLIP (0-1).comfyui_critique_image_llm_py_ml— crítica LLM-vision (artefactos, anatomía, texto, watermarks).
09 · operación / infra (transversal)
- Server:
comfyui_ensure_server_py_infra. - Modelos:
comfyui_download_model_py_ml,comfyui_list_installed_models_py_ml,comfyui_install_custom_node_py_ml. - Ejecución:
comfyui_submit_workflow_py_ml,comfyui_wait_result_py_ml,comfyui_stream_progress_py_ml,comfyui_validate_workflow_py_ml,comfyui_object_info_py_ml. - Cola:
comfyui_queue_manage_py_ml,comfyui_interrupt_queue_py_ml. - Outputs:
comfyui_fetch_output_image_py_ml,comfyui_fetch_output_video_py_ml,comfyui_fetch_output_mesh_py_ml. - Barridos:
comfyui_batch_generate_py_ml,comfyui_build_grid_py_ml. - Workflows I/O:
comfyui_import_workflow_json_py_ml,comfyui_import_workflow_png_py_ml,comfyui_read_png_metadata_py_ml,comfyui_download_workflow_py_ml,comfyui_run_foreign_workflow_oneshot_py_pipelines. - UI vía CDP:
comfyui_load_workflow_ui_py_browser,comfyui_export_workflow_ui_py_browser,comfyui_queue_prompt_ui_py_browser,comfyui_clear_node_outputs_ui_py_browser.
Librería de grafos en disco
Los grafos UI cargables viven en ~/ComfyUI/user/default/workflows/, agrupados en subcarpetas
numeradas por capacidad (01_txt2img/, 02_img2img/, 03_controlnet/, 04_skills/, 05_video/).
ComfyUI las lista recursivamente (GET /api/userdata?dir=workflows&recurse=true) y el menú
Workflows del navegador las muestra como árbol anidado, así que las capacidades quedan visibles
en la propia UI. La regla de clasificación de un grafo nuevo (por su nodo terminal) y el detalle de
cada grafo concreto están en ~/ComfyUI/CAPABILITIES.md.
Fronteras
- Este doc es un índice cross-grupo: no documenta firmas completas ni gotchas por función — eso
vive en las páginas madre (
comfyui.md,comfyui-skill.md,comfyui-judge.md) y en cada.mdde función. Aquí solo está el mapa capacidad → función. - No cubre la generación en sí (ejecutar workflows contra la GPU); cubre el catálogo de qué capacidades existen y con qué piezas se componen.