Files
fn_registry/docs/capabilities/comfyui-overview.md
T
agent d5660aa13f docs(comfyui): añade capacidad 10 ipadapter/referencia (en construcción) al overview
El flujo de funciones+server está creando comfyui_build_ipadapter_workflow e
comfyui_inject_multi_lora (vistos sin indexar en python/functions/ml/ el
24/06/2026). Se documentan como capacidad emergente para que el mapa esté
completo; sus IDs reales se rellenarán cuando se ejecute fn index.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-24 17:46:45 +02:00

9.1 KiB
Raw Blame History

ComfyUI — mapa de capacidades de generación

Vista de pájaro de qué sabemos generar con ComfyUI, organizada por capacidad. Es el índice de entrada al stack ComfyUI: cruza cada capacidad con las funciones del registry que la implementan, los grafos UI cargables y las skills (recetas) que la materializan.

Las tres páginas madre detalladas siguen siendo la fuente de verdad por grupo:

  • comfyui.md — grupo comfyui: builders de workflow, ejecución HTTP, UI vía CDP, I/O.
  • comfyui-skill.md — grupo comfyui-skill: recetas de estilo versionadas.
  • comfyui-judge.md — grupo comfyui-judge: panel multi-juez de calidad.

El catálogo navegable con los grafos concretos en disco (subcarpetas por capacidad, cómo cargar cada uno) vive fuera del repo, junto a la instalación: ~/ComfyUI/CAPABILITIES.md. Este doc es su contraparte versionable: el mapa capacidad → grupo de funciones que sí pertenece a fn_registry.

Filtros MCP: mcp__registry__fn_search query="" tag="comfyui" (y tag="comfyui-skill", tag="comfyui-judge").

Las capacidades de un vistazo

# Capacidad Qué resuelve Builders / pipelines clave Grafo UI Skills
01 txt2img prompt → imagen (SD1.5/SDXL/Flux) build_txt2img, build_flux, build_sdxl_refiner, txt2img_oneshot ×2
02 img2img / inpaint imagen → imagen, regenerar zona enmascarada build_img2img, build_inpaint
03 controlnet generación guiada por mapa (depth/pose/canny) build_controlnet
04 skills (multiestilo/LoRA) recetas de estilo reproducibles con {subject} build_skill_workflow, inject_lora, generate_with_skill_oneshot, harvest_civitai_skill_oneshot ×2 ×2
05 video imagen/texto → vídeo (SVD, LTX, Wan) build_img2vid, build_video
06 upscale / detail ampliar y recuperar detalle (ESRGAN, hires-fix, FaceDetailer) build_upscale, build_hires_fix, inject_hires_fix, build_facedetailer
07 3D imagen/texto → malla 3D (Hunyuan3D) + limpieza build_image_to_3d, build_textured_3d_multiview, image_to_3d_oneshot, text_to_3d_oneshot, mesh_cleanup_oneshot
08 juez / calidad puntuar lo generado (gate de DoD y bucle de mejora) judge_image, score_aesthetic, score_clip_alignment, critique_image_llm
09 operación / infra server, modelos, cola, encolar/esperar, I/O de workflows ensure_server, submit_workflow, wait_result, validate_workflow, download_model, run_foreign_workflow_oneshot
10 ipadapter / referencia (en construcción) guiar por imagen de referencia (estilo/sujeto) sin LoRA + encadenar varios LoRAs en una llamada build_ipadapter_workflow, inject_multi_lora (añadiéndose ahora; no indexadas todavía)

Las capacidades 01-05 ya tienen grafo UI cargable; 06-08 están cubiertas por funciones del registry pero sin grafo UI todavía (se añade su subcarpeta cuando aparezca el primero). 09 es la maquinaria transversal que habilita el resto, no una capacidad de generación. 10 está en construcción por el flujo de funciones+server (al 24/06/2026 vi comfyui_build_ipadapter_workflow e comfyui_inject_multi_lora en python/functions/ml/ sin indexar aún): se completará este mapa con sus IDs reales cuando se ejecute fn index.

Mapa capacidad → funciones del registry

01 · txt2img

  • comfyui_build_txt2img_workflow_py_ml (pura) — SD1.5/SDXL: CheckpointLoader → CLIPTextEncode×2 → KSampler → VAEDecode → SaveImage.
  • comfyui_build_flux_workflow_py_ml (pura) — Flux: UNETLoader + DualCLIPLoader + VAELoader, guía por FluxGuidance.
  • comfyui_build_sdxl_refiner_workflow_py_ml (pura) — SDXL base+refiner (2 KSamplerAdvanced encadenados).
  • comfyui_txt2img_oneshot_py_pipelines — prompt → PNG en disco (build + submit + wait + fetch).

02 · img2img / inpaint

  • comfyui_build_img2img_workflow_py_ml (pura) — LoadImage → VAEEncode → KSampler (denoise<1).
  • comfyui_build_inpaint_workflow_py_ml (pura) — LoadImage + LoadImageMask → VAEEncodeForInpaint.

03 · controlnet

  • comfyui_build_controlnet_workflow_py_ml (pura) — ControlNetLoader → ControlNetApply sobre el condicionamiento positivo.

04 · skills (multiestilo / LoRA)

  • comfyui_build_skill_workflow_py_ml (pura) — compila una receta (recipe.json) a workflow, sustituye {subject}, encadena LoRAs + post-proceso.
  • comfyui_inject_lora_py_ml (pura) — inserta LoraLoader en un workflow ya construido (encadenable).
  • comfyui_generate_with_skill_oneshot_py_pipelines — skill + subject → PNG juzgado.
  • comfyui_harvest_civitai_skill_oneshot_py_pipelines — Civitai → skill candidata.
  • comfyui_export_skill_template_py_ml — skill → template API + grafo UI cargable.
  • comfyui_extract_recipe_from_png_py_ml — destila un PNG de Civitai en receta candidata.
  • CRUD + telemetría: comfyui_list_skills_py_ml, comfyui_load_skill_py_ml, comfyui_save_skill_py_ml, comfyui_update_skill_score_py_ml, comfyui_bump_skill_version_py_ml.

05 · video

  • comfyui_build_img2vid_workflow_py_ml (pura) — SVD: condicionamiento por CLIP_VISION (sin prompt de texto).
  • comfyui_build_video_workflow_py_ml (pura) — txt2video LTX-Video 2B o Wan2.1 1.3B.

06 · upscale / detail

  • comfyui_build_upscale_workflow_py_ml (pura) — ESRGAN (model) o reescalado pixel (latent).
  • comfyui_build_hires_fix_workflow_py_ml (pura) — hires-fix 2 pasadas (UltimateSDUpscale por tiles + Remacri).
  • comfyui_inject_hires_fix_py_ml (pura) — inyecta la 2ª pasada en un workflow ya construido.
  • comfyui_build_facedetailer_workflow_py_ml (pura) — FaceDetailer (detecta caras YOLO y las regenera).

07 · 3D

  • comfyui_build_image_to_3d_workflow_py_ml (pura) — imagen → GLB (Hunyuan3D-2 nativo, 9 nodos).
  • comfyui_build_textured_3d_multiview_workflow_py_ml (pura) — malla texturizada PBR multi-vista (Hunyuan3DWrapper).
  • comfyui_build_view_3d_workflow_py_ml (pura) — visor 3D nativo (Load3D) para orbitar un GLB existente.
  • comfyui_generate_views_from_image_py_ml — sintetiza vistas novel-view (StableZero123/SV3D).
  • Pipelines: comfyui_image_to_3d_oneshot_py_pipelines, comfyui_text_to_3d_oneshot_py_pipelines, comfyui_mesh_cleanup_oneshot_py_pipelines.
  • Mallas: comfyui_simplify_mesh_py_ml, comfyui_make_watertight_py_ml, comfyui_install_3d_model_py_ml.
  • Relación: el grupo img-to-3d es la vía ligera (relieve por profundidad) que produce el GLB que mesh-3d renderiza; ComfyUI/Hunyuan3D es la vía pesada de malla volumétrica real.

08 · juez / calidad

  • comfyui_judge_image_py_ml — panel agregador (estético + CLIP + LLM-vision), veredicto por mayoría.
  • comfyui_score_aesthetic_py_ml — score estético LAION-V2 (0-10).
  • comfyui_score_clip_alignment_py_ml — fidelidad prompt↔imagen vía CLIP (0-1).
  • comfyui_critique_image_llm_py_ml — crítica LLM-vision (artefactos, anatomía, texto, watermarks).

09 · operación / infra (transversal)

  • Server: comfyui_ensure_server_py_infra.
  • Modelos: comfyui_download_model_py_ml, comfyui_list_installed_models_py_ml, comfyui_install_custom_node_py_ml.
  • Ejecución: comfyui_submit_workflow_py_ml, comfyui_wait_result_py_ml, comfyui_stream_progress_py_ml, comfyui_validate_workflow_py_ml, comfyui_object_info_py_ml.
  • Cola: comfyui_queue_manage_py_ml, comfyui_interrupt_queue_py_ml.
  • Outputs: comfyui_fetch_output_image_py_ml, comfyui_fetch_output_video_py_ml, comfyui_fetch_output_mesh_py_ml.
  • Barridos: comfyui_batch_generate_py_ml, comfyui_build_grid_py_ml.
  • Workflows I/O: comfyui_import_workflow_json_py_ml, comfyui_import_workflow_png_py_ml, comfyui_read_png_metadata_py_ml, comfyui_download_workflow_py_ml, comfyui_run_foreign_workflow_oneshot_py_pipelines.
  • UI vía CDP: comfyui_load_workflow_ui_py_browser, comfyui_export_workflow_ui_py_browser, comfyui_queue_prompt_ui_py_browser, comfyui_clear_node_outputs_ui_py_browser.

Librería de grafos en disco

Los grafos UI cargables viven en ~/ComfyUI/user/default/workflows/, agrupados en subcarpetas numeradas por capacidad (01_txt2img/, 02_img2img/, 03_controlnet/, 04_skills/, 05_video/). ComfyUI las lista recursivamente (GET /api/userdata?dir=workflows&recurse=true) y el menú Workflows del navegador las muestra como árbol anidado, así que las capacidades quedan visibles en la propia UI. La regla de clasificación de un grafo nuevo (por su nodo terminal) y el detalle de cada grafo concreto están en ~/ComfyUI/CAPABILITIES.md.

Fronteras

  • Este doc es un índice cross-grupo: no documenta firmas completas ni gotchas por función — eso vive en las páginas madre (comfyui.md, comfyui-skill.md, comfyui-judge.md) y en cada .md de función. Aquí solo está el mapa capacidad → función.
  • No cubre la generación en sí (ejecutar workflows contra la GPU); cubre el catálogo de qué capacidades existen y con qué piezas se componen.