Files
fn_registry/python/functions/ml/comfyui_pixelize_image.md
T
egutierrez c79f33265e fix(comfyui): pixelart_real_oneshot — sprite llena el frame + fondo transparente
Arregla los dos defectos reportados del pipeline comfyui_pixelart_real_oneshot:
el sujeto salía diminuto respecto al frame y siempre traía fondo (sin opción de
transparencia).

Causa raíz: comfyui_pixelize_image hacía convert("RGB") y descartaba el alpha;
comfyui_build_pixelart_workflow no inyectaba rembg (a diferencia de sus hermanos
item_icon/enemy_creature); y no había ningún paso de auto-crop al contenido.

Orden correcto del pipeline ahora:
generar (rembg) -> autocrop al bbox + cuadrar -> downscale (alpha aparte por
PixelOE) -> cuantización alpha-aware -> PNG RGBA transparente.

Piezas:
- comfyui_pixelize_image (1.1.0): keep_alpha/alpha_threshold. Con RGBA cuantiza
  solo el RGB (fondo transparente relleno con la moda del sujeto, fuera de la
  paleta) y preserva/binariza el alpha aparte. RGB sin alpha intacto.
- crop_to_content (NUEVA, pura PIL): bbox del contenido (alpha o diff-fondo) ->
  recorta -> margen -> cuadra centrando. No-throw; imagen vacía -> copia intacta.
- comfyui_build_pixelart_workflow (1.1.0): transparent=True + rembg_model.
  Inyecta nodo Image Rembg tras VAEDecode (patrón de item_icon).
- comfyui_pixelart_real_oneshot (1.1.0): transparent + autocrop + crop_pad_ratio
  + rembg_model. Recombina el alpha aparte tras PixelOE (trabaja en RGB). Campos
  nuevos: has_alpha, autocrop_applied.

Verificado en GPU (knight 64px): RGBA con 4 esquinas alpha==0, contenido cubre
88% del frame (antes 48%), 16 colores, 64x64. 32 tests offline en verde.
Report: reports/0218-2026-06-28-pixelart-sprite-fix.md

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-28 15:59:26 +02:00

6.9 KiB

name, kind, lang, domain, version, purity, signature, description, tags, uses_functions, uses_types, returns, returns_optional, error_type, imports, params, output, tested, tests, test_file_path, file_path
name kind lang domain version purity signature description tags uses_functions uses_types returns returns_optional error_type imports params output tested tests test_file_path file_path
comfyui_pixelize_image function py ml 1.1.0 impure def comfyui_pixelize_image(src_path: str, dst_path: str, *, downscale: int = 8, colors: int = 16, palette=None, dither: bool = False, upscale_back: bool = True, keep_alpha: bool = True, alpha_threshold: int = 128) -> dict Post-proceso pixel-perfect (Fase 2 pixelart): imagen -> downscale nearest-neighbor por factor (colapsa cada bloque borroso a un pixel duro) -> cuantizacion a N colores (MEDIANCUT) o a una paleta fija embebida (game-boy / pico-8 / nes / lista de hex) -> opcional re-upscale nearest conservando los pixeles duros. Alpha-aware: si la entrada es RGBA y keep_alpha, cuantiza SOLO el RGB (el fondo transparente no entra en la paleta) y preserva/binariza el alpha por separado -> PNG RGBA con transparencia real. Convierte el 'pixelart borroso de IA' en pixelart de verdad. Nucleo PIL puro, CPU-only: sin GPU, sin red. Devuelve {ok, out_path, size, n_colors_final, has_alpha, error}. Impura solo por la lectura/escritura de disco.
comfyui
gamedev-2d
pixelart
ml
pil
quantize
palette
image
alpha
transparent
false error_py_core
name desc
src_path ruta de la imagen de entrada (PNG/JPG/...).
name desc
dst_path ruta del PNG de salida (se crea el directorio si falta).
name desc
downscale factor entero de reduccion nearest (>=1); cada bloque downscale x downscale px colapsa a 1 pixel. 1 = solo cuantiza sin colapsar el grid. keyword-only.
name desc
colors numero de colores objetivo (2..256) cuando palette es None; cuantizacion MEDIANCUT determinista. keyword-only.
name desc
palette None (auto a 'colors'), nombre de paleta fija builtin ('game-boy','pico-8','nes') o lista de hex ('#rrggbb'/'rrggbb'). Una paleta fija ignora 'colors'. keyword-only.
name desc
dither aplica Floyd-Steinberg al cuantizar (off por defecto = pixelart limpio). keyword-only.
name desc
upscale_back re-escala nearest al tamano original (preview con pixeles duros). False deja la imagen pequena. keyword-only.
name desc
keep_alpha si True (default) y la entrada tiene canal alpha, preserva la transparencia: cuantiza solo el RGB y downscalea/binariza el alpha aparte -> PNG RGBA. Sin efecto si la imagen no tiene alpha (sale RGB igual que antes). keyword-only.
name desc
alpha_threshold umbral (0..255) para binarizar el alpha en opaco (255) o transparente (0). Solo aplica cuando se preserva el alpha. keyword-only.
dict con ok (bool), out_path (str), size ([w,h] de la imagen final), n_colors_final (int, colores RGB distintos; en la zona opaca si es RGBA), has_alpha (bool, True si la salida es RGBA), error (str, vacio si OK). true
test_golden_downscale_quantize
test_no_upscale_back_keeps_small
test_edge_fixed_palette_game_boy
test_edge_palette_list_hex
test_edge_downscale_1_only_quantizes
test_error_missing_src
test_error_downscale_zero
test_error_bad_palette
test_alpha_preserved_transparent_corners
test_alpha_off_flattens_to_rgb
test_rgb_input_unaffected_by_keep_alpha
test_error_all_transparent_no_crash
python/functions/ml/comfyui_pixelize_image_test.py python/functions/ml/comfyui_pixelize_image.py

Ejemplo

import sys, os
sys.path.insert(0, os.path.join(os.environ["HOME"], "fn_registry", "python", "functions"))
from ml.comfyui_pixelize_image import comfyui_pixelize_image

# Crudo SDXL+SDXL_pixel-art 1024x1024 -> pixelart 16 colores, grid de 128
res = comfyui_pixelize_image(
    os.path.expanduser("~/ComfyUI/output/pixelart_00001_.png"),
    "/tmp/hero_pixel.png",
    downscale=8, colors=16,
)
# {'ok': True, 'out_path': '/tmp/hero_pixel.png', 'size': [1024, 1024], 'n_colors_final': 16, 'error': ''}

# Forzar la paleta retro Game Boy (4 colores) y dejar la imagen pequena (sin upscale)
comfyui_pixelize_image("/tmp/hero_pixel.png", "/tmp/hero_gb.png",
                       palette="game-boy", upscale_back=False)

# Sprite RGBA (tras rembg): preserva la transparencia, cuantiza solo el sujeto
res = comfyui_pixelize_image("/tmp/knight_rgba.png", "/tmp/knight_px.png",
                             downscale=1, colors=16, keep_alpha=True)
# {'ok': True, 'has_alpha': True, 'n_colors_final': 16, ...}  -> fondo transparente intacto

Cuando usarla

Fase 2 del pipeline pixelart: tras generar el crudo (SDXL + LoRA SDXL_pixel-art), para colapsar el grid borroso a pixeles duros y limitar la paleta. Si la imagen viene de rembg con fondo recortado (RGBA), keep_alpha=True mantiene la transparencia y deja el fondo fuera de la paleta. Tambien sirve para "pixelizar" cualquier imagen (sprite, render, foto) a estetica retro sin tocar la GPU. Para llevar el resultado a Godot con filtro Nearest: comfyui_export_asset_to_godot(out, "pixelart", proj).

Gotchas

  • nearest, no lanczos: el downscale usa NEAREST a proposito; interpolar suave re-difumina el grid. No lo cambies por "calidad".
  • palette fija (game-boy/pico-8/nes o lista de hex) ignora colors. La paleta se rellena internamente repitiendo su ultimo color para que quantize no introduzca un negro extra por entradas vacias (bug arreglado en v1.0.0).
  • downscale con upscale_back=False deja la imagen de w//downscale x h//downscale: util para spritesheets compactos; con True vuelve al tamano original con bordes duros (preview).
  • Todo error es dict ok=False (no excepcion): src_path inexistente, downscale<1, paleta desconocida -> error explica. No crashea ni borra nada.
  • n_colors_final cuenta colores RGB distintos reales del PNG escrito; con salida RGBA cuenta solo la zona opaca (el transparente no es un color del pixel-art); con paleta fija puede ser menor que el tamano de la paleta si la imagen no usa todos.
  • alpha-aware (v1.1.0): con entrada RGBA y keep_alpha=True (default), el fondo transparente se rellena internamente con la moda del sujeto antes de cuantizar, asi NO gasta una entrada de la paleta; el alpha se downscalea nearest aparte y se binariza por alpha_threshold (0/255 = bordes duros pixel-art). Entrada sin alpha -> comportamiento RGB identico al de antes (retrocompatible).
  • Si la entrada RGBA esta toda transparente (rembg sin sujeto), no crashea: devuelve ok=True, has_alpha=True, n_colors_final=0 y el PNG sigue transparente.
  • CPU-only: no toca la GPU ni el servidor ComfyUI; corre en cualquier interprete con Pillow (numpy acelera el relleno alpha; sin numpy degrada limpio).

Capability growth log

  • v1.1.0 (2026-06-28) — alpha-aware: keep_alpha/alpha_threshold. Si la entrada es RGBA, cuantiza solo el RGB (fondo transparente fuera de la paleta) y preserva el alpha binarizado -> PNG RGBA con transparencia real. Cierra el bug del pipeline pixelart que perdia el fondo transparente por el convert("RGB") (issue sprite-fix).