fn_registry/dev/issues/0083-imagegen-spike02-cross-validation.md at master

Files

T

egutierrez fad4006f60 feat(dev): issues 0100-0104 — dev_console binary + work_tab + DoD user-facing + frontmatter migration de 146 issues + taxonomia canonica

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-17 02:44:04 +02:00

3.7 KiB

Raw Permalink Blame History

id, title, status, type, domain, scope, priority, depends, blocks, related, created, updated, tags

title

status

type

domain

scope

priority

depends

blocks

created

updated

Objetivo

Notebook 02_cross_validation.ipynb que ejecuta los mismos GenerationConfig con los dos backends operativos (diffusers GPU + sdcpp_python CPU) sobre SD Turbo, genera grid lado-a-lado con image_compare_side_by_side_py_ml y decide cuales configs portan bien entre backends y cuales requieren ajuste.

Contexto

Backend diffusers GPU operativo (Ola 3.A) — 192ms/imagen warm, VRAM 3097MB.
Backend sdcpp_python CPU operativo (Ola 3.B) — 27s/imagen 512x512 4 steps.
Funcion image_compare_side_by_side_py_ml lista (Ola 3.D) con grid + diff perceptual + pHash + pixel MSE.
Documento Stack de generacion de imagenes (raiz proyecto imagegen) dice: "Bit-exact entre backends es imposible. Aceptamos diff perceptual."

Arquitectura

Archivos NUEVOS:

projects/imagegen/analysis/spike_diffusers_vs_sdcpp/notebooks/02_cross_validation.ipynb
~/vaults/imagegen_models/configs/cross_validated/*.json — configs que pasan
~/vaults/imagegen_models/outputs/cross/*.png — grids A | diff | B

NO se crean funciones nuevas — todo se compone de funciones existentes del registry.

Tareas

Plan del notebook (declarar al usuario antes de escribirlo) 1.1. Titulo, objetivo, criterio PASS (pHash distance < umbral X, pixel_mse < Y) 1.2. Lista de celdas y output esperado por celda
Notebook 2.1. Celda hardware check + GPU info (reuse). 2.2. Definir 4 configs base (seeds 42, 123, 7, 999), SD Turbo, 1-step euler_a, 512x512. 2.3. Loop config: generar A=diffusers, B=sdcpp_python. 2.4. image_compare_side_by_side(A, B, label_a="diffusers", label_b="sdcpp") por par. 2.5. Tabla resumen: pHash distance, pixel MSE, duration_a, duration_b. 2.6. Veredicto por config: PASS si pHash<=N (a calibrar), FAIL si no. 2.7. Guardar grids comparativos a vault.
Ejecutar el notebook desde la sesion claude 3.1. Lanzar Jupyter si no esta arriba. 3.2. Ejecutar celdas 1..N via jupyter_exec_py_notebook cell. 3.3. Reportar veredicto por config.
Conclusion 4.1. Si todos los configs PASS → contrato GenerationConfig es portable. 4.2. Si alguno FAIL → documentar campo problematico (sampler, cfg_scale, ...) y abrir proposal de ajuste.

Ejemplo de uso

Output esperado al final:

seed=42   pHash_dist=12  pixel_mse=812.4  diffusers=189ms  sdcpp=26200ms  PASS
seed=123  pHash_dist=14  pixel_mse=901.0  diffusers=192ms  sdcpp=27100ms  PASS
seed=7    pHash_dist=11  pixel_mse=750.8  diffusers=187ms  sdcpp=26800ms  PASS
seed=999  pHash_dist=18  pixel_mse=1102.3 diffusers=194ms  sdcpp=27500ms  PASS
VEREDICTO GLOBAL: PASS (contrato portable)

Decisiones

Umbrales pHash y MSE se calibran en este notebook — no hay valor previo. Empezar con pHash<=20 (bastante permisivo), pixel_mse<=2000.
imagehash puede no estar instalado en el venv — pip install imagehash como primera celda si falta.
Solo SD Turbo en este notebook — modelos mayores (SDXL Turbo, FLUX) iran en notebooks separados cuando se descarguen.

Prerequisitos

Backends 3.A + 3.B operativos (hechos).
SD Turbo en vault (hecho).
Jupyter del analysis levantado (script run-jupyter-lab.sh).

Riesgos

sdcpp_python tarda ~27s por imagen en CPU → 4 imagenes x 2 backends = ~2 min de espera real, aceptable.
pHash de imagehash requiere instalar el paquete — documentar en cell 0.
Si el sampler de sd.cpp difiere demasiado del de diffusers (ej. trailing timesteps de SD Turbo), la diff sera grande aunque la implementacion sea OK.

3.7 KiB Raw Permalink Blame History