3cf8b21fea
Completa la promoción del flujo imagen->3D al registry (grupo de capacidad img-to-3d), extraído de la app img_to_3d_webapp. - remove_background_py_datascience (nueva): elimina el fondo con cascada rembg/U2Net -> OpenCV GrabCut -> umbral NumPy, compone el objeto sobre gris neutro y devuelve image + mask + engine. Impura, nunca lanza. Adaptada de backend/bg_removal.py con firma de ruta (image_path) y salida dict, demo CLI JSON-serializable. - depth_to_relief_glb_py_datascience (v1.1.0): añade el parámetro opcional mask para recortar la malla de relieve al objeto (descarta las caras del fondo), cerrando la cadena con remove_background. Aditivo (mask=None = comportamiento previo), fiel al original de backend/depth.py. - docs/capabilities/img-to-3d.md: incorpora remove_background como paso 0 (pre-proceso), actualiza el flujo a 3 pasos encadenados, la tabla de funciones (4), el ejemplo end-to-end con mask y las deps (rembg/opencv). - docs/capabilities/INDEX.md: conteo del grupo 3 -> 4. Las dos funciones ya presentes (estimate_image_depth, depth_to_relief_glb) y el pipeline build_relief_glb_from_image fueron promovidas en una ronda previa. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
6.0 KiB
6.0 KiB
name, kind, lang, domain, version, purity, signature, description, tags, uses_functions, uses_types, returns, returns_optional, error_type, imports, params, output, tested, tests, test_file_path, file_path
| name | kind | lang | domain | version | purity | signature | description | tags | uses_functions | uses_types | returns | returns_optional | error_type | imports | params | output | tested | tests | test_file_path | file_path | ||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| depth_to_relief_glb | function | py | datascience | 1.1.0 | impure | def depth_to_relief_glb(image: Image.Image, depth: np.ndarray, out_glb_path: str, z_scale: float = 0.35, max_dim: int = 220, mask: np.ndarray | None = None) -> dict | Construye una malla de relieve (heightmap) texturizada a partir de un mapa de profundidad + la imagen original y la exporta como glTF binario (.glb). El depth se vuelve el eje Z de un grid regular de vertices y la imagen se mapea como textura UV. Con mask opcional recorta la malla al objeto (descarta las caras del fondo). Paso 2 del flujo img->3D (grupo img-to-3d): consume la salida de estimate_image_depth y, opcionalmente, la mask de remove_background. |
|
false | error_go_core |
|
dict. Exito: {status:'ok', glb_path:str, vertices:int, faces:int, height:int, width:int}. Con mask, 'faces' es menor (solo caras del objeto); 'vertices' no cambia (el grid completo se conserva). Error: {status:'error', error:str} (depth con forma invalida, directorio de salida inexistente, fallo de trimesh.export). No lanza. | false | python/functions/datascience/depth_to_relief_glb.py |
Ejemplo
# Requiere un venv con torch + transformers + trimesh + pillow (el de apps/img_to_3d_webapp/backend/.venv).
# Import PLANO a los modulos (el paquete datascience.__init__ arrastra deps de otros dominios).
import sys
sys.path.insert(0, "python/functions/datascience")
from estimate_image_depth import estimate_image_depth
from depth_to_relief_glb import depth_to_relief_glb
est = estimate_image_depth("apps/img_to_3d_webapp/samples/cats.jpg")
assert est["status"] == "ok"
res = depth_to_relief_glb(est["image"], est["depth"], "/tmp/cats_relief.glb", z_scale=0.35, max_dim=220)
print(res["status"], res["vertices"], res["faces"]) # ok 48400 96114
print(res["glb_path"]) # /tmp/cats_relief.glb (cargable con useGLTF/GLTFLoader)
Lanzable end-to-end (el demo CLI encadena estimate_image_depth internamente):
./fn run depth_to_relief_glb_py_datascience apps/img_to_3d_webapp/samples/cats.jpg /tmp/cats_relief.glb
# {"status": "ok", "glb_path": "/tmp/cats_relief.glb", "vertices": ..., "faces": ..., ...}
Cuando usarla
Tras estimate_image_depth, cuando quieras un modelo 3D real (no solo el mapa de profundidad):
visualizar una foto en relieve navegable, exportar a un visor web (three.js useGLTF/GLTFLoader,
Babylon, model-viewer) o a cualquier herramienta que lea glTF. Es el paso 2 (final) del grupo
img-to-3d. Usa max_dim para equilibrar detalle vs peso del .glb y z_scale para exagerar o
suavizar el relieve.
Gotchas
- Impura: escribe el archivo .glb en
out_glb_path. El directorio padre debe existir otrimesh.exportfalla (vuelve como status error, no crash). - Dep: requiere
trimesh(4.5.x) +pillow+numpy.trimeshse importa dentro de la funcion. No esta en el venv del registry; vive en el venv de la appimg_to_3d_webapp. - No es reconstruccion real de geometria: es un heightmap (relieve 2.5D). Solo deforma un plano segun la profundidad; no recupera las caras ocultas ni el volumen trasero del objeto.
- El downsample a
max_dimusa interpolacion bilineal sobre el depth cuantizado a uint8 (0-255) para reescalar; introduce una ligera perdida de precision en la profundidad de la malla. - UV con V invertido (
1 - v) por convencion glTF; la textura es la imagen convertida a RGB. process=Falseen Trimesh: no se hace merge de vertices ni limpieza, para preservar la correspondencia 1:1 vertice<->pixel (necesaria para el mapeo UV del grid).- Import plano: importa el modulo directo, NO
from datascience import ...(el__init__del paquete arrastra deps de otros dominios ausentes en el venv de vision). Ver misma gotcha enestimate_image_depth. - mask opcional (v1.1.0): pasa la
maskderemove_backgroundpara recortar la malla al objeto. Se reescala con NEAREST (sin interpolar, preserva el borde binario), el fondo se aplana a Z=0 y sus caras se eliminan. El nº deverticesno baja (el grid completo se conserva para no romper el mapeo UV 1:1); solo bajafaces. Una mask degenerada (todo objeto) deja la malla intacta; una mask vacia (todo fondo) deja la malla sin caras (glb valido pero vacio).
Capability growth log
- v1.1.0 (2026-06-21) — anade parametro opcional
maskpara recortar la malla al objeto (descarta las caras del fondo), cerrando la cadena conremove_backgrounddel grupo img-to-3d. Aditivo:mask=Nonemantiene el comportamiento previo. Fiel al original debackend/depth.py.