d1a3d58a6b
Mejoras transversales del motor de render (no del contenido de capítulos): 1. Fix negrita pisa texto (PDF): _place_rich_lines mide el ancho REAL de cada span con las métricas de fuente del renderer (peso correcto) en vez del grid de ancho medio; negrita y normal en la misma línea ya no se solapan. 2. Zebra striping: filas pares sombreadas (#f6f8fa) en DataTable (PDF + PPTX), coherente al partir tablas largas (índice de fila lógico, no por página). 3. Keep-together: bloque Group nuevo; el renderer mide el grupo entero y lo mueve completo a la página/slide siguiente si no cabe, y encoge la figura (height_in) para dejar sitio a su título y texto. num_distr lo usa. 4. Caption siempre visible en toda figura PPTX (fallback al heading); la figura reserva el alto de su caption para que ambos quepan en el mismo slide. 5. Portada construida al final (con resumen agregado del análisis vía ctx['document_summary']) pero colocada primera por build_document. 6. Glosario: capítulo nuevo (último) + GlossaryCollector en ctx; los capítulos registran términos y marcan apariciones con [[term:key]]...[[/term]]. Links clicables reales: PDF (PyMuPDF, link GOTO) y PPTX (slide-jump nativo). Enganchado "entropía" en cat_distr como ejemplo end-to-end. Funciones reutilizables delegadas a fn-constructor (tag eda): - add_pdf_internal_links_py_datascience (PyMuPDF) - pptx_link_run_to_slide_py_datascience (slide-jump) Contrato docs/automatic_eda_contract.md actualizado (§1/§3/§5 + §11 nueva) con la API de glosario, keep-together y zebra para la siguiente fase. PyMuPDF declarado en pyproject. Suite verde (90 tests); golden titanic verificado. Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
70 lines
1.8 KiB
TOML
70 lines
1.8 KiB
TOML
[project]
|
|
name = "fn-registry-python"
|
|
version = "0.1.0"
|
|
description = "Funciones Python del fn-registry: Metabase API, ML, utilidades"
|
|
readme = "README.md"
|
|
requires-python = ">=3.12"
|
|
dependencies = [
|
|
"chardet>=7.4.3",
|
|
"contextily>=1.7.0",
|
|
"cryptography>=46.0.6",
|
|
"duckdb>=1.5.2",
|
|
"fpdf2>=2.8.7",
|
|
"geopandas>=1.1.3",
|
|
"google-api-python-client>=2.197.0",
|
|
"google-auth>=2.49.1",
|
|
"google-cloud-bigquery>=3.25",
|
|
"google-cloud-bigquery-datatransfer>=3.22.0",
|
|
"google-cloud-bigquery-storage>=2.27",
|
|
"google-cloud-storage>=3.10.1",
|
|
"httpx",
|
|
"matplotlib>=3.10.9",
|
|
"opencv-contrib-python-headless>=4.13.0.92",
|
|
"openpyxl>=3.1.5",
|
|
"pillow>=12.2.0",
|
|
"polars>=1.40.1",
|
|
"pymeshlab>=2025.7.post1",
|
|
"pymssql>=2.3.13",
|
|
"pymupdf>=1.28.0",
|
|
"pypdf>=6.10.0",
|
|
"pyproj>=3.7.2",
|
|
"python-docx>=1.2.0",
|
|
"python-pptx>=1.0.2",
|
|
"pyyaml>=6.0.3",
|
|
"qrcode[pil]>=8.2",
|
|
"rapidfuzz>=3.14.5",
|
|
"reportlab>=4.5.0",
|
|
"scikit-image>=0.26.0",
|
|
"scikit-learn>=1.8.0",
|
|
"scipy>=1.17.1",
|
|
"seaborn>=0.13.2",
|
|
"shapely>=2.1.2",
|
|
"statsmodels>=0.14.6",
|
|
"trimesh>=4.12.2",
|
|
"xlrd>=2.0.2",
|
|
]
|
|
|
|
[project.optional-dependencies]
|
|
nlp = [
|
|
"gliner>=0.2.13",
|
|
"glirel>=1.0.0",
|
|
]
|
|
jupyter = [
|
|
"jupyterlab>=4.0",
|
|
"jupyter-collaboration>=2.0",
|
|
"jupyter-mcp-server",
|
|
]
|
|
|
|
[dependency-groups]
|
|
dev = [
|
|
"pytest>=9.0.2",
|
|
]
|
|
|
|
[tool.pytest.ini_options]
|
|
# Las funciones del registry importan paquetes por su nombre raiz
|
|
# (p.ej. `from obsidian import format_obsidian_note`), por lo que el
|
|
# directorio `functions/` debe estar en sys.path al recolectar tests.
|
|
# `functions/obsidian` permite a los tests importar los modulos hoja por
|
|
# su nombre directo (p.ej. `from format_obsidian_note import ...`).
|
|
pythonpath = ["functions", "functions/obsidian"]
|