feat(metabase): expansion de funciones Python — documents, collections, permissions, validation

Añade un conjunto amplio de funciones al paquete python/functions/metabase:
- Nuevos modulos: collections.py, documents.py, maintenance.py, permissions.py, validation.py (+ test).
- Ampliacion de cards.py, dashboards.py, client.py e __init__.py para exponer las nuevas operaciones.
- Funciones de documentos (create/get/update/delete/archive/copy/move + comentarios), grupos y memberships, permission/collection graphs, copy/move de cards y dashboards, validacion de MBQL/SQL y payloads, actualizacion segura de dashboards y fix_null_ratio.
- .md por funcion con frontmatter para que fn index los registre.
- Actualiza pyproject.toml y uv.lock con las dependencias resultantes.

Impacto: ampliamente mas cobertura de la API de Metabase desde el registry, reutilizable por apps y analisis. No toca Go ni frontend.
This commit is contained in:
2026-04-13 23:31:42 +02:00
parent e42c59de16
commit 4300f1242d
53 changed files with 5102 additions and 5 deletions
@@ -0,0 +1,76 @@
---
name: metabase_mbql_validate
kind: function
lang: py
domain: core
version: "1.0.0"
purity: pure
signature: "def metabase_mbql_validate(dataset_query: dict) -> list[str]"
description: "Valida la estructura de un dataset_query MBQL sin I/O. Detecta UUIDs duplicados, stage mixing (aggregations + expressions que referencian slots en la misma stage), slot refs rotas (sum_X inexistente), case structures invalidas y name collisions en expressions. Retorna lista de errores, vacia si el query es valido."
tags: [metabase, mbql, validation, pure, query, dataset_query]
uses_functions: []
uses_types: []
params:
- name: dataset_query
desc: "Dict completo del dataset_query MBQL tal como lo devuelve GET /api/card/:id. Debe tener clave 'stages' con lista de stage dicts. Cada stage puede tener 'expressions', 'aggregation', 'filters'."
output: "Lista de strings con errores encontrados. Lista vacia si el query supera todos los checks. Cada error incluye la ubicacion (stage[N]) y descripcion del problema."
returns: []
returns_optional: false
error_type: ""
imports: []
tested: true
tests:
- "DQ valido retorna lista vacia"
- "UUID duplicado genera error"
- "Stage mixing con slot refs genera error"
- "Slot sum_99 inexistente genera error"
- "Case con casos no pares genera error"
- "Name collision en expressions genera error"
- "stages ausente devuelve error de estructura"
test_file_path: "python/functions/metabase/test_metabase_mbql_validate.py"
file_path: "python/functions/metabase/metabase_mbql_validate.py"
---
## Checks implementados
### 1. UUIDs duplicados
Metabase requiere que cada `lib/uuid` sea unico globalmente dentro del dataset_query. Un UUID repetido (por ejemplo al copiar-pegar un nodo MBQL) causa errores silenciosos o 400 en la API.
### 2. Stage mixing
Si una stage tiene `aggregation` y `expressions`, las expressions NO deben referenciar los slot names generados por las aggregations (`sum`, `avg`, `sum_1`, etc.). Esas references deben ir en la stage siguiente. Si estan en la misma stage, Metabase retorna 500.
### 3. Slot refs rotas
Una expression `["field", {sin base-type}, "sum_X"]` referencia la X-esima aggregation de tipo sum. Si X >= cantidad de sums en la stage, el slot no existe y la query falla.
### 4. Case structure
Los nodos `["case", meta, cases]` deben tener `cases` como lista de pares `[cond, result]`. Una estructura malformada (e.g., lista de un solo elemento) causa errores de parsing en Metabase.
### 5. Name collision
Dos `expressions` con el mismo `lib/expression-name` en la misma stage generan conflictos de alias en la query SQL generada.
## Ejemplo
```python
import sys
sys.path.insert(0, '/home/lucas/fn_registry/python/functions')
from metabase import MetabaseClient
from metabase.metabase_mbql_validate import metabase_mbql_validate
client = MetabaseClient('https://metabase.example.com', 'token...')
card = client.request('GET', '/api/card/5705')
errors = metabase_mbql_validate(card['dataset_query'])
if errors:
for e in errors:
print(f'ERROR: {e}')
else:
print('Query valida')
```
## Notas
Funcion 100% pura: sin I/O, sin estado mutable, determinista. Solo stdlib Python.
Los slots reconocidos como aggregation slots son: `sum`, `avg`, `count`, `min`, `max`, `distinct`, `cum-sum`, `cum-count`, `share`, `stddev` (y sus variantes `_N`).
Un field con `base-type` en su metadata NO se considera slot ref — es una referencia a columna real. Solo los fields sin `base-type` se tratan como slots de aggregation.