docs: params/output semántico en 506 funciones para composabilidad

Añade campos params y output al frontmatter YAML de las 506 funciones del registry.
Cada parámetro tiene descripción semántica (qué representa, unidades, rango típico)
y cada función describe qué produce su output. Permite a agentes razonar sobre
cadenas de composición (ej: prices → log_return → sharpe_ratio) sin leer código.
This commit is contained in:
2026-04-05 18:45:16 +02:00
parent bd1bf2b5dc
commit 988e901066
506 changed files with 2964 additions and 0 deletions
@@ -31,6 +31,26 @@ imports:
- time
- warnings
- typing.Callable
params:
- name: file_path
desc: "Ruta del documento (PDF, TXT, Markdown) a procesar"
- name: entity_presets
desc: "Configuración de tipos de entidades a extraer con sus metadatos"
- name: relation_types
desc: "Tipos de relaciones a extraer (ej: 'owns', 'operates', 'communicates_with')"
- name: llm_chat_json
desc: "Función inyectada para llamadas al LLM (sin acoplamiento a proveedor)"
- name: chunk_size
desc: "Tamaño de chunks para procesamiento (default 500)"
- name: chunk_overlap
desc: "Solapamiento entre chunks (default 50)"
- name: confidence_threshold
desc: "Confianza mínima para incluir entidades (default 0.5)"
- name: dedup_threshold
desc: "Umbral fuzzy para deduplicación (default 0.85)"
- name: on_progress
desc: "Callback opcional para progreso (msg, percentage)"
output: "ExtractionResult con entidades, relaciones y estadísticas del proceso de extracción"
tested: true
tests:
- "documento con entidades y relaciones retorna ExtractionResult completo"