chore: auto-commit (286 archivos)

- .claude/agents/fn-orquestador/SKILL.md - .claude/commands/fn_claude.md - .claude/rules/INDEX.md - .claude/rules/cpp_apps.md - .claude/rules/ids_naming.md - CHANGELOG.md - apps/dag_engine/README.md - apps/dag_engine/api.go - apps/dag_engine/dags_migrated/example.yaml - apps/dag_engine/dags_migrated/example_lineage_tracking.yaml - ... Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-16 16:33:22 +02:00
parent 0b9af8f1bb
commit a03675113a
281 changed files with 12596 additions and 19526 deletions
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def aggregate_by_group(rows: list[dict], group_by: list[str], aggs: dict[str, str]) -> list[dict]"
 description: "GROUP BY + agregaciones sobre datos tabulares. aggs es un dict de columna a funcion (sum, mean, count, min, max, first, last, collect). collect acumula valores en lista. None se ignora en agregaciones numericas."
-tags: [datascience, tabular, groupby, aggregate, transform, python, pendiente-usar]
+tags: [datascience, tabular, groupby, aggregate, transform, python, pendiente-usar, transformer]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def align_relations_to_entities(triplets: list[dict], entity_names: list[str]) -> list[dict]"
 description: "Filtra y alinea triplets REBEL/mREBEL a nombres canonicos de entidades. Para cada triplet, resuelve head y tail contra entity_names con match exacto case-insensitive o substring (gana el nombre mas largo). Descarta triplets donde algun lado no resuelve o head==tail."
-tags: [rebel, mrebel, relation-extraction, nlp, align, knowledge-graph, datascience, python]
+tags: [rebel, mrebel, relation-extraction, nlp, align, knowledge-graph, datascience, python, transformer]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def clip(data: list, lo: float, hi: float) -> list"
 description: "Recorta los valores de la lista al rango [lo, hi]."
-tags: [clipping, bounds, python, pendiente-usar]
+tags: [clipping, bounds, python, pendiente-usar, transformer]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def deduplicate_entities(candidates: list[EntityCandidate], name_threshold: float = 0.85, same_type_only: bool = True) -> DeduplicationResult"
 description: "Agrupa entidades candidatas que refieren a la misma entidad real usando fuzzy matching de nombres (Levenshtein + Jaccard) y Union-Find para clusters transitivos. Retorna entidades mergeadas con mapas de resolucion de IDs y log de merges."
-tags: [deduplication, entity, fuzzy, levenshtein, jaccard, union-find, knowledge-graph, nlp, fuzzygraph, datascience]
+tags: [deduplication, entity, fuzzy, levenshtein, jaccard, union-find, knowledge-graph, nlp, fuzzygraph, datascience, transformer]
 uses_functions:
  - normalize_entity_name_py_core
  - merge_entity_attributes_py_core
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def deduplicate_relations(relations: list[RelationCandidate], entity_id_map: dict[str, str]) -> list[RelationCandidate]"
 description: "Deduplica relaciones candidatas resolviendo from_name/to_name a entity IDs finales via entity_id_map. Descarta self-loops y relaciones sin match. Mergea duplicados (mismo from_id, to_id, relation_type) concatenando descripciones unicas y tomando max confidence."
-tags: [datascience, extraction, knowledge-graph, nlp, deduplication, fuzzy-match, fuzzygraph]
+tags: [datascience, extraction, knowledge-graph, nlp, deduplication, fuzzy-match, fuzzygraph, transformer]
 uses_functions:
  - levenshtein_distance_py_cybersecurity
 uses_types:
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def detect_drift(history: list[dict], current: dict, fields: list[str], threshold: float = 2.0) -> list[dict]"
 description: "Detecta drift estadistico comparando metricas de la ejecucion actual contra el historial usando z-score. Si |z| > threshold, el campo ha drifteado. Util para monitorizar executions en operations.db."
-tags: [drift, statistics, z-score, monitoring, executions, operations, datascience, pendiente-usar]
+tags: [drift, statistics, z-score, monitoring, executions, operations, datascience, pendiente-usar, validator]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def detect_outliers(data: list, threshold: float) -> list"
 description: "Detecta outliers por z-score. Retorna lista de bools, True donde |z-score| > threshold."
-tags: [statistics, outliers, python, pendiente-usar]
+tags: [statistics, outliers, python, pendiente-usar, validator]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def diff_entities(before: list[dict], after: list[dict], key: str = 'id', ignore_fields: list[str] | None = None, compare_fields: list[str] | None = None) -> dict"
 description: "Compara dos snapshots de entities y devuelve diferencias campo a campo. Detecta añadidas, eliminadas, modificadas e inalteradas. Ignora created_at y updated_at por defecto."
-tags: [diff, entities, snapshot, operations, comparison, datascience, pendiente-usar]
+tags: [diff, entities, snapshot, operations, comparison, datascience, pendiente-usar, transformer]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def diff_relations(before: list[dict], after: list[dict], key: tuple[str, str, str] = ('source_id', 'target_id', 'relation_type'), ignore_fields: list[str] | None = None, compare_fields: list[str] | None = None) -> dict"
 description: "Compara relaciones entre dos snapshots usando key compuesta (source_id, target_id, relation_type). Detecta relaciones añadidas, eliminadas y modificadas con detalle campo a campo."
-tags: [diff, relations, graph, snapshot, operations, comparison, datascience, pendiente-usar]
+tags: [diff, relations, graph, snapshot, operations, comparison, datascience, pendiente-usar, transformer]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def histogram(data: list, buckets: int) -> list"
 description: "Calcula histograma con N buckets. Retorna lista de conteos por bucket."
-tags: [statistics, histogram, python, pendiente-usar]
+tags: [statistics, histogram, python, pendiente-usar, transformer]
 uses_functions: []
 uses_types: []
 returns: []
@@ -7,7 +7,7 @@ version: "1.0.0"
 purity: pure
 signature: "def impute(data: list) -> list"
 description: "Reemplaza None y NaN con la media de los valores validos."
-tags: [imputation, missing, python, pendiente-usar]
+tags: [imputation, missing, python, pendiente-usar, transformer]
 uses_functions: []
 uses_types: []
 returns: []