graph_explorer/enrichers/split_words/manifest.yaml

id: split_words
name: "Split text into words"
description: "Tokeniza el texto del nodo (entities.notes con fallback a name) en palabras y crea un nodo Word por cada token. Pensado para probar grouping con volumen alto: cualquier parrafo decente supera el umbral de 50 trivialmente."
applies_to: [text, Text]
emits: [Word]
relations: [WORD_OF]
params:
  - { name: max_words, type: int, default: 500 }
  - { name: min_length, type: int, default: 3, description: "ignora tokens con menos de N caracteres (filtra ruido tipo 'a', 'el', 'de')" }
  - { name: dedupe, type: bool, default: true, description: "si true, una palabra repetida produce un solo nodo" }