- app.md - appicon.ico - extract_panel.cpp - main.cpp - views.cpp Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
6.6 KiB
name, lang, domain, version, description, tags, uses_functions, uses_types, uses_modules, framework, entry_point, dir_path, repo_url, icon, python_runtime, python_runtime_deps, e2e_checks
| name | lang | domain | version | description | tags | uses_functions | uses_types | uses_modules | framework | entry_point | dir_path | repo_url | icon | python_runtime | python_runtime_deps | e2e_checks | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| graph_explorer | cpp | viz | 0.1.0 | Visor de grafos GPU-accelerated agnostico del backend. Lee operations.db de cualquier app del registry y permite explorar entidades/relaciones con shapes/iconos/layouts/filtros. |
|
|
|
imgui | main.cpp | projects/osint_graph/apps/graph_explorer | https://gitea-dgg044oo04woo4ggcsws4gk0.organic-machine.com/dataforge/graph_explorer |
|
true |
|
|
Arquitectura
App C++ ImGui para explorar cualquier operations.db del registry como un grafo
de entidades y relaciones. Agnostica del backend — el dispatcher en
data.{h,cpp} selecciona el GraphLoadFn segun --input (hoy solo
operations, manana json/jsonl/graphml).
Capas:
data.{h,cpp}— dispatcher de sources. Hoy unica implementacion:graph_load_from_operations(issue 0049g).types_registry.{h,cpp}— parser minimo de YAML para sobrescribircolor/shape/icon/stylepor nombre de tipo. Construye elIconAtlascon los codepoints Tabler resueltos portabler_codepoint_by_name.views.{h,cpp}— panelesToolbar,Legend,Inspector,Stats. Toggle viaAppConfig::panels.main.cpp— CLI +fn::run_app+ bucle de force layout (CPU/GPU) + glue.graph_explorer.db— SQLite junto al exe. Tablalayouts(graph_hash, node_id, x, y, pinned, updated_at). Persistencia de posiciones por grafo.
CLI
graph_explorer [<operations.db>]
graph_explorer --input operations <path>
graph_explorer --types <yaml>
graph_explorer --layout force|grid|circular|radial|hierarchical|fixed
graph_explorer apps/registry_dashboard/operations.db
graph_explorer --types projects/osint_graph/apps/graph_explorer/examples/types.yaml \
apps/element_agents/operations.db
Build
cd cpp
cmake -B build/linux -S .
cmake --build build/linux --target graph_explorer -j$(nproc)
./build/linux/apps/graph_explorer/graph_explorer apps/registry_dashboard/operations.db
Notas
- Usa GPU layout si el contexto soporta compute 4.3; toggle CPU/GPU desde la toolbar. Fallback transparente a CPU si GPU no esta disponible.
- 50k nodos a 60fps con layout GPU (medido en demos/graph en
primitives_gallery). operations.dbse abre conmode=rocuando el path no apunta al filesystem propio para evitar lock con otras apps que esten escribiendo.- El
graph_hashse calcula a partir del path canonico del input. Mismo path = mismo grafo a efectos de layout guardado.
Pipeline NER+RE disponible en el registry (2026-05-04)
Tras la investigacion del analysis gliner_glirel_tuning (proyecto osint_graph), el stack completo de extraccion de entidades + relaciones desde texto / PDF esta listo como funciones del registry. Esto desbloquea los issues 0041 y 0042:
# Pipeline E2E recomendado (texto -> grafo)
from pipelines.extract_graph_from_text import extract_graph_from_text
from datascience.gliner2_load_model import gliner2_load_model
model = gliner2_load_model() # Apache 2.0, NER+RE joint, 340M params
result = extract_graph_from_text(text, ENTITY_LABELS, RELATION_LABELS, ALLOWED, model)
# result = {'nodes': [...], 'edges': [...], 'stats': {...}}
Componentes (mira python/functions/{core,datascience,pipelines}/):
- core (puras):
clean_pdf_text,chunk_with_overlap,merge_entity_aliases,filter_relations_by_entity_types,aggregate_extraction_results. - datascience (impuras):
gliner2_load_model,extract_graph_gliner2,spacy_es_load_model,extract_triples_spacy_es(OpenIE schema-less ES). - pipelines:
extract_graph_from_text— composicion E2E.
Recetas validadas en notebooks 04-08 del analysis y vaultadas en vaults/osint_nlp_models/:
threshold=0.3(vs default 0.5) para GLiNER2.- snake_case verbal labels (
works_at,ceo_of...). chunk_with_overlappara texto > 1500 chars.filter_relations_by_entity_typespara descartarMadrid president_of Persona.merge_entity_aliasespara fusionarBBVA⊂Banco Bilbao Vizcaya Argentaria, S.A..- spaCy ES dep-rules como capa OpenIE schema-less complementaria (predicado = verbo del texto).
Issues que desbloquea: issues/0041-split-confidence-thresholds.md y issues/0042-gliner2-unified-extractor.md. El registry tiene todas las funciones necesarias; solo falta cablearlas en extract_graph_hybrid_py_pipelines y el panel paste_extract.
Playground de referencia: projects/osint_graph/analysis/gliner_glirel_tuning/playground/ (FastAPI + Sigma.js, sirviendo en localhost:7878).
Capability growth log
Una linea por bump SemVer. Bump-type segun .claude/commands/version.md:
-
major: breaking observable (CLI args, schema BBDD propia, formato wire). -
minor: feature aditiva (nuevo panel, endpoint, opcion). -
patch: bugfix sin cambio observable. -
v0.1.0 (2026-05-18) — baseline.