fn_registry

Author	SHA1	Message	Date
egutierrez	35312ea66e	feat(viz): graph_force_layout_gpu compute + spatial hash (issue 0049h) Layout force-directed en GPU usando 5 compute shaders 4.3 + spatial hash grid 64x64. API simetrica con graph_force_layout (CPU) para que el consumer pueda swappear sin cambios. atomicCompSwap loop para float-add portable. - cpp/functions/viz/graph_force_layout_gpu.{h,cpp,md}: nuevo modulo - cpp/functions/gfx/gl_loader: anade glDispatchCompute, glMemoryBarrier, glBindBufferBase, glGetBufferSubData (Windows wgl) - cpp/tests/test_graph_force_layout_gpu.cpp: smoke + pinned + CPU vs GPU. Crea ventana GLFW oculta GL 4.3; SKIP si headless o sin compute. - demos_graph: checkbox "GPU layout" para swappear CPU/GPU en runtime - issue movido a dev/issues/completed/	2026-04-29 23:29:16 +02:00
egutierrez	b9ffc13caf	feat(viz): graph_types modelo extendido + EntityType/RelationType + flags (issue 0049e) Extiende el modelo agnostico de graph_types.h para soportar shapes/iconos/ filtros/labels/streaming sin acoplar a backend. Migra el unico consumer (demos_graph) en el mismo cambio. - GraphNode v2: type_id + shape_override/color_override/size_override + flags (NF_PINNED/VISIBLE/SELECTED/HOVERED) + label_idx + user_data. - GraphEdge v2: type_id + style_override + flags (EF_DIRECTED/VISIBLE). - EntityType / RelationType: tablas en GraphData (types, rel_types). - Helpers de resolucion (resolve_node_color/shape/size, resolve_edge_*) y constructores ergonomicos (graph_node, graph_edge, entity_type, relation_type) — sentinel-based para herencia automatica del tipo. - graph_renderer v1.4: lee NF_VISIBLE / EF_VISIBLE, resuelve apariencia via override → EntityType → fallback indexado por type_id. Skipea aristas con endpoints invisibles. Shapes siguen pintandose como circulo (0049f cableara el dispatch real). - graph_force_layout v1.2: pinned ahora vive en flags & NF_PINNED. - graph_viewport v1.1: hover/seleccion publican NF_HOVERED/SELECTED en el grafo (clear-then-set). Drag usa NF_PINNED. Tooltip muestra Type/ user_data en lugar de community/value/label. - demos_graph: 8 EntityType (paleta antigua) + 1 RelationType. type_id por cluster. user_data = indice numerico del nodo. Apariencia visual identica al pre-cambio. - test_graph_types.cpp: 12 casos cubriendo helpers, defaults, bitmask manipulation y resoluciones override-vs-EntityType. test_graph_edge_ static actualizado al nuevo modelo (ya no tiene .color directo). - 4 .md de tipos nuevos (graph_node, graph_edge, entity_type, relation_type) + GraphData v2.0 actualizado. Tests: 31/31 ctest verdes (incluye test_visual golden). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-29 22:44:40 +02:00
egutierrez	427262b892	perf(viz): graph_renderer Tier 1 (RGBA8 + orphan + frustum cull) + force_layout auto-pause helper Issue 0049c. Tres optimizaciones internas en graph_renderer.cpp + un helper puro en graph_force_layout para detectar convergencia. API publica intacta — solo cambian el layout interno de los buffers, el shader y los costes por frame. 1. RGBA8 color packing - El instance buffer de nodos pasa de (x,y,size,r,g,b,a) 28B a (x,y,size,color_u32) 16B (-43%). Aristas: 24B → 12B/vertex (-50%). - Shaders desempaquetan con bit shifts (compatible GL 3.30+, no necesita unpackUnorm4x8 que es 4.20+). - Helpers expuestos: pack_rgba8 / unpack_rgba8 / modulate_alpha_rgba8 en graph_renderer.h. Los GraphNode.color y la paleta ya tenian el layout correcto (R en LSB), asi que CPU ahora pasa el uint32 directo sin convertir a 4 floats por nodo y por frame. 2. Capacity-tracked streaming buffers - Sustituye el doble glBufferData de antes por: glBufferData(NULL, capacity, STREAM_DRAW) // orphan + reserva glBufferSubData(0, used_bytes, data) // solo lo usado - capacity crece x2 cuando hace falta (inicial 4096 nodos / 8192 vertices de aristas) → reallocaciones en O(log N). - Staging CPU (NodeInstance* / EdgeVertex*) reusado entre frames con realloc, no malloc/free per frame. 3. Frustum cull (CPU-side) - AABB del viewport en world coords con margen 10%. - Aristas: skip si AABB del segmento no intersecta el viewport. - Nodos: solo los visibles entran al instance buffer; visible_count es el N que pasa a glDrawArraysInstanced. Pop-in de borde mitigado por el margen. 4. graph_force_layout_should_pause(low_frames, min_consecutive) - Helper puro: el caller mantiene el contador, la funcion solo decide si parar. Reemplaza la rama inline en demos_graph.cpp. - Test Catch2 con secuencias artificiales. Tests: test_graph_pack_rgba8 (16401 asserts, 4 cases — roundtrip exhaustivo + alpha modulation + clamp). test_graph_should_pause (3 cases, 14 asserts). Los 29 tests del cpp/tests/ siguen verdes (incluido test_visual con goldens). Bump versiones: - graph_renderer 1.1.0 → 1.2.0 - graph_force_layout 1.0.0 → 1.1.0 (tested: true via should_pause test)	2026-04-29 22:17:13 +02:00
egutierrez	97725e0641	feat(graph): wheel-zoom no scrollea, slider 1M nodos, edges/node configurable Tres mejoras de UX/escala en el demo de grafos: 1. Wheel zoom dentro del canvas no scrollea la pagina En graph_viewport.cpp tras procesar MouseWheel para zoom hacemos io.MouseWheel = 0 — consume el evento para que el BeginChild padre (la galeria) no scrollee a la vez que el grafo se acerca. Antes sentia "doble accion" al rodar la rueda sobre el canvas. 2. graph_force_layout: pool dinamico (soporta 1M nodos) El array static QuadNode[1<<20] (~48MB siempre reservados, tope rigido en ~250k nodos por la fan-out) se reemplaza por std::vector<QuadNode>. graph_force_layout_step llama a quad_pool_reserve(5N + 1024) ANTES de construir el arbol — asi las referencias QuadNode& que mantenemos vivas durante quad_subdivide no se invalidan por reallocaciones a mitad del build (resize solo ocurre en el reserve inicial). Memoria escala lineal con N: 1M nodos ≈ 240MB de pool, una vez por programa. 3. Demo de grafo: sliders extendidos + cluster_r escala con sqrt(N)* - "Nodes" pasa de 100..20k a 100..1M con escala logaritmica (ImGuiSliderFlags_Logarithmic) para que el rango medio sea util. - Nuevos sliders "Edges/node" (1..10) e "Inter %" (0..30%) — antes hardcoded a 3 y 5%. - cluster_radius y scatter ahora escalan con sqrt(N): a 1k nodos ~370 px de radio, a 1M ~12000 px. Antes era constante a 200/40 y los nodos quedaban empaquetados al subir N — visualmente "sin limite cuadrado", esparcidos sobre un area proporcional al grafo. - Golden de graph_viewport regenerado por la nueva fila de sliders. Notas: - A 1M nodos sin GPU compute esta limitado por el upload de aristas (vertex pulling con TBO llega en 0049d). Render mantenible hasta ~200-300k. - En Linux/Windows ambos builds limpios. 27/27 tests verde.	2026-04-29 21:53:33 +02:00
egutierrez	32e58556fa	perf(graph): quick wins — OpenMP force step + buffer orphan + auto-pause Tres atajos de rendimiento sin GPU compute (eso llega en 0049h). Probados en Linux y cross-compile Windows, todos los tests pasan, OpenMP 4.5 detectado. 1. OpenMP en graph_force_layout_step (cpp/functions/viz/...) - find_package(OpenMP) en cpp/CMakeLists.txt; fn_framework lo enlaza PUBLIC para que cualquier app/funcion lo herede transparentemente. Si no esta disponible, los pragmas se ignoran (single-thread). - #pragma omp parallel for con guard if(N>=1024) en los 4 bucles embarazosamente paralelos: zero forces, repulsion Barnes-Hut (con schedule dynamic), gravity, integration (con reduction sobre energy). La attraction-along-edges se queda secuencial: edges multiples escriben en el mismo nodo y meterle atomic mata el speedup. - quad_force usaba un static int stack[1<<20] (4MB compartidos entre threads — race). Lo reemplazo por int stack[256] en pila: el quadtree crece como log4(N) ~= 10 niveles para N <= 1M, asi que 256 es holgado y thread-safe sin coste. - Esperable: ~4-8x menos tiempo CPU/step en 20k nodos en CPU multicore. 2. Buffer orphan en graph_renderer (edges + nodes) - Antes del glBufferData(.., data, DYNAMIC_DRAW), un primer glBufferData(.., NULL, DYNAMIC_DRAW) que descarta el buffer previo. El driver da uno fresco sin esperar al frame anterior — evita los sync stalls clasicos del DYNAMIC_DRAW reuploadeado cada frame. - Esperable: 2-3x throughput de upload (Mesa/NVIDIA/AMD respetan el hint). 3. Auto-pause en demo_graph cuando converge - Si energy_per_node < 0.001 durante 30 frames consecutivos, paramos la simulacion automaticamente. CPU/GPU a 0% cuando el grafo ya esta estable. Resume con "Resume layout" o "Regenerate". Lo de OpenMP se sustituye cuando entre 0049h (force layout en compute shader): cuando llegue, los #pragma omp se borran. Orphan y auto-pause son keepers definitivos.	2026-04-29 21:38:13 +02:00
egutierrez	087412d73a	feat(primitives_gallery): wire text_editor + file_watcher demo - demos_text_editor.cpp: split horizontal con editor GLSL precargado a la izquierda (boton Save to /tmp/fn_demo.glsl + dirty indicator) y panel de eventos a la derecha (path, active flag, lista scrollable, boton clear). Watcher activo sobre /tmp/fn_demo.glsl; reintenta el add() tras el primer Save si el archivo no existia al iniciar. - demos.h: declaracion de gallery::demo_text_editor() - main.cpp: entry "text_editor"/"text_editor + watcher" en categoria Core - CMakeLists.txt: anade demos_text_editor.cpp + sources de text_editor, file_watcher y vendor TextEditor.cpp + include path de imgui_text_edit Nota: la primitives_gallery NO se construye en este branch (sus deps — button.cpp, toolbar.cpp, etc. — son untracked en master). El subdirectorio se anade pero protegido por FN_BUILD_GALLERY=OFF para no romper builds. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 21:00:55 +02:00

6 Commits