fn_registry

Author	SHA1	Message	Date
egutierrez	427262b892	perf(viz): graph_renderer Tier 1 (RGBA8 + orphan + frustum cull) + force_layout auto-pause helper Issue 0049c. Tres optimizaciones internas en graph_renderer.cpp + un helper puro en graph_force_layout para detectar convergencia. API publica intacta — solo cambian el layout interno de los buffers, el shader y los costes por frame. 1. RGBA8 color packing - El instance buffer de nodos pasa de (x,y,size,r,g,b,a) 28B a (x,y,size,color_u32) 16B (-43%). Aristas: 24B → 12B/vertex (-50%). - Shaders desempaquetan con bit shifts (compatible GL 3.30+, no necesita unpackUnorm4x8 que es 4.20+). - Helpers expuestos: pack_rgba8 / unpack_rgba8 / modulate_alpha_rgba8 en graph_renderer.h. Los GraphNode.color y la paleta ya tenian el layout correcto (R en LSB), asi que CPU ahora pasa el uint32 directo sin convertir a 4 floats por nodo y por frame. 2. Capacity-tracked streaming buffers - Sustituye el doble glBufferData de antes por: glBufferData(NULL, capacity, STREAM_DRAW) // orphan + reserva glBufferSubData(0, used_bytes, data) // solo lo usado - capacity crece x2 cuando hace falta (inicial 4096 nodos / 8192 vertices de aristas) → reallocaciones en O(log N). - Staging CPU (NodeInstance* / EdgeVertex*) reusado entre frames con realloc, no malloc/free per frame. 3. Frustum cull (CPU-side) - AABB del viewport en world coords con margen 10%. - Aristas: skip si AABB del segmento no intersecta el viewport. - Nodos: solo los visibles entran al instance buffer; visible_count es el N que pasa a glDrawArraysInstanced. Pop-in de borde mitigado por el margen. 4. graph_force_layout_should_pause(low_frames, min_consecutive) - Helper puro: el caller mantiene el contador, la funcion solo decide si parar. Reemplaza la rama inline en demos_graph.cpp. - Test Catch2 con secuencias artificiales. Tests: test_graph_pack_rgba8 (16401 asserts, 4 cases — roundtrip exhaustivo + alpha modulation + clamp). test_graph_should_pause (3 cases, 14 asserts). Los 29 tests del cpp/tests/ siguen verdes (incluido test_visual con goldens). Bump versiones: - graph_renderer 1.1.0 → 1.2.0 - graph_force_layout 1.0.0 → 1.1.0 (tested: true via should_pause test)	2026-04-29 22:17:13 +02:00
egutierrez	97725e0641	feat(graph): wheel-zoom no scrollea, slider 1M nodos, edges/node configurable Tres mejoras de UX/escala en el demo de grafos: 1. Wheel zoom dentro del canvas no scrollea la pagina En graph_viewport.cpp tras procesar MouseWheel para zoom hacemos io.MouseWheel = 0 — consume el evento para que el BeginChild padre (la galeria) no scrollee a la vez que el grafo se acerca. Antes sentia "doble accion" al rodar la rueda sobre el canvas. 2. graph_force_layout: pool dinamico (soporta 1M nodos) El array static QuadNode[1<<20] (~48MB siempre reservados, tope rigido en ~250k nodos por la fan-out) se reemplaza por std::vector<QuadNode>. graph_force_layout_step llama a quad_pool_reserve(5N + 1024) ANTES de construir el arbol — asi las referencias QuadNode& que mantenemos vivas durante quad_subdivide no se invalidan por reallocaciones a mitad del build (resize solo ocurre en el reserve inicial). Memoria escala lineal con N: 1M nodos ≈ 240MB de pool, una vez por programa. 3. Demo de grafo: sliders extendidos + cluster_r escala con sqrt(N)* - "Nodes" pasa de 100..20k a 100..1M con escala logaritmica (ImGuiSliderFlags_Logarithmic) para que el rango medio sea util. - Nuevos sliders "Edges/node" (1..10) e "Inter %" (0..30%) — antes hardcoded a 3 y 5%. - cluster_radius y scatter ahora escalan con sqrt(N): a 1k nodos ~370 px de radio, a 1M ~12000 px. Antes era constante a 200/40 y los nodos quedaban empaquetados al subir N — visualmente "sin limite cuadrado", esparcidos sobre un area proporcional al grafo. - Golden de graph_viewport regenerado por la nueva fila de sliders. Notas: - A 1M nodos sin GPU compute esta limitado por el upload de aristas (vertex pulling con TBO llega en 0049d). Render mantenible hasta ~200-300k. - En Linux/Windows ambos builds limpios. 27/27 tests verde.	2026-04-29 21:53:33 +02:00
egutierrez	32e58556fa	perf(graph): quick wins — OpenMP force step + buffer orphan + auto-pause Tres atajos de rendimiento sin GPU compute (eso llega en 0049h). Probados en Linux y cross-compile Windows, todos los tests pasan, OpenMP 4.5 detectado. 1. OpenMP en graph_force_layout_step (cpp/functions/viz/...) - find_package(OpenMP) en cpp/CMakeLists.txt; fn_framework lo enlaza PUBLIC para que cualquier app/funcion lo herede transparentemente. Si no esta disponible, los pragmas se ignoran (single-thread). - #pragma omp parallel for con guard if(N>=1024) en los 4 bucles embarazosamente paralelos: zero forces, repulsion Barnes-Hut (con schedule dynamic), gravity, integration (con reduction sobre energy). La attraction-along-edges se queda secuencial: edges multiples escriben en el mismo nodo y meterle atomic mata el speedup. - quad_force usaba un static int stack[1<<20] (4MB compartidos entre threads — race). Lo reemplazo por int stack[256] en pila: el quadtree crece como log4(N) ~= 10 niveles para N <= 1M, asi que 256 es holgado y thread-safe sin coste. - Esperable: ~4-8x menos tiempo CPU/step en 20k nodos en CPU multicore. 2. Buffer orphan en graph_renderer (edges + nodes) - Antes del glBufferData(.., data, DYNAMIC_DRAW), un primer glBufferData(.., NULL, DYNAMIC_DRAW) que descarta el buffer previo. El driver da uno fresco sin esperar al frame anterior — evita los sync stalls clasicos del DYNAMIC_DRAW reuploadeado cada frame. - Esperable: 2-3x throughput de upload (Mesa/NVIDIA/AMD respetan el hint). 3. Auto-pause en demo_graph cuando converge - Si energy_per_node < 0.001 durante 30 frames consecutivos, paramos la simulacion automaticamente. CPU/GPU a 0% cuando el grafo ya esta estable. Resume con "Resume layout" o "Regenerate". Lo de OpenMP se sustituye cuando entre 0049h (force layout en compute shader): cuando llegue, los #pragma omp se borran. Orphan y auto-pause son keepers definitivos.	2026-04-29 21:38:13 +02:00
egutierrez	7eef2544ab	feat: add C++ ImGui functions for core UI and visualization Funciones C++/ImGui para dashboards (grid, panel, docking, sidebar, tabs), visualizaciones (candlestick, gauge, histogram, pie, sparkline, heatmap, scatter, line, bar, surface3d, kpi, table), grafos (force layout, renderer, viewport, spatial hash, types) y utilidades (time series buffer, tracy zones, memory/fps overlay, plot theme). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-08 00:10:18 +02:00

4 Commits