fn_registry

Author	SHA1	Message	Date
egutierrez	79b5f0b194	perf(viz): graph_renderer edges via TBO + vertex pulling (issue 0049d) El buffer de aristas pasa a estatico (16B/arista: source, target, color, flags) y solo se reupload cuando cambia el grafo. Las posiciones de los nodos viven en un Texture Buffer Object (RG32F) actualizado por frame; el vertex shader hace texelFetch con gl_VertexID & 1 para elegir endpoint. Draw call: glDrawArraysInstanced(GL_LINES, 0, 2, edge_count) con divisor=1. Para 100k aristas: el upload de 4.8 MB/frame baja a 0 en regimen estable. edge_alpha pasa a uniform; la pre-multiplicacion en CPU desaparece. GLSL sigue en 330 core (samplerBuffer/texelFetch estan en 1.40+). gl_loader gana glBufferSubData, glVertexAttribIPointer y glTexBuffer (en Linux ya estaban via GL_GLEXT_PROTOTYPES; ahora estan disponibles tambien en MinGW/Windows). Tests: nuevo test_graph_edge_static valida el layout de 16B y el packing RGBA8 del fallback. test_visual sigue verde — render visualmente identico. Bump graph_renderer 1.2.0 -> 1.3.0.	2026-04-29 22:32:38 +02:00
egutierrez	427262b892	perf(viz): graph_renderer Tier 1 (RGBA8 + orphan + frustum cull) + force_layout auto-pause helper Issue 0049c. Tres optimizaciones internas en graph_renderer.cpp + un helper puro en graph_force_layout para detectar convergencia. API publica intacta — solo cambian el layout interno de los buffers, el shader y los costes por frame. 1. RGBA8 color packing - El instance buffer de nodos pasa de (x,y,size,r,g,b,a) 28B a (x,y,size,color_u32) 16B (-43%). Aristas: 24B → 12B/vertex (-50%). - Shaders desempaquetan con bit shifts (compatible GL 3.30+, no necesita unpackUnorm4x8 que es 4.20+). - Helpers expuestos: pack_rgba8 / unpack_rgba8 / modulate_alpha_rgba8 en graph_renderer.h. Los GraphNode.color y la paleta ya tenian el layout correcto (R en LSB), asi que CPU ahora pasa el uint32 directo sin convertir a 4 floats por nodo y por frame. 2. Capacity-tracked streaming buffers - Sustituye el doble glBufferData de antes por: glBufferData(NULL, capacity, STREAM_DRAW) // orphan + reserva glBufferSubData(0, used_bytes, data) // solo lo usado - capacity crece x2 cuando hace falta (inicial 4096 nodos / 8192 vertices de aristas) → reallocaciones en O(log N). - Staging CPU (NodeInstance* / EdgeVertex*) reusado entre frames con realloc, no malloc/free per frame. 3. Frustum cull (CPU-side) - AABB del viewport en world coords con margen 10%. - Aristas: skip si AABB del segmento no intersecta el viewport. - Nodos: solo los visibles entran al instance buffer; visible_count es el N que pasa a glDrawArraysInstanced. Pop-in de borde mitigado por el margen. 4. graph_force_layout_should_pause(low_frames, min_consecutive) - Helper puro: el caller mantiene el contador, la funcion solo decide si parar. Reemplaza la rama inline en demos_graph.cpp. - Test Catch2 con secuencias artificiales. Tests: test_graph_pack_rgba8 (16401 asserts, 4 cases — roundtrip exhaustivo + alpha modulation + clamp). test_graph_should_pause (3 cases, 14 asserts). Los 29 tests del cpp/tests/ siguen verdes (incluido test_visual con goldens). Bump versiones: - graph_renderer 1.1.0 → 1.2.0 - graph_force_layout 1.0.0 → 1.1.0 (tested: true via should_pause test)	2026-04-29 22:17:13 +02:00
egutierrez	32e58556fa	perf(graph): quick wins — OpenMP force step + buffer orphan + auto-pause Tres atajos de rendimiento sin GPU compute (eso llega en 0049h). Probados en Linux y cross-compile Windows, todos los tests pasan, OpenMP 4.5 detectado. 1. OpenMP en graph_force_layout_step (cpp/functions/viz/...) - find_package(OpenMP) en cpp/CMakeLists.txt; fn_framework lo enlaza PUBLIC para que cualquier app/funcion lo herede transparentemente. Si no esta disponible, los pragmas se ignoran (single-thread). - #pragma omp parallel for con guard if(N>=1024) en los 4 bucles embarazosamente paralelos: zero forces, repulsion Barnes-Hut (con schedule dynamic), gravity, integration (con reduction sobre energy). La attraction-along-edges se queda secuencial: edges multiples escriben en el mismo nodo y meterle atomic mata el speedup. - quad_force usaba un static int stack[1<<20] (4MB compartidos entre threads — race). Lo reemplazo por int stack[256] en pila: el quadtree crece como log4(N) ~= 10 niveles para N <= 1M, asi que 256 es holgado y thread-safe sin coste. - Esperable: ~4-8x menos tiempo CPU/step en 20k nodos en CPU multicore. 2. Buffer orphan en graph_renderer (edges + nodes) - Antes del glBufferData(.., data, DYNAMIC_DRAW), un primer glBufferData(.., NULL, DYNAMIC_DRAW) que descarta el buffer previo. El driver da uno fresco sin esperar al frame anterior — evita los sync stalls clasicos del DYNAMIC_DRAW reuploadeado cada frame. - Esperable: 2-3x throughput de upload (Mesa/NVIDIA/AMD respetan el hint). 3. Auto-pause en demo_graph cuando converge - Si energy_per_node < 0.001 durante 30 frames consecutivos, paramos la simulacion automaticamente. CPU/GPU a 0% cuando el grafo ya esta estable. Resume con "Resume layout" o "Regenerate". Lo de OpenMP se sustituye cuando entre 0049h (force layout en compute shader): cuando llegue, los #pragma omp se borran. Orphan y auto-pause son keepers definitivos.	2026-04-29 21:38:13 +02:00
egutierrez	b093c898a8	docs(issues): marcar 0025 y 0026 como completados + WIP master Wave 1 de parallel-fix-issues integrada a master: - 0025: text_editor_cpp_core + file_watcher_cpp_core - 0026: gl_texture_load_cpp_gfx (vendor: stb_image v2.30) Ademas se commitea WIP previo de master que estaba sin commitear (cambios en shaders_lab, dag_*, framework, tokens, kpi_card, gl_loader.md, etc.) para dejar HEAD buildable. Notas: - Algunos deps del gallery (button.cpp, toolbar.cpp, modal_dialog.cpp...) siguen UNTRACKED — gating con FN_BUILD_GALLERY=ON (default OFF) para que master build (sin flag) no los necesite. - Build OK con y sin flag. fn index registra 904 functions. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-04-25 21:14:15 +02:00
egutierrez	7eef2544ab	feat: add C++ ImGui functions for core UI and visualization Funciones C++/ImGui para dashboards (grid, panel, docking, sidebar, tabs), visualizaciones (candlestick, gauge, histogram, pie, sparkline, heatmap, scatter, line, bar, surface3d, kpi, table), grafos (force layout, renderer, viewport, spatial hash, types) y utilidades (time series buffer, tracy zones, memory/fps overlay, plot theme). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-08 00:10:18 +02:00

5 Commits