Files
fn_registry/cpp/functions/gfx/gpu_dispatch.h
T
egutierrez 07d06d5e7d feat(cpp/gfx): GPU compute primitives for Monte Carlo (G1-G7)
Stack base de compute shaders OpenGL 4.3 para cargas Monte Carlo intensivas
en GPU. Reutiliza el patron de graph_force_layout_gpu (SSBO + compute) y se
integra con el resto del registry sin nuevos simbolos en gl_loader (todo lo
que se necesita ya estaba expuesto).

- gpu_ssbo: lifecycle de Shader Storage Buffer Objects.
- gpu_compute_program: compila compute GLSL 4.3 con preamble inyectable
  (mismo pattern de gl_shader::compile_fragment).
- gpu_dispatch: dispatch_1d/2d/3d con ceil(N/local) automatico + barrier
  helpers (storage, uniform, image, buffer_update, all).
- gpu_rng_glsl: PCG32 GLSL (uniform/normal/below) + SplitMix64 seed walkers
  para sembrar deterministicamente N walkers desde un master seed.
- gpu_histogram_1d: SSBO float[N] -> uint[nbins] via atomicAdd.
- gpu_histogram_2d: SSBO float[2N] xy-interleaved -> uint[nx*ny] +
  to_density helper para alimentar heatmap_cpp_viz.
- gpu_reduce: workgroup-shared sum/min/max/mean (local 256, partials CPU).

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-04 11:52:08 +02:00

35 lines
1.5 KiB
C++

#pragma once
namespace fn::gfx {
// Despacha un compute con num_invocations hilos totales (1D), agrupados en
// workgroups de tamano local_size_x. Calcula ceil(num/local). El programa
// debe estar activo (glUseProgram llamado antes) y los SSBOs ya bindeados.
//
// Ejemplo: dispatch_1d(N, 64) emite glDispatchCompute((N+63)/64, 1, 1).
void dispatch_1d(int num_invocations, int local_size_x = 64);
// Variante 2D para grids tipo (width, height) — heatmaps, samples_to_grid_2d,
// histogram_2d. Local 8x8 = 64 invocaciones por workgroup.
void dispatch_2d(int width, int height,
int local_size_x = 8, int local_size_y = 8);
// Variante 3D (poco usada — expuesta por completitud).
void dispatch_3d(int x, int y, int z,
int local_size_x = 4, int local_size_y = 4, int local_size_z = 4);
// Helpers de glMemoryBarrier para los casos comunes despues de un dispatch.
// barrier_storage: el siguiente compute leera SSBOs escritos en este pase.
void barrier_storage();
// barrier_uniform: cambios subsiguientes a uniforms se ven correctamente.
void barrier_uniform();
// barrier_image: image2D writes -> reads (si se usan imageStore en compute).
void barrier_image();
// barrier_buffer_update: glGetBufferSubData / glBufferSubData veran lo escrito
// por el compute. Necesario antes de readback a CPU.
void barrier_buffer_update();
// barrier_all: GL_ALL_BARRIER_BITS — usar en debug; conservador y caro.
void barrier_all();
} // namespace fn::gfx