Files
egutierrez 47fac22230 chore: auto-commit (799 archivos)
- .claude/CLAUDE.md
- .claude/commands/subagentes.md
- .claude/rules/INDEX.md
- .mcp.json
- bash/functions/cybersecurity/analyze_dns.md
- bash/functions/cybersecurity/audit_http_headers.md
- bash/functions/cybersecurity/audit_ssh_config.md
- bash/functions/cybersecurity/check_firewall.md
- bash/functions/cybersecurity/detect_suspicious_users.md
- bash/functions/cybersecurity/encrypt_file.md
- ...

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-14 00:28:20 +02:00

3.4 KiB

name, kind, lang, domain, version, purity, signature, description, tags, uses_functions, uses_types, returns, returns_optional, error_type, imports, tested, tests, test_file_path, file_path, framework, params, output
name kind lang domain version purity signature description tags uses_functions uses_types returns returns_optional error_type imports tested tests test_file_path file_path framework params output
gpu_histogram_1d function cpp gfx 1.0.0 impure GpuHistogram1D gpu_histogram_1d_create(int nbins); void gpu_histogram_1d_clear(GpuHistogram1D&); void gpu_histogram_1d_accumulate(GpuHistogram1D&, const Ssbo& samples, int count, float min, float max); void gpu_histogram_1d_readback(const GpuHistogram1D&, unsigned int* out); void gpu_histogram_1d_destroy(GpuHistogram1D&) Binner GPU 1D: SSBO float[N] -> SSBO uint[nbins] via atomicAdd en compute shader. Output listo para histogram_cpp_viz. Reusable across dispatches con clear/accumulate/readback.
opengl
compute
histogram
atomic
gpu
gfx
montecarlo
pendiente-usar
gl_loader_cpp_gfx
gpu_ssbo_cpp_gfx
gpu_compute_program_cpp_gfx
gpu_dispatch_cpp_gfx
false error_go_core
GL/gl.h
GL/glext.h
vector
false
cpp/functions/gfx/gpu_histogram_1d.cpp opengl
name desc
nbins Numero de bins. Tipico 64-512 para histogramas display, hasta 65536 sin problema.
name desc
samples Ssbo de float[count] con los samples a binear (binding 0 dentro del shader).
name desc
count Cuantos samples del SSBO procesar.
name desc
range_min Limite inferior del rango. Samples < min se descartan.
name desc
range_max Limite superior del rango. Samples >= max se descartan.
name desc
out Buffer destino para readback: unsigned int[nbins].
Bins acumulados como uint[nbins] en SSBO interno. accumulate emite barrier_storage tras el dispatch; readback emite barrier_buffer_update. clear sube zeros via ssbo_upload.

gpu_histogram_1d

Binner 1D acelerado por compute shader. Diseñado para alimentar histogram_cpp_viz con histogramas de millones de samples en milisegundos.

Patron de uso

auto hist = fn::gfx::gpu_histogram_1d_create(128);

// En el render loop, despues de generar samples en GPU:
fn::gfx::gpu_histogram_1d_clear(hist);
fn::gfx::gpu_histogram_1d_accumulate(hist, samples_ssbo, N,
                                     /*min=*/-5.0f, /*max=*/5.0f);

std::vector<unsigned int> counts(hist.nbins);
fn::gfx::gpu_histogram_1d_readback(hist, counts.data());

// Pasar a histogram_cpp_viz (necesita float):
std::vector<float> display(counts.begin(), counts.end());
fn::viz::histogram(display, /*...*/);

fn::gfx::gpu_histogram_1d_destroy(hist);

Performance

En RTX 3070, con 10^7 samples y 256 bins:

  • Pass de accumulate: ~3 ms (memory-bound, atomicAdd contiguo)
  • Readback de 256 uints: ~0.1 ms (sincrono pero microscopico)

Total round-trip: ~3-4 ms — sobra para histogramas en vivo a 60 FPS mientras el usuario arrastra sliders.

Notas

  • Samples fuera de [range_min, range_max) se descartan, NO se clampean al borde. Si quieres clamp, ajusta antes del dispatch o expande el rango.
  • atomicAdd en uint ssbo es sin contencion para distribuciones razonables. Si tu MC concentra todo en un solo bin (caso patologico) la perf cae — es señal de que el rango esta mal.
  • Para reusar el binner con distinto rango, basta llamar clear antes de accumulate. Si cambia nbins, hay que destruir y crear de nuevo.
  • count puede ser menor que el tamano del SSBO de samples (procesa solo los primeros count). Util si el SSBO esta sobredimensionado.