feat(cpp/datascience): CPU stats + MCMC primitives
Nuevo dominio cpp/functions/datascience con primitivas puras CPU para post- proceso de samples Monte Carlo y diagnostico de cadenas MCMC. Diseñadas como gemelas CPU de los kernels GPU (rng pareja con gpu_rng_glsl, MH 1D/ND con mc_metropolis_hastings_gpu) para validar numericamente y para datasets pequeños donde el dispatch GPU no compensa. - rng: xoshiro256++ con uniform / normal (Box-Muller) / below (Lemire) / categorical. Determinista bit-exacto dado seed. - stats_summary: sum (Kahan), mean, var/std (Welford one-pass), min, max, quantile / percentile (R type-7). - autocorr: r(k), ACF, tau_int (Sokal) — diagnostico ACF y ESS. - rhat_ess: Gelman-Rubin clasico y split + ESS basico (multi-chain). - beta_dist: lgamma (Lanczos), beta_pdf, beta_cdf (continued fraction), beta_quantile, mean/var/std — para inferencia Beta-Binomial. - drawdown: max_dd absoluto/pct + underwater series para sesiones simuladas y backtests. - samples_to_grid_2d: binning 2D CPU para alimentar heatmap_cpp_viz / contour_cpp_viz desde samples (x[], y[]). - metropolis_hastings: MH 1D y ND con target log-pdf como std::function (no normalizada). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
@@ -0,0 +1,30 @@
|
||||
#pragma once
|
||||
|
||||
#include <cstddef>
|
||||
|
||||
namespace fn::ds {
|
||||
|
||||
// Autocorrelacion lag k de la serie x[0..n). r(k) = cov(x_t, x_{t+k}) / var(x).
|
||||
// Definicion clasica con normalizacion sobre la varianza global. Devuelve
|
||||
// 1.0 para k=0 si la serie tiene varianza > 0; si var = 0 devuelve 0 para
|
||||
// todos los k.
|
||||
//
|
||||
// Si k >= n o n <= 1 devuelve 0.
|
||||
double autocorr_lag(const double* x, std::size_t n, std::size_t k);
|
||||
|
||||
// Llena out[max_lag] con r(0), r(1), ..., r(max_lag-1). Util para ACF plots.
|
||||
void autocorr_acf(const double* x, std::size_t n,
|
||||
std::size_t max_lag, double* out);
|
||||
|
||||
// Integrated Autocorrelation Time (tau_int) — definicion de Sokal con
|
||||
// truncado automatico cuando r(k) cae bajo el umbral. tau_int = 1 + 2 * sum
|
||||
// de r(k) hasta k_cutoff. Util para estimar Effective Sample Size:
|
||||
// ESS = n / tau_int.
|
||||
//
|
||||
// max_lag actua como cota dura. Si la ACF nunca cae bajo cutoff dentro de
|
||||
// max_lag, devuelve 1 + 2*sum hasta max_lag-1 (estimacion conservadora).
|
||||
double autocorr_tau(const double* x, std::size_t n,
|
||||
std::size_t max_lag = 200,
|
||||
double cutoff = 0.05);
|
||||
|
||||
} // namespace fn::ds
|
||||
Reference in New Issue
Block a user