d76c831247
Nuevo dominio cpp/functions/datascience con primitivas puras CPU para post- proceso de samples Monte Carlo y diagnostico de cadenas MCMC. Diseñadas como gemelas CPU de los kernels GPU (rng pareja con gpu_rng_glsl, MH 1D/ND con mc_metropolis_hastings_gpu) para validar numericamente y para datasets pequeños donde el dispatch GPU no compensa. - rng: xoshiro256++ con uniform / normal (Box-Muller) / below (Lemire) / categorical. Determinista bit-exacto dado seed. - stats_summary: sum (Kahan), mean, var/std (Welford one-pass), min, max, quantile / percentile (R type-7). - autocorr: r(k), ACF, tau_int (Sokal) — diagnostico ACF y ESS. - rhat_ess: Gelman-Rubin clasico y split + ESS basico (multi-chain). - beta_dist: lgamma (Lanczos), beta_pdf, beta_cdf (continued fraction), beta_quantile, mean/var/std — para inferencia Beta-Binomial. - drawdown: max_dd absoluto/pct + underwater series para sesiones simuladas y backtests. - samples_to_grid_2d: binning 2D CPU para alimentar heatmap_cpp_viz / contour_cpp_viz desde samples (x[], y[]). - metropolis_hastings: MH 1D y ND con target log-pdf como std::function (no normalizada). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
31 lines
1.1 KiB
C++
31 lines
1.1 KiB
C++
#pragma once
|
|
|
|
#include <cstddef>
|
|
|
|
namespace fn::ds {
|
|
|
|
// Autocorrelacion lag k de la serie x[0..n). r(k) = cov(x_t, x_{t+k}) / var(x).
|
|
// Definicion clasica con normalizacion sobre la varianza global. Devuelve
|
|
// 1.0 para k=0 si la serie tiene varianza > 0; si var = 0 devuelve 0 para
|
|
// todos los k.
|
|
//
|
|
// Si k >= n o n <= 1 devuelve 0.
|
|
double autocorr_lag(const double* x, std::size_t n, std::size_t k);
|
|
|
|
// Llena out[max_lag] con r(0), r(1), ..., r(max_lag-1). Util para ACF plots.
|
|
void autocorr_acf(const double* x, std::size_t n,
|
|
std::size_t max_lag, double* out);
|
|
|
|
// Integrated Autocorrelation Time (tau_int) — definicion de Sokal con
|
|
// truncado automatico cuando r(k) cae bajo el umbral. tau_int = 1 + 2 * sum
|
|
// de r(k) hasta k_cutoff. Util para estimar Effective Sample Size:
|
|
// ESS = n / tau_int.
|
|
//
|
|
// max_lag actua como cota dura. Si la ACF nunca cae bajo cutoff dentro de
|
|
// max_lag, devuelve 1 + 2*sum hasta max_lag-1 (estimacion conservadora).
|
|
double autocorr_tau(const double* x, std::size_t n,
|
|
std::size_t max_lag = 200,
|
|
double cutoff = 0.05);
|
|
|
|
} // namespace fn::ds
|