fn_registry/functions/infra/collect_host_metrics.md at 6bc97df5c0c6c4c74ae5ff08bee2ca3ed19251c8

Files

T

Egutierrez d996542f88 feat(infra): grupo fleet-metrics — collect_host_metrics, format_prom_exposition, push_prom_remote, push_loki_stream, collect_battery_metrics + tipo PromSample (gopsutil; Android-safe: sin exec/pidfd, procesos via /proc)

2026-06-07 14:25:45 +02:00

3.7 KiB

Raw Blame History

name, kind, lang, domain, version, purity, signature, description, tags, uses_functions, uses_types, returns, returns_optional, error_type, imports, params, output, tested, tests, test_file_path, file_path

name

kind

lang

domain

version

purity

signature

description

Ejemplo

samples, err := CollectHostMetrics()
if err != nil {
    log.Fatal(err)
}
// Formatear a exposition Prometheus y enviar a VictoriaMetrics:
body := FormatPromExposition(samples, time.Now().UnixMilli())
err = PushPromRemote(
    "https://metrics-xxxx.organic-machine.com/api/v1/import/prometheus",
    "user", "pass",
    body,
    map[string]string{"instance": "lucas-pc"},
)

Cuando usarla

Cuando necesites un snapshot completo de salud del host en formato Prometheus para hacer push a un backend remoto (VictoriaMetrics, Mimir, etc.) en lugar de exponer un endpoint /metrics para scraping. Es el colector base del capability group fleet-metrics: combinala con format_prom_exposition_go_infra y push_prom_remote_go_infra para un agente de monitorizacion push estilo node_exporter. Llamala periodicamente (cron, timer, loop) en cada nodo de la flota.

Gotchas

Bloquea ~400ms: hace dos llamadas a cpu.Percent con intervalo de 200ms cada una (global + por nucleo). No la llames en hot paths ni con periodo < 1s.
Temperaturas best-effort: usa sensors.SensorsTemperatures (movido del paquete host al paquete sensors en gopsutil v4). Si no hay sensores (tipico en Android/Termux y muchos VPS) el grupo node_temp_celsius se omite sin error.
Particiones pseudo ignoradas: tmpfs, devtmpfs, overlay, squashfs, proc, sysfs y similares se filtran. Solo reporta particiones de almacenamiento real.
Loopback excluido: la interfaz lo no genera metricas de red.
CPU por proceso necesita dos lecturas: CPUPercent() de gopsutil sobre un proceso recien obtenido puede devolver un valor calculado desde el arranque del proceso, no un delta. Util para ranking relativo del top 5, no como medida instantanea precisa.
No incluye la label instance: los samples no llevan instance; esa la añade push_prom_remote_go_infra via extra_label en el push.
Permisos: algunos contadores (procesos de otros usuarios, ciertos sensores) pueden requerir privilegios; los fallos parciales se omiten silenciosamente.

3.7 KiB Raw Blame History

Ejemplo

Cuando usarla

Gotchas

3.7 KiB

Raw Blame History