Commit Graph

11 Commits

Author SHA1 Message Date
egutierrez 32784840ff chore: add Rill tmp directory to gitignore
Añadido directorio temporal de Rill al .gitignore.

El directorio rill-data/tmp/ contiene archivos binarios generados
automáticamente por Rill (como meta.db) que no deben versionarse.

Archivo: .gitignore (rill-data/tmp/)
2026-03-23 23:42:15 +01:00
egutierrez 5357cedc55 docs: add visualization setup guide and update Rill config
Añadida documentación de configuración de herramientas de visualización.

Cambios:
- Nuevo archivo VISUALIZATION_SETUP.md con guía de setup de Grafana/Metabase/Rill
- Actualizada configuración de Rill (rill-data/rill.yaml) con nuevas fuentes de datos

Contenido de VISUALIZATION_SETUP.md:
- Configuración de datasources para Grafana
- Setup de Metabase con PostgreSQL/ClickHouse
- Configuración de Rill con DuckDB
- Ejemplos de queries y dashboards
2026-03-23 23:41:26 +01:00
egutierrez 2ca0b1169f docs: update CLAUDE.md with marquez-cli reference
Actualizada la sección de Marquez en CLAUDE.md para referenciar marquez-cli.

Cambios:
- Cambió categoría de "Medio - API REST" a "Fácil - CLI Nativo"
- Añadida información sobre instalación de marquez-cli
- Añadidos ejemplos de uso del CLI (run start/complete/fail, lineage)
- Referencia a MARQUEZ_UTILITIES.md para guía completa
- Actualizada sección de Scripts Helper con marquez-cli como RECOMENDADO

El CLI nativo simplifica la gestión de lineage en comparación con curl/Python.
2026-03-23 23:41:14 +01:00
egutierrez 4eccdc93d3 docs: add Marquez utilities documentation
Añadida guía completa de utilidades de Marquez CLI.

Contenido:
- Descripción del binario marquez-cli y sus capacidades
- Conceptos clave: datasets, jobs, runs
- Reglas de lineage tracking (SIEMPRE/NUNCA)
- Métodos para recuperar lineage (CLI, Web UI, API REST)
- Quick start y ejemplos de uso
- Comandos útiles y tips
- Referencia a ejemplos y documentación adicional

Archivo: MARQUEZ_UTILITIES.md
2026-03-23 23:41:04 +01:00
egutierrez 5f3bc84696 feat: add marquez-cli tool for OpenLineage/Marquez management
Añadido binario CLI en Go para gestionar datasets, jobs y runs en Marquez.

Características:
- Enviar eventos OpenLineage (START, RUNNING, COMPLETE, FAIL)
- Registrar y consultar datasets
- Registrar y consultar jobs y runs
- Consultar lineage de datasets con formato texto/JSON
- Listar recursos (namespaces, jobs, datasets)
- Sin dependencias externas (solo Go stdlib)
- Binario estático compilado de ~5MB

Archivos:
- tools/marquez-cli/main.go: CLI principal con comandos
- tools/marquez-cli/openlineage.go: Cliente HTTP y estructuras OpenLineage
- tools/marquez-cli/go.mod: Módulo de Go
- tools/marquez-cli/Makefile: Build automation
- tools/marquez-cli/README.md: Documentación completa
- tools/marquez-cli/QUICKSTART.md: Guía rápida de uso

Instalación: make install en ~/.local/bin/marquez-cli
2026-03-23 23:40:55 +01:00
egutierrez ea84a8e1f8 refactor: remove Temporal in favor of Dagu for transformations
Temporal era overkill para nuestros pipelines de datos típicos.

Cambios:
- Eliminado docker-compose-temporal.yml y configuración
- Removido Temporal de Homer dashboard
- Actualizado README y CLAUDE.md sin referencias a Temporal
- Añadida documentación completa de transformaciones con Dagu

Dagu es suficiente porque:
- Workflows terminan en minutos, no días
- Transformaciones simples/medias (Python/SQL)
- No necesitamos pausar/reanudar workflows
- Menor overhead y más simple de mantener

Si en el futuro necesitamos workflows de larga duración o state complejo,
podemos volver a levantar Temporal.

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2026-03-23 22:58:53 +01:00
egutierrez aadae87a78 merge: quick/add-orchestration-messaging-services — Añadidos servicios de orquestación y mensajería 2026-03-23 22:38:42 +01:00
egutierrez c1cad6c5b3 feat: add Orchestration and Messaging sections to Homer
Añadidas nuevas secciones en Homer dashboard para los servicios de orquestación y mensajería.

Orchestration:
- Temporal UI (puerto 3400)
- Dagu (puerto 8090) - DAG scheduler nativo en WSL

Messaging:
- NATS Monitoring (puerto 8222)

Actualizados iconos para usar favicon.ico de los servicios correspondientes.
2026-03-23 22:38:18 +01:00
egutierrez 6095b7aac8 feat: add NATS JetStream message broker
Añadido NATS con JetStream habilitado para streaming de mensajes y comunicación entre microservicios.

Configuración:
- Puerto 4222: Cliente NATS
- Puerto 8222: HTTP Monitoring
- Puerto 6222: Clustering
- Credenciales: nats/nats123
- JetStream con 23.42 GB RAM y 694 GB storage
- Persistencia en volumen nats-data
2026-03-23 22:38:06 +01:00
egutierrez d648b755ba feat: add Temporal workflow orchestration
Añadido Temporal con PostgreSQL dedicado para orquestación de workflows y transformaciones de datos.

Servicios incluidos:
- Temporal Server (puerto 7233)
- Temporal UI (puerto 3400)
- Temporal PostgreSQL (puerto 5435)
- Temporal Admin Tools

Configuración dinámica en temporal-dynamicconfig/ con features habilitadas para desarrollo.
2026-03-23 22:37:53 +01:00
egutierrez 3a068b0e3f Initial commit: Docker services stack
Stack completo de servicios Docker incluyendo:
- Homer dashboard para gestión de servicios
- Marquez/OpenLineage para lineage de datos
- Metabase/Rill analytics para análisis
- PostgreSQL/ClickHouse databases
- Configuraciones de Homer y Marquez

Co-Authored-By: Claude Sonnet 4.5 <noreply@anthropic.com>
2026-03-23 21:41:12 +01:00