cb7f6e92a0
- project.md - reports/ - tools/import_google_contacts.py Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
43 lines
2.1 KiB
Markdown
43 lines
2.1 KiB
Markdown
---
|
|
name: osint
|
|
description: "Investigaciones OSINT realizadas navegando con los perfiles de Chromium dedicados. Agrupa el vault de notas de investigacion y, a futuro, apps/analyses de recon y agregacion de entidades."
|
|
tags: [osint, recon, web_scraping, investigation]
|
|
repo_url: "https://gitea-dgg044oo04woo4ggcsws4gk0.organic-machine.com/dataforge/osint"
|
|
---
|
|
|
|
## Notas
|
|
|
|
Project dedicado a la investigacion OSINT. El nucleo hoy es el vault `osint` (un vault de
|
|
Obsidian en `/home/enmanuel/Obsidian/osint`, enlazado en `vaults/`), donde se guardan las
|
|
investigaciones hechas navegando con los perfiles de Chromium para OSINT.
|
|
|
|
### Vault osint
|
|
|
|
Notas Markdown con frontmatter YAML y wikilinks `[[...]]`. Estructura:
|
|
|
|
- `personas/` — fichas de personas investigadas (alias, cuentas, conexiones).
|
|
- `dominios/` — dominios/sitios y su recon.
|
|
- `casos/` — investigaciones completas (un caso enlaza personas y dominios).
|
|
- `inbox/` — capturas rapidas sin clasificar.
|
|
|
|
El CRUD del vault se hace con el grupo de funciones del registry `obsidian`
|
|
(`docs/capabilities/obsidian.md`) — headless, sin abrir la app GUI. Para la captura web que
|
|
alimenta las investigaciones, ver el grupo `web-proxy` y el tooling de browser del project
|
|
`web_scraping`.
|
|
|
|
### Stack DuckDB (fuente de verdad estructurada)
|
|
|
|
Desde el 12/06/2026 los datos estructurados del project (entidades del vault + contactos y
|
|
eventos de Xandikos) viven en una base DuckDB que es la fuente de verdad, con el vault como
|
|
capa de prosa + vista. Tres piezas: service `apps/osint_db` (FastAPI 127.0.0.1:8771, dueño
|
|
único de la base), plugin de Obsidian `apps/osint_obsidian_plugin` (bloques ```osintdb con
|
|
queries en vivo dentro de notas) y render headless de tablas Markdown congeladas via bloques
|
|
sentinel. Arquitectura, contrato API, modelo de tablas (maestras con `note_path`, maestras
|
|
DAV y derivadas sin referencias a notas) y operacion: ver `DUCKDB_STACK.md`.
|
|
|
|
### Relacion con web_scraping
|
|
|
|
`web_scraping` aporta la captura/automatizacion (perfiles Chromium, CDP, proxy, flow replay).
|
|
`osint` aporta el destino: el conocimiento destilado de esas sesiones, conectado como grafo
|
|
de notas.
|