32c7336bf6
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
3.7 KiB
3.7 KiB
name, kind, lang, domain, version, purity, signature, description, tags, params, output, uses_functions, uses_types, returns, returns_optional, error_type, imports, tested, tests, test_file_path, file_path
| name | kind | lang | domain | version | purity | signature | description | tags | params | output | uses_functions | uses_types | returns | returns_optional | error_type | imports | tested | tests | test_file_path | file_path | |||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| query_osint_db | function | py | datascience | 1.0.0 | impure | def query_osint_db(sql: str, base_url: str = 'http://127.0.0.1:8771', timeout: int = 30) -> dict | Ejecuta un SELECT contra el service osint_db (DuckDB, FastAPI single-writer en 127.0.0.1:8771) por HTTP POST a /api/query y devuelve {status, columns, rows, row_count} sin lanzar. Normaliza service caido a un error claro. |
|
|
dict. En exito reenvia el cuerpo del service: {status:'ok', columns:[str,...], rows:[{col:val,...},...], row_count:int, truncated:bool}. En error (sin lanzar): {status:'error', error:str}. Service inalcanzable -> error 'osint_db service not reachable on <url>: <detalle>'. | false | error_go_core | true |
|
python/functions/datascience/query_osint_db_test.py | python/functions/datascience/query_osint_db.py |
Ejemplo
import sys, os
sys.path.insert(0, os.path.join("python", "functions"))
from datascience.query_osint_db import query_osint_db
res = query_osint_db("SELECT COUNT(*) FROM personas")
# {'status': 'ok', 'columns': ['count_star()'], 'rows': [{'count_star()': 545}],
# 'row_count': 1, 'truncated': False}
print(res["rows"])
Lanzable directo:
./fn run query_osint_db_py_datascience
# o pasandole el SQL como arg:
python/.venv/bin/python3 python/functions/datascience/query_osint_db.py "SELECT COUNT(*) FROM personas"
Cuando usarla
Cuando necesites leer la verdad OSINT que vive en el service osint_db (DuckDB, fuente
de verdad del proyecto osint: personas, dominios, network_scans, etc.). Sustituye el
patron inline repetido curl -s -X POST 127.0.0.1:8771/api/query ... por una sola
llamada con retorno estructurado. Usala antes de escribir un heredoc/curl a mano
contra ese endpoint.
Gotchas
- El service
osint_dbdebe estar arriba (escucha en127.0.0.1:8771). Si esta caido, la funcion NO lanza: devuelve{status:'error', error:'osint_db service not reachable on <url>: ...'}. Comprueba el status antes de leerrows. osint_dbes single-writer: el endpoint/api/queryes estrictamente read-only (abre una conexion DuckDB read_only separada). Desde aqui usa solo SELECT — una escritura fallara a nivel de service.- El service responde siempre HTTP 200; el status real del dominio viaja en el
cuerpo (
status: 'ok'|'error'). La funcion reenvia ese cuerpo tal cual en exito. - El
max_rowsdel service tiene tope (default 500, max 10000); para volcados grandes pagina o usa la maestra directamente.
Notas
Solo stdlib (urllib, json): wrapper de transporte puro, sin dependencias de runtime.
Sigue la convencion de retorno de pg_query_py_infra y duckdb_query_readonly
({status:'ok'|'error', ...}). El service osint_db vive en
projects/osint/apps/osint_db/ y su /api/query delega en duckdb_query_readonly.