feat(recon): grupo de reconocimiento de red + servicios + fingerprint web

Añade el capability group `recon` (dominio cybersecurity + pipelines, Python),
con la política de archivado OSINT y página madre docs/capabilities/recon.md.

Lookups y sondeo (wrappers de CLI):
- whois_lookup, rdap_lookup, dns_records, ping_host, traceroute_host, nmap_scan
- save_scan_to_osint (sink común) + recon_osint (pipeline one-shot scan+archivado)

Escaneo de puertos/servicios nativo (stdlib, sin nmap ni sudo):
- scan_tcp_ports: connect-scan TCP concurrente (open/closed/filtered)
- grab_service_banner: banner grab + identificación de servicio/versión real
- identify_port_service: puro, puerto -> servicio IANA esperado (~120 puertos)
- scan_port_services: pipeline one-shot (scan -> identify + banner por puerto abierto)

Fingerprint de tecnología web (estilo Wappalyzer), patrón pura/impura:
- fetch_http_fingerprint: GET stdlib, recoge headers/html/cookies (solo nombres)
- detect_web_tech: puro, matchea ~50 firmas regex -> tecnologías por categoría
- fingerprint_web_stack: pipeline one-shot url -> tecnologías

Todas devuelven dict {status} sin lanzar. Tests: 43 verdes, sin red externa.

Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-06-14 15:12:07 +02:00
parent d89da1292d
commit 935008ec3f
49 changed files with 6659 additions and 302 deletions
@@ -0,0 +1,74 @@
---
name: traceroute_host
kind: function
lang: py
domain: cybersecurity
version: "1.0.0"
purity: impure
signature: "def traceroute_host(host: str, max_hops: int = 30, timeout_s: int = 60) -> dict"
description: "Traza la ruta de red hacia un host ejecutando `traceroute -m <max_hops> -w 2 <host>` (Linux) por subprocess y parseando best-effort cada hop: numero de salto, hosts (nombre + IP) y rtt detectados por regex. Un hop sin respuesta ('* * *') tiene hosts vacio. Devuelve dict de estado sin lanzar; `raw` siempre presente con el stdout."
tags: [recon, traceroute, cybersecurity, network, route]
params:
- name: host
desc: "Hostname o IP destino, ej. google.com o 1.1.1.1. Vacio devuelve status error."
- name: max_hops
desc: "Maximo numero de saltos a sondear (traceroute -m). Default 30."
- name: timeout_s
desc: "Timeout duro del subprocess en segundos (traceroute puede tardar si hay hops que no responden). Default 60."
output: "dict de estado. En exito {status:'ok', host, hops:[{hop:int, hosts:[{name:str, ip:str, rtt_ms:[float,...]}]}], raw:str}; un hop sin respuesta ('* * *') tiene hosts=[]. En fallo {status:'error', error:str, host, raw:str}."
uses_functions: []
uses_types: []
returns: []
returns_optional: false
error_type: "error_py_core"
imports: []
tested: false
tests: []
test_file_path: ""
file_path: "python/functions/cybersecurity/traceroute_host.py"
---
## Ejemplo
```python
import sys, os
sys.path.insert(0, os.path.join("python", "functions"))
from cybersecurity import traceroute_host
res = traceroute_host("1.1.1.1", max_hops=20, timeout_s=40)
print(res["status"]) # "ok"
print(len(res["hops"])) # numero de saltos detectados
for hop in res["hops"][:5]:
ips = [h["ip"] for h in hop["hosts"] if h["ip"]]
print(hop["hop"], ips or "* * *")
print(res["raw"]) # stdout crudo para el vault OSINT
```
## Cuando usarla
Usala para mapear el camino de red (saltos intermedios, ASNs/proveedores por las
IPs) hacia un objetivo durante el recon de infraestructura, despues de confirmar
con `ping_host` que responde. Cada hop con su IP ayuda a inferir la topologia y
el alojamiento del objetivo. Guarda `raw` como evidencia en la nota OSINT.
## Gotchas
- Funcion impura: envia trafico de red (UDP/ICMP segun la implementacion de
traceroute) a multiples saltos. No determinista (rutas cambian, latencia
varia).
- Linux-only: usa la sintaxis `traceroute -m N -w 2` del paquete `traceroute`.
En otras plataformas (`tracert` en Windows, traceroute BSD) los flags y el
formato difieren y el parseo fallaria.
- **Hops filtrados son normales**, no error: firewalls/routers que no decrementan
TTL o no devuelven ICMP TTL-exceeded aparecen como "* * *" → `hosts: []`. Una
traza incompleta o que no llega al destino es esperable, sigue `status:"ok"`.
- Parseo best-effort por regex: captura numero de hop + IPs detectadas; los rtt
de la linea se asocian a todos los hosts del hop (no se separa por sonda).
Para fidelidad total mira `raw`.
- Requiere el binario `traceroute` en PATH. Si falta, devuelve
`{"status":"error",...}` (no lanza). Puede necesitar privilegios segun el modo
(raw sockets); si no los tiene, los hops pueden salir incompletos.
- Nunca lanza: errores en `status`. Si la traza tarda mas de `timeout_s`, es
`status:"error"` con el stdout parcial en `raw`.
- Puede ser lento: con hops que no responden, traceroute espera el `-w 2` por
sonda; ajusta `timeout_s` en consecuencia.