| extract_iocs |
function |
go |
cybersecurity |
1.0.0 |
pure |
func ExtractIocs(text string, types []string) []IoC |
Port a Go de extract_iocs_py_cybersecurity. Extrae todos los IoCs (email, ip_address, domain, file_hash, crypto_wallet, cve_id, mac_address, phone_number) de un texto usando regex puro. Si types es nil corre todos los extractores; si tiene valores filtra solo esos tipos. Deduplica por (Type, Value) y elimina spans contenidos (ej. dominio dentro de un email). Retorna slice ordenada por offset. |
| ioc |
| cybersecurity |
| regex |
| threat-intel |
| email |
| ip |
| domain |
| hash |
| wallet |
| cve |
| mac |
| phone |
| pendiente-usar |
|
|
|
|
false |
|
|
| name |
desc |
| text |
Texto plano o markdown del que extraer IoCs. Puede contener cualquier contenido — se aplican todos los extractores sobre el texto completo. |
|
| name |
desc |
| types |
Slice de tipos a extraer. Valores validos: email, ip_address, domain, file_hash, crypto_wallet, cve_id, mac_address, phone_number. Si es nil, se corren todos los extractores. Tipos desconocidos se ignoran silenciosamente. |
|
|
Slice de IoC ordenada por offset Start ascendente. Cada IoC tiene Type, Value, Start (byte offset inicio), End (byte offset fin) y opcionalmente Extra (algorithm para file_hash, asset para crypto_wallet). Sin duplicados: mismo (Type, Value) aparece una sola vez, y spans completamente contenidos dentro de otro span se descartan. |
true |
| texto sin IoCs retorna slice vacia |
| un IoC de cada tipo detectado |
| filtro por types=[email] retorna solo emails |
| dedup mismo email aparece dos veces solo una entrada |
| IPv4 valida detectada |
| numero con octeto 999 no es IPv4 |
| numero con octeto 256 no es IPv4 |
| hash MD5 exactamente 32 hex chars detectado |
| hash SHA1 exactamente 40 hex chars detectado |
| hash SHA256 exactamente 64 hex chars detectado |
| hash SHA512 exactamente 128 hex chars detectado |
| longitud intermedia 60 hex chars ignorada |
| dominio contenido en email span se descarta |
| tipos desconocidos se ignoran sin error |
| CVE-2014-0160 extraido |
| multiples CVEs en mismo texto |
| MAC con dos puntos extraida |
| separadores mezclados rechazados |
| E.164 con prefijo pais extraido |
| formato ES 9 digitos extraido |
| offsets Start/End cubren el valor exacto en el texto |
| pipeline completo detecta email ip cve mac wallet |
|
functions/cybersecurity/extract_iocs_test.go |
functions/cybersecurity/extract_iocs.go |