Files
fn_registry/functions/infra/audit_copied_code.md
T
egutierrez fc4180cbb3 chore: auto-commit (129 archivos)
- .claude/agents/fn-analizador/SKILL.md
- .claude/agents/fn-constructor/SKILL.md
- .claude/agents/fn-executor/SKILL.md
- .claude/agents/fn-mejorador/SKILL.md
- .claude/agents/fn-orquestador/SKILL.md
- .claude/agents/fn-recopilador/SKILL.md
- .claude/commands/app.md
- .claude/commands/compile.md
- .claude/commands/cpp-app.md
- .claude/commands/create_functions.md
- ...

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-06-01 22:23:12 +02:00

3.0 KiB

name, lang, domain, version, purity, kind, description, tags, signature, error_type, returns_optional, params, output, uses_functions, uses_types, imports, example, file_path, tested, notes
name lang domain version purity kind description tags signature error_type returns_optional params output uses_functions uses_types imports example file_path tested notes
audit_copied_code go infra 0.1.0 impure function Audita apps en busca de cuerpos de funcion copiados del registry sin import. Calcula fingerprint normalizado (strip comments + whitespace) por funcion del registry y por funcion declarada en apps/, projects/*/apps/. Reporta matches exactos. MVP: exact_copy con sha256 truncado. Issue 0085k.
audit
drift
monitoring
registry
doctor
copied-code
func AuditCopiedCode(registryRoot string) ([]CopiedCodeEntry, error) error_go_core false
name desc
registryRoot Path absoluto al directorio raiz del fn_registry (contiene registry.db). El audit busca apps/ y projects/*/apps/ dentro.
Lista de CopiedCodeEntry: {app_file, app_function, registry_id, body_hash, similarity, kind}. similarity=1.0 y kind='exact_copy' en MVP.
crypto/sha256
database/sql
io/fs
os
path/filepath
regexp
strings
github.com/mattn/go-sqlite3
import "fn-registry/functions/infra" entries, err := infra.AuditCopiedCode("$HOME/fn_registry") if err != nil { ... } for _, e := range entries { fmt.Printf("%s:%s ~ %s (%s, %.2f)\n", e.AppFile, e.AppFunction, e.RegistryID, e.Kind, e.Similarity) } functions/infra/audit_copied_code.go false Pipeline interno: 1. Lee `registry.db.functions(id, lang, code, file_path)` para construir fingerprint index `hash → [registry_id, ...]`. Cada `code` se parsea por `extractFunctions(code, lang)` para indexar cada funcion declarada dentro del archivo (importante para `.py` que contiene varias). 2. Construye skip-set con los `file_path` del registry para no flagear la funcion como copia de si misma. 3. Walk recursivo de `apps/` y `projects/*/apps/`. Skip de `.git`, `.venv`, `node_modules`, `__pycache__`, `build`, `dist`, `vendor`, `.pytest_cache`, `.cache`. 4. Por cada archivo `.go/.py/.sh/.ts/.cpp`, extrae funciones y hash. 5. Match en fpIndex → emite CopiedCodeEntry. Normalizacion: - Go/TS/C++: strip `//...` y `/* ... */`, collapse whitespace. - Python: strip docstrings (triple quotes), strip `#...` lines, collapse. - Bash: strip `#...` lines, collapse. Hash: sha256 hex truncado a 16 chars del cuerpo normalizado. Cuerpos con menos de 20 chars normalizados se descartan (trivialmente similares). Limitaciones MVP: - Solo exact_copy. near_copy/partial_match (fuzzy hash, AST SimHash, embeddings) en fase futura. - extractFunctions con regex naive. Falla con: - signatures multi-linea - lambdas y closures - metodos con receivers complejos - cadenas/comentarios con `{` dentro - C++ regex es la mas fragil (templates, namespaces, multiple inheritance). - No detecta copias con renames de variables. Para eso = fuzzy hash. Privacidad: solo se persisten paths, function names, y hashes. Nunca contenido del codigo. El cuerpo solo vive en memoria durante el audit.