Files
fn_registry/functions/browser/cdp_get_text_in_frame.go
T
egutierrez 8742cb25be feat(browser): auto-commit con 60 cambios
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-06-07 11:42:31 +02:00

45 lines
1.4 KiB
Go

package browser
import (
"fmt"
"unicode/utf8"
)
// CdpGetTextInFrame retorna el texto visible (innerText) del documento de un
// iframe especifico, componiendo sobre CdpEvalInFrame con un mundo aislado CDP.
//
// Lee document.body.innerText (cae a document.documentElement.innerText si no
// hay body), evitando parsear HTML crudo. Replica la politica de truncado de
// CdpGetText: si maxBytes > 0 trunca al limite dado con corte rune-safe y añade
// un sufijo con el total original en bytes; si maxBytes <= 0 no hay limite.
//
// Propaga los errores de CdpEvalInFrame (frame inexistente, contexto caducado)
// envueltos con %w.
func CdpGetTextInFrame(c *CDPConn, frameID string, maxBytes int) (string, error) {
if c == nil {
return "", fmt.Errorf("cdp get text in frame: conexion nula")
}
if frameID == "" {
return "", fmt.Errorf("cdp get text in frame: frameID vacio")
}
const expr = `(document.body ? document.body.innerText : document.documentElement.innerText) || ""`
text, err := CdpEvalInFrame(c, frameID, expr)
if err != nil {
return "", fmt.Errorf("cdp get text in frame: %w", err)
}
if maxBytes > 0 && len(text) > maxBytes {
total := len(text)
// Corte rune-safe: retrocede hasta encontrar un rune valido completo.
cut := maxBytes
for cut > 0 && !utf8.RuneStart(text[cut]) {
cut--
}
text = text[:cut] + fmt.Sprintf("\n…[truncado, total %d bytes]", total)
}
return text, nil
}