--- id: 0019 title: OCR de region de pantalla y archivos imagen status: pending priority: low created: 2026-05-01 depends_on: [0012] --- ## Objetivo Capturar una region de pantalla (atajo global) o soltar imagen sobre la app (issue 0015) -> Tesseract / PaddleOCR -> texto -> `extract_graph_hybrid`. Util cuando la fuente solo esta como captura, PDF escaneado, o pantalla de un sistema sin copy/paste. ## Alcance - Captura: usar herramienta del SO (gnome-screenshot, flameshot, snipping tool) con flag de region. Linux primero, Windows con Snip & Sketch. - OCR: Tesseract con datos de espanol (`spa.traineddata`). PaddleOCR como alternativa para texto manuscrito o calidades bajas. - Pipeline: imagen -> OCR -> texto -> panel preview de 0013. ## Decisiones - Atajo global configurable (default `Ctrl+Alt+G`). - Idiomas OCR como lista en settings (default `[spa, eng]`). - Persistir la imagen original como `metadata.source_image_path` en la entidad creada para trazabilidad. ## Definicion de hecho - Atajo abre selector de region, capturo un parrafo en pantalla, en menos de 5 s veo entidades extraidas. - Suelto un PNG con texto sobre el canvas, mismo flujo (encadena con 0015). - Calidad de OCR para espanol > 90% en capturas estandar 1080p de texto impreso.