--- name: mrebel_base_load_model kind: function lang: py domain: datascience version: "1.0.0" purity: impure signature: "def mrebel_base_load_model(model_name: str = 'Babelscape/mrebel-base', src_lang: str = 'es_XX', tgt_lang: str = 'tp_XX') -> tuple[Any, Any]" description: "Variante rapida de mrebel_load_model con checkpoint base (250M params, ~900 MB). Delega completamente en mrebel_load_model. Misma licencia CC BY-NC-SA 4.0 — solo uso no comercial." tags: [mrebel, relation-extraction, nlp, model, huggingface, multilingual, seq2seq, datascience, python] uses_functions: [mrebel_load_model_py_datascience] uses_types: [] returns: [] returns_optional: false error_type: "error_go_core" imports: [] params: - name: model_name desc: "ID del modelo en HuggingFace Hub (defecto: Babelscape/mrebel-base, 250M params)" - name: src_lang desc: "codigo de idioma fuente para el tokenizer mBART: 'es_XX' (ES), 'en_XX' (EN), etc." - name: tgt_lang desc: "token de idioma destino del decoder — siempre 'tp_XX'" output: "tupla (tokenizer, model) listos para inferencia, cacheados por (model_name, src_lang) en la cache compartida de mrebel_load_model." tested: false tests: [] test_file_path: "" file_path: "python/functions/datascience/mrebel_base_load_model.py" notes: | LICENCIA: Babelscape/mrebel-base esta bajo CC BY-NC-SA 4.0 (Creative Commons Non-Commercial Share-Alike). Solo uso no comercial. NO usar en productos comerciales. Esta funcion es un thin wrapper — NO duplica logica de carga/cache. Toda la logica vive en mrebel_load_model. Util para benchmarks donde se quiere comparar base vs large con la misma interfaz. La cache es compartida con mrebel_load_model (mismo dict _MODEL_CACHE del modulo). --- ## Ejemplo ```python from python.functions.datascience.mrebel_base_load_model import mrebel_base_load_model # 250M params vs 600M — misma interfaz tokenizer, model = mrebel_base_load_model(src_lang="es_XX") ``` ## Comparacion base vs large | Variant | Params | Size | Latencia CPU/frase | Recall tipico | |---------|--------|------|-------------------|---------------| | mrebel-large | 600M | ~2.4 GB | 15-30 s | alto | | mrebel-base | 250M | ~900 MB | 5-10 s | medio | Para benchmarks de velocidad en graph_explorer, usar base. Para produccion final, evaluar large.