feat: add BigQuery Python functions and BQClient type
Funciones CRUD completas para BigQuery: auth, datasets, tables, queries, jobs, routines, load/export. Tipo BQClient como wrapper del SDK oficial.
This commit is contained in:
@@ -0,0 +1,50 @@
|
||||
---
|
||||
name: bq_preview_rows
|
||||
kind: function
|
||||
lang: py
|
||||
domain: infra
|
||||
version: "1.0.0"
|
||||
purity: impure
|
||||
signature: "def bq_preview_rows(client: BQClient, dataset_id: str, table_id: str, max_results: int = 10) -> dict"
|
||||
description: "Obtiene una muestra de filas de una tabla BigQuery sin ejecutar query SQL, sin coste de procesamiento. Usa client._client.list_rows() del SDK oficial."
|
||||
tags: [bigquery, gcp, table, preview, google-cloud, python]
|
||||
uses_functions: []
|
||||
uses_types: []
|
||||
returns: []
|
||||
returns_optional: false
|
||||
error_type: "error_go_core"
|
||||
imports: [google-cloud-bigquery]
|
||||
params:
|
||||
- name: client
|
||||
desc: "cliente autenticado BQClient obtenido con bq_auth"
|
||||
- name: dataset_id
|
||||
desc: "ID del dataset que contiene la tabla"
|
||||
- name: table_id
|
||||
desc: "nombre (ID) de la tabla a previsualizar"
|
||||
- name: max_results
|
||||
desc: "numero maximo de filas a retornar (default: 10)"
|
||||
output: "dict con: columns (lista de nombres de columnas), rows (lista de listas con valores), total_rows (int con total de filas en la tabla completa)"
|
||||
tested: false
|
||||
tests: []
|
||||
test_file_path: ""
|
||||
file_path: "python/functions/bigquery/tables.py"
|
||||
---
|
||||
|
||||
## Ejemplo
|
||||
|
||||
```python
|
||||
from bigquery import bq_auth, bq_preview_rows
|
||||
|
||||
client = bq_auth("mi-proyecto")
|
||||
|
||||
preview = bq_preview_rows(client, "ventas_ds", "transacciones", max_results=5)
|
||||
|
||||
print(preview["columns"]) # ["id", "fecha", "monto", "pais"]
|
||||
print(f"Total filas: {preview['total_rows']}")
|
||||
for row in preview["rows"]:
|
||||
print(row) # [1, datetime.date(2024, 1, 15), 99.5, "MX"]
|
||||
```
|
||||
|
||||
## Notas
|
||||
|
||||
`list_rows()` usa la Storage Read API internamente y NO genera un job de query — por tanto no se contabiliza en el uso de bytes procesados. Ideal para inspeccionar rapidamente la estructura y contenido de una tabla. El orden de las filas retornadas no esta garantizado (depende del almacenamiento interno de BigQuery). Para muestras reproducibles o con filtros, usar una query SQL con `LIMIT`. `total_rows` refleja el conteo de la tabla en el momento de la llamada a `get_table()`, que puede tener un pequeno retraso respecto al dato real.
|
||||
Reference in New Issue
Block a user