| aggregate_by_group |
function |
py |
datascience |
1.0.0 |
pure |
def aggregate_by_group(rows: list[dict], group_by: list[str], aggs: dict[str, str]) -> list[dict] |
GROUP BY + agregaciones sobre datos tabulares. aggs es un dict de columna a funcion (sum, mean, count, min, max, first, last, collect). collect acumula valores en lista. None se ignora en agregaciones numericas. |
| datascience |
| tabular |
| groupby |
| aggregate |
| transform |
| python |
|
|
|
|
false |
|
|
| name |
desc |
| rows |
lista de dicts donde cada dict representa una fila (ej: [{'dept': 'eng', 'salary': 100}, ...]) |
|
| name |
desc |
| group_by |
lista de nombres de columnas para agrupar (ej: ['dept']). Pueden ser multiples columnas. |
|
| name |
desc |
| aggs |
dict de columna -> funcion de agregacion (ej: {'salary': 'mean'}). Soporta: sum, mean, count, min, max, first, last, collect |
|
|
lista de dicts donde cada dict es un grupo con sus resultados de agregacion |
true |
| Group by una columna con sum |
| Group by multiples columnas |
| Agregacion mean count min max |
| collect acumula en lista |
| Grupo con una sola fila |
| Campo con None se ignora en agregaciones numericas |
|
python/functions/datascience/aggregate_by_group_test.py |
python/functions/datascience/aggregate_by_group.py |