- analiticas
- Posts
- Aggregare i dati con groupby() in pandas: un'introduzione
Aggregare i dati con groupby() in pandas: un'introduzione
Scopri come raggruppare rapidamente i tuoi dati.
Il metodo groupby()
permette di aggregare i nostri dati secondo uno o più criteri.
In questa micro-lezione vedremo come iniziare ad usarlo.
Iniziamo
Per prima cosa, importiamo pandas:
import pandas as pd
Adesso, immagina groupby()
come un processo composto da tre passaggi:
Formazione dei gruppi.
Aggregazione.
Creazione di un nuovo dataframe.
Immaginiamo di avere un dataframe come questo, di cui vediamo le prime 5 righe:
Raggruppare secondo i valori di una colonna
Ipotizziamo di voler sommare i valori delle vendite, per città. In questo caso faremo così:
df_raggruppato = df.groupby(['città']).sum()
Cerchiamo di capire quali sono i tre passaggi elencati in precedenza:
Rosso: formazione dei gruppi. In questo caso raggruppiamo i dati secondo i valori della colonna città.
Blu: aggregazione. Abbiamo scelto di fare la somma.
Verde: creazione di un nuovo dataframe. Nel nostro esempio, lo abbiamo chiamato “df_raggruppato”.
In questo modo avremo un dataframe con la somma delle vendite, per città, che sarà così:
Per avere una panoramica gloabale del metodo groupby()
, ti consiglio di dare un’occhiata alla micro-lezione Padroneggiare groupby: multi-aggregazione e funzioni personalizzate
Alla prossima micro-lezione 👋