• analiticas
  • Posts
  • Aggregare i dati con groupby() in pandas: un'introduzione

Aggregare i dati con groupby() in pandas: un'introduzione

Scopri come raggruppare rapidamente i tuoi dati.

Il metodo groupby() permette di aggregare i nostri dati secondo uno o più criteri.

In questa micro-lezione vedremo come iniziare ad usarlo.

Iniziamo

Per prima cosa, importiamo pandas:

import pandas as pd

Adesso, immagina groupby() come un processo composto da tre passaggi:

  1. Formazione dei gruppi.

  2. Aggregazione.

  3. Creazione di un nuovo dataframe.

Immaginiamo di avere un dataframe come questo, di cui vediamo le prime 5 righe:

groupby() pandas

Raggruppare secondo i valori di una colonna

Ipotizziamo di voler sommare i valori delle vendite, per città. In questo caso faremo così:

df_raggruppato = df.groupby(['città']).sum()

Cerchiamo di capire quali sono i tre passaggi elencati in precedenza:

  • Rosso: formazione dei gruppi. In questo caso raggruppiamo i dati secondo i valori della colonna città.

  • Blu: aggregazione. Abbiamo scelto di fare la somma.

  • Verde: creazione di un nuovo dataframe. Nel nostro esempio, lo abbiamo chiamato “df_raggruppato”.

In questo modo avremo un dataframe con la somma delle vendite, per città, che sarà così:

groupby() pandas

Per avere una panoramica gloabale del metodo groupby(), ti consiglio di dare un’occhiata alla micro-lezione Padroneggiare groupby: multi-aggregazione e funzioni personalizzate  

Alla prossima micro-lezione 👋