• analiticas
  • Posts
  • 3 modi per rinominare le colonne di un dataframe con pandas

3 modi per rinominare le colonne di un dataframe con pandas

Come cambiare i nomi delle colonne nel tuo set di dati? Python ci dà una mano.

Lavorare con i dati richiede a volte di modificare i nomi delle colonne per renderli più chiari o adatti alle nostre esigenze. In questa micro-lezione vediamo 3 modi diversi per farlo, usando Python e pandas.

Le librerie e il dataframe di partenza

Per questa micro-lezione è necessario importare la sola libreria pandas (anche se importare sia pandas che numpy è un’ottima abitudine).

import pandas as pd

Immaginiamo di avere un dataframe come questo:

nome

età

ruolo

Mario

33

commerciale

Carlo

27

analista

Anna

42

direttore

Se vuoi ricrearlo per seguire la micro-lezione passo passo, puoi eseguire il codice seguente:

df = pd.DataFrame({
    'nome': ['Mario', 'Carlo', 'Anna'],
    'età': [33, 27, 42],
    'ruolo': ['commerciale', 'analista', 'direttore']
})

Metodo 1: cambiamo il nome di una colonna con rename()

Supponiamo di voler cambiare il nome della colonna “ruolo” in “professione”. Ecco come farlo:

df.rename(columns={'ruolo': 'professione'},
inplace=True)

Nota bene:

Il parametro inplace=True fa sì che il metodo rename() venga applicato direttamente al dataframe sul quale stiamo lavorando.

Dopo questa operazione, il nostro dataframe apparirà così:

nome

età

professione

Mario

33

commerciale

Carlo

27

analista

Anna

42

direttore

Metodo 2: cambiamo il nome di più colonne con rename()

Se vogliamo cambiare il nome di due delle tre colonne del nostro dataframe, possiamo usare un dizionario all’interno del metodo rename(). Ecco come fare:

df.rename(columns = {'nome':'impiegato','età':'anni'},
inplace=True)

Ed ecco il risultato:

impiegato

anni

professione

Mario

33

commerciale

Carlo

27

analista

Anna

42

direttore

Nota bene

La colonna non inclusa nel dizionario non ha subito alcuna modifica

Metodo 3: usiamo l’assegnazione diretta

Un altro modo per rinominare le colonne è l'assegnazione diretta. Questo metodo sostituisce tutti i nomi delle colonne in un colpo solo:

df.columns = ['nome', 'età', 'ruolo']

Ecco qui come apparirà il nostro dataframe dopo aver usato l’assegnazione diretta:

nome

età

ruolo

Mario

33

commerciale

Carlo

27

analista

Anna

42

direttore

Considerazioni importanti

  • Il metodo rename() è utile quando vuoi cambiare solo il nome di alcune colonne.

  • L'assegnazione diretta è più veloce ma richiede di specificare tutti i nomi delle colonne. È l’ideale per dataframe con poche colonne.

Con questi metodi potrai facilmente personalizzare i nomi delle colonne del tuo dataframe al fine di renderli più comprensibili per te e per i tuoi colleghi.

Alla prossima micro-lezione 👋