- analiticas
- Posts
- 3 modi per rinominare le colonne di un dataframe con pandas
3 modi per rinominare le colonne di un dataframe con pandas
Come cambiare i nomi delle colonne nel tuo set di dati? Python ci dà una mano.
Lavorare con i dati richiede a volte di modificare i nomi delle colonne per renderli più chiari o adatti alle nostre esigenze. In questa micro-lezione vediamo 3 modi diversi per farlo, usando Python e pandas.
Il programma della micro-lezione
Le librerie e il dataframe di partenza
Per questa micro-lezione è necessario importare la sola libreria pandas
(anche se importare sia pandas
che numpy
è un’ottima abitudine).
import pandas as pd
Immaginiamo di avere un dataframe come questo:
nome | età | ruolo |
---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Se vuoi ricrearlo per seguire la micro-lezione passo passo, puoi eseguire il codice seguente:
df = pd.DataFrame({
'nome': ['Mario', 'Carlo', 'Anna'],
'età': [33, 27, 42],
'ruolo': ['commerciale', 'analista', 'direttore']
})
Metodo 1: cambiamo il nome di una colonna con rename()
Supponiamo di voler cambiare il nome della colonna “ruolo” in “professione”. Ecco come farlo:
df.rename(columns={'ruolo': 'professione'},
inplace=True)
Nota bene:
Il parametro inplace=True
fa sì che il metodo rename()
venga applicato direttamente al dataframe sul quale stiamo lavorando.
Dopo questa operazione, il nostro dataframe apparirà così:
nome | età | professione |
---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Metodo 2: cambiamo il nome di più colonne con rename()
Se vogliamo cambiare il nome di due delle tre colonne del nostro dataframe, possiamo usare un dizionario all’interno del metodo rename()
. Ecco come fare:
df.rename(columns = {'nome':'impiegato','età':'anni'},
inplace=True)
Ed ecco il risultato:
impiegato | anni | professione |
---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Nota bene
La colonna non inclusa nel dizionario non ha subito alcuna modifica
Metodo 3: usiamo l’assegnazione diretta
Un altro modo per rinominare le colonne è l'assegnazione diretta. Questo metodo sostituisce tutti i nomi delle colonne in un colpo solo:
df.columns = ['nome', 'età', 'ruolo']
Ecco qui come apparirà il nostro dataframe dopo aver usato l’assegnazione diretta:
nome | età | ruolo |
---|---|---|
Mario | 33 | commerciale |
Carlo | 27 | analista |
Anna | 42 | direttore |
Considerazioni importanti
Il metodo
rename()
è utile quando vuoi cambiare solo il nome di alcune colonne.L'assegnazione diretta è più veloce ma richiede di specificare tutti i nomi delle colonne. È l’ideale per dataframe con poche colonne.
Con questi metodi potrai facilmente personalizzare i nomi delle colonne del tuo dataframe al fine di renderli più comprensibili per te e per i tuoi colleghi.
Alla prossima micro-lezione 👋