Comment convertir l'index d'une Dataframe de Pandas en une colonne
-
df.index
pour ajouter l’index comme une nouvelle colonne -
reset_index
avecrename_axis
pour renommer le nom de la colonne d’index actuelle -
Méthode
set_index
pour convertir une colonne en index -
MultiIndex
pour mettre plusieurs couches d’index
surcolonne
Nous allons introduire différentes méthodes pour convertir l’index d’une image de données de Pandas en une colonne, comme par exemple df.index
, set_index
, et reset_index
avec rename_axis
pour renommer l’index.
Nous allons également présenter comment nous pouvons appliquer un Multi-Index
à une DataFrame
donnée avec plusieurs couches d’index.
df.index
pour ajouter l’index comme une nouvelle colonne
La façon la plus simple d’ajouter l’index comme colonne est d’ajouter df.index
comme nouvelle colonne à DataFrame
.
Considérons le code suivant:
# python 3.x
import pandas as pd
df = pd.DataFrame(
[(1, 2, None), (None, 4, None), (5, None, 7), (5, None, None)],
columns=["a", "b", "d"],
)
df["index"] = df.index
print(df)
Production:
a b d index1
0 1.0 2.0 NaN 0
1 NaN 4.0 NaN 1
2 5.0 NaN 7.0 2
3 5.0 NaN NaN 3
reset_index
avec rename_axis
pour renommer le nom de la colonne d’index actuelle
Nous pouvons changer le nom de notre index
, puis utiliser reset_index
pour une série:
# python 3.x
import pandas as pd
df = pd.DataFrame(
[(1, 2, None), (None, 4, None), (5, None, 7), (5, None, None)],
columns=["a", "b", "d"],
)
df = df.rename_axis("index").reset_index()
print(df)
Production:
index a b d
0 0 1.0 2.0 NaN
1 1 NaN 4.0 NaN
2 2 5.0 NaN 7.0
3 3 5.0 NaN NaN
Méthode set_index
pour convertir une colonne en index
Nous pouvons convertir n’importe quelle colonne en index
en utilisant la méthode set_index
:
# python 3.x
import pandas as pd
df = pd.DataFrame(
[(1, 2, None), (None, 4, None), (5, 4, 7), (5, 5, None)], columns=["a", "b", "d"]
)
df.set_index("b", inplace=True)
print(df)
Production:
a d
b
2 1.0 NaN
4 NaN NaN
4 5.0 7.0
5 5.0 NaN
Ou si nous voulons supprimer le nom de l’index, comme dans l’original, nous pouvons faire df.index.name = None
:
# python 3.x
import pandas as pd
df = pd.DataFrame(
[(1, 2, None), (None, 4, None), (5, 4, 7), (5, 5, None)], columns=["a", "b", "d"]
)
df.set_index("b", inplace=True)
df.index.name = None
print(df)
Production:
a d
2 1.0 NaN
4 NaN NaN
4 5.0 7.0
5 5.0 NaN
MultiIndex
pour mettre plusieurs couches d’index
sur colonne
Nous pouvons utiliser la fonction MultiIndex.from_product()
pour faire un MultiIndex comme suit:
# python 3.x
import pandas as pd
import numpy as np
index = pd.MultiIndex.from_product(
[["Burger", "Steak", "Sandwich"], ["Half", "Full"]], names=["Item", "Type"]
)
df = pd.DataFrame(
index=index, data=np.random.randint(0, 10, (6, 4)), columns=list("abcd")
)
print(df)
Production:
a b c d
Item Type
Burger Half 0 3 9 1
Full 2 2 0 5
Steak Half 8 4 5 5
Full 5 8 0 7
Sandwich Half 2 8 9 5
Full 4 4 5 9
Article connexe - Pandas DataFrame
- Comment obtenir les en-têtes de colonne de Pandas DataFrame sous forme de liste
- Comment supprimer une colonne de Pandas DataFrame
- Comment convertir la colonne DataFrame en date-heure dans Pandas
- Comment convertir un float en un entier dans Pandas DataFrame
- Comment trier le DataFrame de Pandas par les valeurs d'une colonne
- Comment obtenir l'agrégat des Pandas par groupe et par somme