Obtenir la liste de la série Pandas DataFrame
Python est un langage bien connu pour l’analyse de données, principalement en raison des packages Python. Pandas est l’un de ces packages qui nous aide à analyser les données beaucoup plus facilement.
La méthode tolist()
de Pandas convertit une série en une série ou une liste intégrée de Python. Par défaut, la série est du type de données pandas.core.series.Series
et de la méthode tolist()
, convertie en une liste de données.
Utilisez la méthode tolist()
pour obtenir la liste de la série Pandas DataFrame
Cet article explique comment obtenir une liste à partir de la colonne Pandas Dataframe. Nous allons d’abord lire un fichier CSV dans un Pandas DataFrame.
import pandas as pd
# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)
Production :
Area Home price
0 1000 10000
1 1200 12000
2 1300 13000
Maintenant, nous allons extraire la valeur de la colonne et la convertir en liste car nous savons que tolist()
aide.
list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)
Production :
extract the value of series and converting into the list
[10000, 12000, 13000, 14000, 15000]
La liste est un conteneur Python ordonné et flexible, l’une des structures de données les plus courantes en Python. Les éléments sont insérés entre crochets []
, séparés par des virgules pour créer une liste. La liste peut contenir des valeurs en double ; c’est pourquoi nous utilisons principalement des listes dans les ensembles de données.
import numpy as np
import pandas as pd
# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)
Dans ce cas, les prix sont majorés de 1.5
taxe de nos jours. Maintenant, nous créons une liste nommée liste “mise à jour” et mettons à jour la colonne existante ; de plus, nous créons un nouveau fichier CSV en utilisant la méthode to_csv()
.
Production :
after include 1.5 % tax
[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
Unnamed: 0 Area Home price
0 0 1000 15000.0
1 1 1200 18000.0
2 2 1300 19500.0
3 3 1400 21000.0
4 4 1500 22500.0
Prenons un autre exemple simple :
import pandas as pd
df = pd.DataFrame(
{
"Country": ["Pakistan", "India", "America", "Russia", "China"],
"Immigrants": ["2000", "2500", "6000", "4000", "1000"],
"Years": ["2010", "2008", "2011", "2018", "2016"],
}
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))
Veuillez noter que le type de données de la série est modifié par tolist()
, et nous avons obtenu une liste avec toutes les colonnes de Dataframe.
Production :
Country Immigrants Years
0 Pakistan 2000 2010
1 India 2500 2008
2 America 6000 2011
3 Russia 4000 2018
4 China 1000 2016
<class 'pandas.core.indexes.base.Index'>
['Country', 'Immigrants', 'Years']
After type cast into the list
<class 'list'>
Tous les codes sont ici.
import numpy as np
import pandas as pd
# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)
list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)
# another example
# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)
# another example
df = pd.DataFrame(
{
"Country": ["Pakistan", "India", "America", "Russia", "China"],
"Immigrants": ["2000", "2500", "6000", "4000", "1000"],
"Years": ["2010", "2008", "2011", "2018", "2016"],
}
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))
Production :
Area Home price
0 1000 10000
1 1200 12000
2 1300 13000
extract the value of series and converting into the list
[10000, 12000, 13000]
after include 1.5 % tax
[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
Unnamed: 0 Area Home price
0 0 1000 15000.0
1 1 1200 18000.0
2 2 1300 19500.0
3 3 1400 21000.0
4 4 1500 22500.0
Country Immigrants Years
0 Pakistan 2000 2010
1 India 2500 2008
2 America 6000 2011
3 Russia 4000 2018
4 China 1000 2016
<class 'pandas.core.indexes.base.Index'>
['Country', 'Immigrants', 'Years']
After type cast into the list
<class 'list'>
Article connexe - Pandas DataFrame
- Comment obtenir les en-têtes de colonne de Pandas DataFrame sous forme de liste
- Comment supprimer une colonne de Pandas DataFrame
- Comment convertir la colonne DataFrame en date-heure dans Pandas
- Comment convertir un float en un entier dans Pandas DataFrame
- Comment trier le DataFrame de Pandas par les valeurs d'une colonne
- Comment obtenir l'agrégat des Pandas par groupe et par somme