Obtener lista de Pandas DataFrame Series
Python es un lenguaje muy conocido para el análisis de datos, principalmente debido a los paquetes de Python. Pandas es uno de esos paquetes que nos ayudan a analizar datos mucho más fácilmente.
El método tolist()
de Pandas convierte una serie en una serie o lista integrada de Python. Por defecto, la serie es del tipo de datos pandas.core.series.Series
y método tolist()
, convertida a una lista de datos.
Use el método tolist()
para obtener la lista de la serie Pandas DataFrame
Este artículo discutirá cómo obtener una lista de la columna Pandas Dataframe. Primero leeremos un archivo CSV en un Pandas DataFrame.
import pandas as pd
# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)
Producción :
Area Home price
0 1000 10000
1 1200 12000
2 1300 13000
Ahora extraeremos el valor de la columna y lo convertiremos en la lista, ya que sabemos que tolist()
ayuda.
list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)
Producción :
extract the value of series and converting into the list
[10000, 12000, 13000, 14000, 15000]
La lista es un contenedor Python ordenado y flexible, una de las estructuras de datos más comunes en Python. Los elementos se insertan entre corchetes []
, separados por comas para crear una lista. La lista puede contener valores duplicados; es por eso que usamos principalmente listas en conjuntos de datos.
import numpy as np
import pandas as pd
# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)
En este caso, los precios se incrementan en 1.5
de impuesto en los días actuales. Ahora creamos una lista llamada lista actualizada
y actualizamos la columna existente; Además, creamos un nuevo archivo CSV utilizando el método to_csv()
.
Producción :
after include 1.5 % tax
[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
Unnamed: 0 Area Home price
0 0 1000 15000.0
1 1 1200 18000.0
2 2 1300 19500.0
3 3 1400 21000.0
4 4 1500 22500.0
Consideremos otro ejemplo simple:
import pandas as pd
df = pd.DataFrame(
{
"Country": ["Pakistan", "India", "America", "Russia", "China"],
"Immigrants": ["2000", "2500", "6000", "4000", "1000"],
"Years": ["2010", "2008", "2011", "2018", "2016"],
}
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))
Tenga en cuenta que el tipo de datos de la serie se cambia por tolist()
, y obtuvimos una lista con todas las columnas de Dataframe.
Producción :
Country Immigrants Years
0 Pakistan 2000 2010
1 India 2500 2008
2 America 6000 2011
3 Russia 4000 2018
4 China 1000 2016
<class 'pandas.core.indexes.base.Index'>
['Country', 'Immigrants', 'Years']
After type cast into the list
<class 'list'>
Todos los códigos están aquí.
import numpy as np
import pandas as pd
# read csv file
df = pd.read_csv("home_price.csv")
# display 3 rows
df = df.head(3)
print(df)
list1 = df["Home price"].values.tolist()
print("extract the value of series and converting into the list")
print(list1)
# another example
# read csv file
df = pd.read_csv("home_price.csv")
# extract the value of series and converting into the list
list1 = df["Home price"].values.tolist()
list1 = np.array(list1)
# type casting in list data type
updated = list(list1 * 1.5)
print("after include 1.5 % tax\n")
print(updated, "new home price")
df["Home price"] = updated
# create new csv
df.to_csv("home prices after 1 year.csv")
df2 = pd.read_csv("home prices after 1 year.csv")
print(df2)
# another example
df = pd.DataFrame(
{
"Country": ["Pakistan", "India", "America", "Russia", "China"],
"Immigrants": ["2000", "2500", "6000", "4000", "1000"],
"Years": ["2010", "2008", "2011", "2018", "2016"],
}
)
print(df, "\n")
list = df.columns.tolist()
print(type(df.columns))
print("\n", list, "\n")
print("After type cast into the list")
print(type(list))
Producción :
Area Home price
0 1000 10000
1 1200 12000
2 1300 13000
extract the value of series and converting into the list
[10000, 12000, 13000]
after include 1.5 % tax
[15000.0, 18000.0, 19500.0, 21000.0, 22500.0] new home price
Unnamed: 0 Area Home price
0 0 1000 15000.0
1 1 1200 18000.0
2 2 1300 19500.0
3 3 1400 21000.0
4 4 1500 22500.0
Country Immigrants Years
0 Pakistan 2000 2010
1 India 2500 2008
2 America 6000 2011
3 Russia 4000 2018
4 China 1000 2016
<class 'pandas.core.indexes.base.Index'>
['Country', 'Immigrants', 'Years']
After type cast into the list
<class 'list'>
Artículo relacionado - Pandas DataFrame
- Cómo obtener las cabeceras de columna de Pandas DataFrame como una lista
- Cómo borrar la columna de Pandas DataFrame
- Cómo convertir la columna del DataFrame a Datetime en Pandas
- Cómo convertir un float en un entero en Pandas DataFrame
- Cómo clasificar Pandas DataFrame por los valores de una columna
- Cómo obtener el agregado de Pandas grupo por y suma