Tomar cortes de columna del DataFrame en Pandas
-
Use
loc()para cortar las columnas en Pandas DataFrame -
Use
iloc()para rebanar columnas en Pandas DataFrame -
Use
redindex()para rebanar columnas en Pandas DataFrame
El corte de columnas en Pandas nos permite cortar el DataFrame en subconjuntos, lo que significa que crea un nuevo DataFrame de Pandas a partir del original con sólo las columnas necesarias. Trabajaremos con el siguiente dataframe como ejemplo de rebanado de columnas.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
print(df)
Resultado:
a b c d
0 0.797321 0.468894 0.335781 0.956516
1 0.546303 0.567301 0.955228 0.557812
2 0.385315 0.706735 0.058784 0.578468
3 0.751037 0.248284 0.172229 0.493763
Use loc() para cortar las columnas en Pandas DataFrame
La biblioteca de Pandas nos proporciona más de un método para llevar a cabo el corte de la columna. El primero es usar la función loc().
La función loc() de Pandas nos permite acceder a los elementos de un dataframe usando nombres de columna o etiquetas de índice. La sintaxis para el rebanado de columnas usando loc():
dataframe.loc[:, [columns]]
Ejemplo:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.loc[:, "a":"c"] # Returns a new dataframe with columns a,b and c
print(df1)
Resultado:
a b c
0 0.344952 0.611792 0.213331
1 0.907322 0.992097 0.080447
2 0.471611 0.625846 0.348778
3 0.656921 0.999646 0.976743
Use iloc() para rebanar columnas en Pandas DataFrame
También podemos usar la función iloc() para acceder a los elementos de Dataframe usando el índice entero de filas y columnas. La sintaxis para el rebanado de columnas usando iloc():
dataframe.iloc[:, [column - index]]
Ejemplo:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
df1 = df.iloc[:, 0:2] # Returns a new dataframe with first two columns
print(df1)
Resultado:
a b
0 0.034587 0.070249
1 0.648231 0.721517
2 0.485168 0.548045
3 0.377612 0.310408
Use redindex() para rebanar columnas en Pandas DataFrame
La función reindex() también puede utilizarse para alterar los índices Dataframe y puede usarse para cortar las columnas. La función reindex() puede tomar muchos argumentos, pero para el rebanado de columnas, sólo necesitaremos proporcionar a la función los nombres de las columnas.
La sintaxis para el rebanado de columnas usando reindex():
dataframe.reindex(columns=[column_names])
Ejemplo:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(4, 4), columns=["a", "b", "c", "d"])
# Returns a new dataframe with c and b columns
df1 = df.reindex(columns=["c", "b"])
print(df1)
Resultado:
c b
0 0.429790 0.962838
1 0.605381 0.463617
2 0.922489 0.733338
3 0.741352 0.118478
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedInArtículo relacionado - Pandas DataFrame
- Cómo obtener las cabeceras de columna de Pandas DataFrame como una lista
- Cómo borrar la columna de Pandas DataFrame
- Cómo convertir la columna del DataFrame a Datetime en Pandas
- Cómo convertir un float en un entero en Pandas DataFrame
- Cómo clasificar Pandas DataFrame por los valores de una columna
- Cómo obtener el agregado de Pandas grupo por y suma
