Encuentra cuantiles en pandas
En este tutorial, aprenderemos cómo obtener cuantiles de un marco de datos en Pandas. Usaremos la función dataframe.quantile()
para realizar esta tarea.
Las funciones numpy.percentile
y dataframe.quantile()
en Pandas devuelven valores en el cuantil proporcionado sobre el eje solicitado.
Necesitamos importar la biblioteca de Pandas para comenzar.
import pandas as pd
Encuentra cuantiles en pandas
Ahora vamos a crear un marco de datos de muestra con cuatro columnas que contengan números sobre los que queremos realizar la operación de cuantiles.
Creamos nuestro dataframe de muestra usando el siguiente código.
df = pd.DataFrame(
{
"A": [1, 5, 3, 4, 2],
"B": [3, 2, 4, 3, 4],
"C": [2, 2, 7, 3, 4],
"D": [4, 3, 6, 12, 7],
}
)
print(df)
Veamos nuestro marco de datos de muestra.
A B C D
0 1 3 2 4
1 5 2 2 3
2 3 4 7 6
3 4 3 3 12
4 2 4 4 7
Ahora encontraremos los cuantiles para nuestro marco de datos. En primer lugar, usaremos la función dataframe.quantile()
para encontrar el cuantil de .2
para todas las columnas en el marco de datos.
Usa la función quantile()
Hacemos esto usando el siguiente código en el que pasamos el primer parámetro para la función como .2
y pasamos el parámetro del eje como 0
para que los cuantiles se calculen en columnas.
df1 = df.quantile(0.2, axis=0)
print(df1)
Ahora veamos las representaciones de cuantiles de nuestro marco de datos que obtuvimos.
A 1.8
B 2.8
C 2.0
D 3.8
También podemos encontrar los cuantiles (.1,.25,.5,.75)
a lo largo del eje del índice, utilizando la función quantile()
.
Para hacer esto, pasamos la lista de valores cuantiles para los que queremos obtener cuantiles.
df1 = df.quantile([0.1, 0.25, 0.5, 0.75], axis=0)
print(df1)
Ahora veamos las representaciones de cuantiles recién obtenidas.
A B C D
0.10 1.4 2.4 2.0 3.4
0.25 2.0 3.0 2.0 4.0
0.50 3.0 3.0 3.0 6.0
0.75 4.0 4.0 4.0 7.0
Hemos obtenido con éxito los valores cuantiles a lo largo del eje del índice para los valores cuantiles mencionados.
Por lo tanto, podemos encontrar cuantiles sobre columnas y ejes de índice en Pandas utilizando el siguiente enfoque.