Visualización de gráficos de KDE con Pandas y Seaborn

Samreena Aslam 30 enero 2023
  1. Visualización de datos utilizando el gráfico normal de KDE y Seaborn en Python
  2. Gráfica KDE unidimensional usando Pandas y Seaborn en Python
  3. Gráfica KDE bidimensional o bivariada utilizando Pandas y Seaborn en Python
  4. Conclusión
Visualización de gráficos de KDE con Pandas y Seaborn

KDE es Estimación de la densidad del kernel, que se utiliza para visualizar la densidad de probabilidad de variables de datos continuas y no paramétricas. Cuando desee visualizar las distribuciones múltiples, la función KDE produce un gráfico menos desordenado que es más interpretable.

Usando KDE, podemos visualizar múltiples muestras de datos usando un solo gráfico, que es un método más eficiente en la visualización de datos.

Seaborn es una biblioteca de Python como matplotlib. Seaborn se puede integrar con pandas y numpy para representaciones de datos.

Los científicos de datos usan esta biblioteca para crear cuadros y gráficos estadísticos informativos y atractivos. Con estas presentaciones, puede comprender los conceptos claros y el flujo de información dentro de los diferentes módulos.

Podemos trazar gráficos univariados y bivariados usando la función KDE, Seaborn y Pandas.

Aprenderemos sobre la visualización de gráficos de KDE con pandas y seaborn. Este artículo utilizará algunas muestras del conjunto de datos mtcars para mostrar la visualización de gráficos de KDE.

Antes de comenzar con los detalles, debe instalar o agregar las bibliotecas seaborn y sklearn usando el comando pip.

pip install seaborn
pip install sklearn

Visualización de datos utilizando el gráfico normal de KDE y Seaborn en Python

Podemos trazar los datos utilizando la función de trazado normal de KDE con la biblioteca Seaborn.

En el siguiente ejemplo, hemos creado 1000 muestras de datos utilizando la biblioteca aleatoria y luego las organizamos en la matriz de numpy porque la biblioteca Seaborn solo funciona bien con numpy y Pandas dataframes.

Código de ejemplo:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np

data = np.random.randn(1000)
# KDE Plot with seaborn
res = sn.kdeplot(data, color="red", shade="True")
plt.show()

Producción:

Visualización de gráficos de KDE con pandas y seaborn - Gráfico de KDE con Seaborn

También podemos visualizar la muestra de datos anterior verticalmente o revertir el gráfico anterior usando la biblioteca KDE y Seaborn. Usamos la propiedad de trama vertical=True para revertir la trama anterior.

Código de ejemplo:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np

data = np.random.randn(1000)
# KDE Plot with seaborn
res = sn.kdeplot(data, color="green", vertical=True, shade="True")
plt.show()

Producción:

Visualización de gráficos de KDE con pandas y seaborn - Gráfico de KDE con Seaborn

Gráfica KDE unidimensional usando Pandas y Seaborn en Python

Podemos visualizar la distribución de probabilidad para un único objetivo o atributo continuo utilizando el diagrama de KDE. En el siguiente ejemplo, hemos leído un archivo CSV del conjunto de datos mtcars.

Hay más de 350 entradas en nuestro conjunto de datos y visualizaremos la distribución univariada a lo largo del eje x.

Código de ejemplo:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# read CSV file of dataset using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# kde plot using seaborn
sn.kdeplot(data=dataset, x="hp", shade=True, color="red")
plt.show()

Producción:

Visualización de gráficos de KDE con pandas y seaborn - Gráfico de KDE con Seaborn

También puede voltear la gráfica visualizando la variable de datos a lo largo del eje y.

Código de ejemplo:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, y="hp", shade=True, color="red")
plt.show()

Producción:

Visualización de gráficos de KDE con pandas y seaborn - Gráfico de KDE con Seaborn

Podemos visualizar la distribución de probabilidad de múltiples valores objetivo en una sola gráfica.

Código de ejemplo:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, x="hp", shade=True, color="red")
sn.kdeplot(data=dataset, x="mpg", shade=True, color="green")
sn.kdeplot(data=dataset, x="disp", shade=True, color="blue")
plt.show()

Producción:

Visualización de gráficos de KDE con pandas y seaborn - Gráfico de KDE con Seaborn

Gráfica KDE bidimensional o bivariada utilizando Pandas y Seaborn en Python

Podemos visualizar datos en gráficos KDE bidimensionales o bivariados utilizando la biblioteca seaborn y pandas.

De esta forma, podemos visualizar la distribución de probabilidad de una muestra dada frente a múltiples atributos continuos. Visualizamos los datos a lo largo de los ejes x e y.

Código de ejemplo:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, shade=True, x="hp", y="mpg")
plt.show()

Producción:

Visualización de gráficos de KDE con pandas y seaborn - Gráfico de KDE con Seaborn

De manera similar, podemos trazar la distribución de probabilidad de múltiples muestras utilizando un único gráfico KDE.

Código de ejemplo:

import seaborn as sn
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# Read CSV file using pandas
dataset = pd.read_csv(r"C:\\Users\\DELL\\OneDrive\\Desktop\\samplecardataset.csv")
# KDE plotting using seaborn
sn.kdeplot(data=dataset, shade=True, x="hp", y="mpg", cmap="Blues")
sn.kdeplot(data=dataset, shade=True, x="hp", y="cyl", cmap="Greens")
plt.show()

Producción:

Visualización de gráficos de KDE con pandas y seaborn - Gráfico de KDE con Seaborn

Conclusión

Lo demostramos en este tutorial usando la visualización de gráficos de KDE usando la biblioteca Pandas y Seaborn. Hemos visto cómo visualizar la distribución de probabilidad de muestras únicas y múltiples en un gráfico KDE unidimensional.

Discutimos cómo usar el diagrama de KDE con Seaborn y Pandas para visualizar los datos bidimensionales.

Artículo relacionado - Pandas DataFrame