Plote o gráfico usando a função seaborn.lmplot()

Manav Narula 15 fevereiro 2024
Plote o gráfico usando a função seaborn.lmplot()

O módulo seaborn é usado para criar gráficos estatísticos em Python. Ele é construído no módulo matplotlib, por isso é muito simples de usar.

A função seaborn.lmplot() cria um gráfico de dispersão básico usando os dados fornecidos em um FacetGrid.

Veja o seguinte código.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random

x = range(50)
y = random.sample(range(100), 50)
cat = [i for i in range(2)] * 25
df = pd.DataFrame({"x": x, "y": y, "Category": cat})

sns.lmplot(x="x", y="y", data=df, fit_reg=False, hue="Category")

função lmplot marítima

No entanto, o uso dessa função excede a plotagem de gráficos de dispersão. Também pode ser usado para entender a relação entre os dados traçando uma linha de regressão opcional no gráfico. Também pode ser usado para regressão logística.

Ao contrário da função seaborn.regplot() que também é usada para realizar uma regressão simples e plotar os dados, a função seaborn.lmplot() combina a classe seaborn.FacetGrid() com a classe seaborn.regplot()Função.

O FacetGrid() é usado para visualizar a relação entre a distribuição de dados com outros subconjuntos de dados e pode ser usado para criar grades para vários gráficos. Funciona em três eixos, fornecendo linhas, colunas e tons. É muito útil quando estamos trabalhando com um conjunto de dados complicado.

Também podemos personalizar a figura final usando os diferentes parâmetros com a função seaborn.lmplot(). Podemos fornecer as personalizações necessárias, como a cor do gráfico, como pares de valores-chave de um dicionário para os parâmetros line_kws e scatter_kws.

No código a seguir, traçaremos um gráfico com uma linha de regressão usando esta função.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random

x = range(50)
y = random.sample(range(100), 50)
cat = [i for i in range(2)] * 25
df = pd.DataFrame({"x": x, "y": y, "Category": cat})

sns.lmplot(x="x", y="y", data=df, hue="Category")

função lmplot marítima

Observe que o parâmetro fit_reg é definido como True por padrão. Nosso conjunto de dados tinha várias categorias, portanto, pudemos traçar várias linhas de regressão. Se tivéssemos removido o parâmetro hue, um único gráfico de regressão teria sido obtido. Podemos ainda usar muitos parâmetros para nossa regressão também. Alguns deles incluem o argumento jitter, que é usado para adicionar algum ruído aos dados, ou o parâmetro estimator usado para traçar um determinado valor estimado.

Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn