Plote o gráfico usando a função seaborn.lmplot()
O módulo seaborn é usado para criar gráficos estatísticos em Python. Ele é construído no módulo matplotlib, por isso é muito simples de usar.
A função seaborn.lmplot()
cria um gráfico de dispersão básico usando os dados fornecidos em um FacetGrid.
Veja o seguinte código.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random
x = range(50)
y = random.sample(range(100), 50)
cat = [i for i in range(2)] * 25
df = pd.DataFrame({"x": x, "y": y, "Category": cat})
sns.lmplot(x="x", y="y", data=df, fit_reg=False, hue="Category")
No entanto, o uso dessa função excede a plotagem de gráficos de dispersão. Também pode ser usado para entender a relação entre os dados traçando uma linha de regressão opcional no gráfico. Também pode ser usado para regressão logística.
Ao contrário da função seaborn.regplot()
que também é usada para realizar uma regressão simples e plotar os dados, a função seaborn.lmplot()
combina a classe seaborn.FacetGrid()
com a classe seaborn.regplot()
Função.
O FacetGrid()
é usado para visualizar a relação entre a distribuição de dados com outros subconjuntos de dados e pode ser usado para criar grades para vários gráficos. Funciona em três eixos, fornecendo linhas, colunas e tons. É muito útil quando estamos trabalhando com um conjunto de dados complicado.
Também podemos personalizar a figura final usando os diferentes parâmetros com a função seaborn.lmplot()
. Podemos fornecer as personalizações necessárias, como a cor do gráfico, como pares de valores-chave de um dicionário para os parâmetros line_kws
e scatter_kws
.
No código a seguir, traçaremos um gráfico com uma linha de regressão usando esta função.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import random
x = range(50)
y = random.sample(range(100), 50)
cat = [i for i in range(2)] * 25
df = pd.DataFrame({"x": x, "y": y, "Category": cat})
sns.lmplot(x="x", y="y", data=df, hue="Category")
Observe que o parâmetro fit_reg
é definido como True por padrão. Nosso conjunto de dados tinha várias categorias, portanto, pudemos traçar várias linhas de regressão. Se tivéssemos removido o parâmetro hue
, um único gráfico de regressão teria sido obtido. Podemos ainda usar muitos parâmetros para nossa regressão também. Alguns deles incluem o argumento jitter
, que é usado para adicionar algum ruído aos dados, ou o parâmetro estimator
usado para traçar um determinado valor estimado.
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn