Python으로 Seaborn 쌍 플롯
Python에서는 seaborn 모듈을 사용하여 다양한 유형의 그래프와 플롯을 만들어 데이터 세트를 시각화합니다. 다른 함수는 다른 유형의 플롯을 생성합니다. 때로는 단일 플롯이 데이터 세트를 시각화하기에 충분하지 않을 수 있으며 여러 그래프를 동시에 플롯해야 할 수도 있습니다. pairplot()
함수가이를 지원할 수 있습니다.
이 튜토리얼은 파이썬에서 seaborn 모듈의pairplot()
함수를 사용하는 방법을 소개합니다.
seaborn의PairGrid
클래스를 기반으로하며 해당 유형의 객체를 반환합니다. 또한 두 축에 데이터의 모든 숫자 열을 플로팅하여 서로 다른 플롯의 행렬을 표시합니다. 대각선에는 균일 한 그래프가 있고 위쪽 및 아래쪽 삼각형에는 다른 플롯이있는 최종 그림이 생성됩니다.
원하는 경우pairplot()
함수 내에서x_vars
,y_vars
또는vars
인수를 사용하여 플로팅 할 필수 변수를 지정할 수 있습니다.
예를 들면
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df)
위의 코드에서pairplot()
함수의 간단한 예제를 생성합니다. 대각선에 여러 그래프가 그려져 있습니다.
몇 가지 방법과 매개 변수를 사용하여 최종 결과를 조정할 수 있습니다. hue
매개 변수를 사용하여 서로 다른 색상으로 서로 다른 범주를 표시 할 수 있습니다. palette
인수는 여기에 사용되는 색상을 정의 할 수 있습니다. 모든 그래프에 공통 범례가 추가됩니다. 위의 예에 이것을 추가하여 두 제품을 구별 할 수 있습니다.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", palette="husl")
우리는 또한 위쪽-아래쪽 또는 삼각형과 대각선에 그릴 그래프의 종류를 제어 할 수 있습니다. diag_kind
매개 변수는 대각선에 대한 플롯을 지정하고 나머지에 대한kind
매개 변수를 지정하는 데 사용됩니다. 값은reg
,scatter
,kde
,hist
또는 기타 플롯 일 수 있습니다.
예를 들면
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", diag_kind="hist", kind="scatter")
대각선의 개별 플롯을 사용자 정의하기 위해plot_kws
및diag_kws
매개 변수를 사용합니다. 필요한 맞춤 설정을 사전 키-값 쌍으로 전달합니다. height
매개 변수를 사용하여 개별 플롯의 높이를 변경할 수도 있습니다.
또한PairGrid
클래스의 객체를 반환하여 해당 클래스의 메서드를 사용하여 최종 Figure를 사용자 정의한다는 점을 기억하십시오.
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn