Python으로 Seaborn 쌍 플롯

Manav Narula 2021년7월16일
Python으로 Seaborn 쌍 플롯

Python에서는 seaborn 모듈을 사용하여 다양한 유형의 그래프와 플롯을 만들어 데이터 세트를 시각화합니다. 다른 함수는 다른 유형의 플롯을 생성합니다. 때로는 단일 플롯이 데이터 세트를 시각화하기에 충분하지 않을 수 있으며 여러 그래프를 동시에 플롯해야 할 수도 있습니다. pairplot()함수가이를 지원할 수 있습니다.

이 튜토리얼은 파이썬에서 seaborn 모듈의pairplot()함수를 사용하는 방법을 소개합니다.

seaborn의PairGrid클래스를 기반으로하며 해당 유형의 객체를 반환합니다. 또한 두 축에 데이터의 모든 숫자 열을 플로팅하여 서로 다른 플롯의 행렬을 표시합니다. 대각선에는 균일 한 그래프가 있고 위쪽 및 아래쪽 삼각형에는 다른 플롯이있는 최종 그림이 생성됩니다.

원하는 경우pairplot()함수 내에서x_vars,y_vars또는vars인수를 사용하여 플로팅 할 필수 변수를 지정할 수 있습니다.

예를 들면

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df)

seaborn의 pairplot

위의 코드에서pairplot()함수의 간단한 예제를 생성합니다. 대각선에 여러 그래프가 그려져 있습니다.

몇 가지 방법과 매개 변수를 사용하여 최종 결과를 조정할 수 있습니다. hue매개 변수를 사용하여 서로 다른 색상으로 서로 다른 범주를 표시 할 수 있습니다. palette인수는 여기에 사용되는 색상을 정의 할 수 있습니다. 모든 그래프에 공통 범례가 추가됩니다. 위의 예에 이것을 추가하여 두 제품을 구별 할 수 있습니다.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df, hue="Product", palette="husl")

hue 매개 변수가있는 seaborn의 pairplot

우리는 또한 위쪽-아래쪽 또는 삼각형과 대각선에 그릴 그래프의 종류를 제어 할 수 있습니다. diag_kind매개 변수는 대각선에 대한 플롯을 지정하고 나머지에 대한kind매개 변수를 지정하는 데 사용됩니다. 값은reg,scatter,kde,hist또는 기타 플롯 일 수 있습니다.

예를 들면

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df, hue="Product", diag_kind="hist", kind="scatter")

diag_kind 매개 변수를 사용하는 seaborn의 pairplot

대각선의 개별 플롯을 사용자 정의하기 위해plot_kwsdiag_kws매개 변수를 사용합니다. 필요한 맞춤 설정을 사전 키-값 쌍으로 전달합니다. height매개 변수를 사용하여 개별 플롯의 높이를 변경할 수도 있습니다.

또한PairGrid클래스의 객체를 반환하여 해당 클래스의 메서드를 사용하여 최종 Figure를 사용자 정의한다는 점을 기억하십시오.

작가: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn