Paarplot Seaborn in Python

Manav Narula 18 Juli 2021
Paarplot Seaborn in Python

In Python verwenden wir das Seaborn-Modul, um verschiedene Arten von Diagrammen und Diagrammen zu erstellen, um einen Datensatz zu visualisieren. Unterschiedliche Funktionen erzeugen unterschiedliche Typen von Plots. Manchmal reicht ein einzelnes Diagramm möglicherweise nicht aus, um einen Datensatz zu visualisieren, und wir müssen möglicherweise mehrere Diagramme gleichzeitig zeichnen. Dabei kann die Funktion pairplot() helfen.

In diesem Tutorial erfahren Sie, wie Sie die Funktion pairplot() des seaborn-Moduls in Python verwenden.

Es basiert auf der Klasse PairGrid in seaborn und gibt ein Objekt seines Typs zurück. Es zeichnet auch alle numerischen Spalten der Daten auf beiden Achsen auf und zeigt eine Matrix verschiedener Diagramme an. Es erzeugt eine endgültige Figur mit einem einheitlichen Diagramm auf der Diagonalen und einem unterschiedlichen Diagramm auf dem oberen und unteren Dreieck.

Wenn wir möchten, können wir die zu zeichnenden Variablen mit den Argumenten x_vars, y_vars oder vars innerhalb der Funktion pairplot() angeben.

Beispielsweise,

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df)

Paargrundstück in Seaborn

Im obigen Code erstellen wir ein einfaches Beispiel für die Funktion pairplot(). Beachten Sie die verschiedenen Diagramme, die auf der Diagonalen aufgetragen sind.

Wir können das Endergebnis mit einigen Methoden und Parametern optimieren. Der Parameter hue kann verwendet werden, um die verschiedenen Kategorien in verschiedenen Farben darzustellen. Das Argument palette kann die dafür verwendeten Farben definieren. Für alle Diagramme wird eine gemeinsame Legende hinzugefügt. Wir können dies im obigen Beispiel hinzufügen, um die beiden Produkte zu unterscheiden.

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df, hue="Product", palette="husl")

Pairplot in Seaborn mit dem Farbton-Parameter

Wir können auch die Art der Graphen steuern, die auf den oberen-unteren oder Dreiecken und der Diagonale gezeichnet werden sollen. Der Parameter diag_kind wird verwendet, um die Plots für die Diagonale und der Parameter kind für den Rest anzugeben. Ihr Wert kann reg, scatter, kde, hist oder ein anderer Plot sein.

Beispielsweise,

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


df = pd.DataFrame(
    {
        "Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
        "Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
        "Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
        "Product": [
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
            "A",
            "A",
            "A",
            "A",
            "B",
            "B",
            "B",
            "B",
        ],
    }
)
sns.pairplot(df, hue="Product", diag_kind="hist", kind="scatter")

Pairplot in seaborn mit dem diag_kind-Parameter

Um die einzelnen Plots auf der Diagonalen und anderweitig anzupassen, verwenden wir die Parameter plot_kws und diag_kws. Wir übergeben die erforderlichen Anpassungen als Dictionary-Schlüssel-Wert-Paare. Die Höhe der einzelnen Plots können wir auch mit dem Parameter height verändern.

Denken Sie außerdem daran, dass es ein Objekt der Klasse PairGrid zurückgibt, um die endgültige Figur mit Methoden dieser Klasse anzupassen.

Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn