Paarplot Seaborn in Python
In Python verwenden wir das Seaborn-Modul, um verschiedene Arten von Diagrammen und Diagrammen zu erstellen, um einen Datensatz zu visualisieren. Unterschiedliche Funktionen erzeugen unterschiedliche Typen von Plots. Manchmal reicht ein einzelnes Diagramm möglicherweise nicht aus, um einen Datensatz zu visualisieren, und wir müssen möglicherweise mehrere Diagramme gleichzeitig zeichnen. Dabei kann die Funktion pairplot()
helfen.
In diesem Tutorial erfahren Sie, wie Sie die Funktion pairplot()
des seaborn-Moduls in Python verwenden.
Es basiert auf der Klasse PairGrid
in seaborn und gibt ein Objekt seines Typs zurück. Es zeichnet auch alle numerischen Spalten der Daten auf beiden Achsen auf und zeigt eine Matrix verschiedener Diagramme an. Es erzeugt eine endgültige Figur mit einem einheitlichen Diagramm auf der Diagonalen und einem unterschiedlichen Diagramm auf dem oberen und unteren Dreieck.
Wenn wir möchten, können wir die zu zeichnenden Variablen mit den Argumenten x_vars
, y_vars
oder vars
innerhalb der Funktion pairplot()
angeben.
Beispielsweise,
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df)
Im obigen Code erstellen wir ein einfaches Beispiel für die Funktion pairplot()
. Beachten Sie die verschiedenen Diagramme, die auf der Diagonalen aufgetragen sind.
Wir können das Endergebnis mit einigen Methoden und Parametern optimieren. Der Parameter hue
kann verwendet werden, um die verschiedenen Kategorien in verschiedenen Farben darzustellen. Das Argument palette
kann die dafür verwendeten Farben definieren. Für alle Diagramme wird eine gemeinsame Legende hinzugefügt. Wir können dies im obigen Beispiel hinzufügen, um die beiden Produkte zu unterscheiden.
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", palette="husl")
Wir können auch die Art der Graphen steuern, die auf den oberen-unteren oder Dreiecken und der Diagonale gezeichnet werden sollen. Der Parameter diag_kind
wird verwendet, um die Plots für die Diagonale und der Parameter kind
für den Rest anzugeben. Ihr Wert kann reg
, scatter
, kde
, hist
oder ein anderer Plot sein.
Beispielsweise,
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
df = pd.DataFrame(
{
"Quantity": [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8],
"Price": [9, 10, 15, 16, 13, 14, 15, 18, 11, 12, 14, 15, 16, 17, 18, 19],
"Day": [1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2],
"Product": [
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
"A",
"A",
"A",
"A",
"B",
"B",
"B",
"B",
],
}
)
sns.pairplot(df, hue="Product", diag_kind="hist", kind="scatter")
Um die einzelnen Plots auf der Diagonalen und anderweitig anzupassen, verwenden wir die Parameter plot_kws
und diag_kws
. Wir übergeben die erforderlichen Anpassungen als Dictionary-Schlüssel-Wert-Paare. Die Höhe der einzelnen Plots können wir auch mit dem Parameter height
verändern.
Denken Sie außerdem daran, dass es ein Objekt der Klasse PairGrid
zurückgibt, um die endgültige Figur mit Methoden dieser Klasse anzupassen.
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn