Gestapeltes Histogramm in R erstellen
Wir wissen, dass R als eine mächtige Programmiersprache für Daten und statistische Analysen gilt. Aus diesem Grund ist R mit vielen Funktionen für verschiedene Arten von Diagrammen und Plots ausgestattet. Solche Plots sind sehr nützlich und können gute Einblicke in die Daten liefern.
Ein solches Diagramm, das zur Verfügung steht, ist das Histogramm. Ein Histogramm wird verwendet, um eine Verteilung mit verschiedenen Balken darzustellen. In diesem Lernprogramm wird gezeigt, wie ein einfaches Histogramm mit der Funktion hist()
erstellt wird, und es werden auch gestapelte Histogramme mit mehreren Populationen mit den Funktionen hist()
und ggplot()
behandelt.
Der folgende Code zeigt ein einfaches Histogramm unter Verwendung der Funktion hist()
.
value1 = c(20,20,25,25,40,35,30,20,35)
hist(value1,col = "red")
Viele weitere Anpassungen können dem Graphen hinzugefügt werden, indem verschiedene Parameter verwendet werden, die in der hist()
-Funktion verfügbar sind. Wir können auch ggplot()
für den gleichen Zweck verwenden.
Wenn wir mit gestapelten Histogrammen arbeiten, haben wir entweder zwei oder mehr Populationen auf demselben Graphen dargestellt. Wir können dies auf zwei Arten tun, entweder wir haben zwei verschiedene Variablen, die auf demselben Graphen geplottet werden sollen, oder wir haben eine Variable mit verschiedenen Kategorien.
Für den ersten Ansatz werden wir die Funktion hist()
verwenden. Der folgende Codeschnipsel erklärt wie:
value1 = c(20,20,25,25,40,35,30,20,35)
value2 = c(15,25,30,25,25,20,40,40,40)
hist(value1,col = "red")
hist(value3, add = T, col = "blue")
Bei dieser Methode haben wir ein einfaches Histogramm erstellt und den zweiten Graphen mit dem Parameter add
zum ersten hinzugefügt.
Für den zweiten Ansatz werden wir einen eingebauten Beispieldatensatz namens iris
verwenden. Er enthält die Details von 3 Pflanzenarten. Wir werden die Spalte Sepal.Width
mit der Funktion ggplot()
darstellen. Wir sollten die Bibliothek ggplot2
laden, um die Funktion ggplot()
zu verwenden.
library(ggplot2)
ggplot(data=iris, aes(x=Sepal.Width,fill = Species)) + geom_histogram()
Das geom_histogram
spezifiziert den Plot-Typ als ein Histogramm. In der Funktion ggplot()
geben wir die Variable an, die geplottet werden soll, und wir färben das Histogramm basierend auf der kategorischen Variable Species
.
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn