Anzahl der Zeilen in R zählen

Manav Narula 30 Januar 2023
  1. Verwenden Sie die Funktion data.frame(table()), um die Anzahl der Zeilen in R zu zählen
  2. Verwenden Sie die Funktion count(), um die Anzahl der Zeilen in R zu zählen
  3. Verwendung der Funktion ddply() zum Zählen der Anzahl von Zeilen in R
Anzahl der Zeilen in R zählen

In realen Beispielen treffen wir auf große Datensätze, die Hunderte und Tausende von Zeilen und Spalten enthalten. Um mit solch großen Datenmengen arbeiten zu können, müssen wir mit den Zeilen, Spalten und Datentypen vertraut sein.

In diesem Tutorial wird vorgestellt, wie man in R die Anzahl der Zeilen nach Gruppen zählt.

Verwenden Sie die Funktion data.frame(table()), um die Anzahl der Zeilen in R zu zählen

Die Funktion data.frame(table()) erzeugt eine Tabelle mit der Anzahl der verschiedenen Faktorwerte. Sie zählt die gesamten eindeutigen Zeilen einer Spalte. Wir können die gewünschte Spalte des DataFrame einfach an die Funktion übergeben. Sehen Sie sich den folgenden Codeschnipsel an.

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
data.frame(table(df$Month))

Ausgabe:

 Var1 Freq
1  Jan    2
2 July    1
3  May    1

Verwenden Sie die Funktion count(), um die Anzahl der Zeilen in R zu zählen

Die Bibliothek plyr in R führt grundlegende Aufgaben der Datenmanipulation aus, wie z. B. das Aufteilen von Daten, das Ausführen einer Funktion und das anschließende Zusammenführen der Daten. Sie hat eine Funktion count(), die die Häufigkeit der eindeutigen Zeilen eines DataFrame zurückgibt. Wir müssen ihr den DataFrame und den Spaltennamen als Parameter übergeben, wie unten gezeigt:

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
count(df, "Month")

Ausgabe:

  Month freq
1   Jan    2
2  July    1
3   May    1

Verwendung der Funktion ddply() zum Zählen der Anzahl von Zeilen in R

Eine weitere interessante Funktion, die in der plyr-Bibliothek zur Verfügung steht, ist die ddply()-Funktion. Sie teilt die Daten in eine Teilmenge auf, gibt eine Funktion an, die auf die Daten angewendet werden soll, und kombiniert das Ergebnis. Im folgenden Beispiel übergeben wir den DataFrame und den Spaltennamen an die Funktion und die Funktion nrow als Parameter:

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
ddply(df, .(Month), nrow)

Ausgabe:

  Month V1
1   Jan  2
2  July  1
3   May  1
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

Verwandter Artikel - R Data Frame