计算 R 中的行数

Manav Narula 2023年1月30日
  1. 在 R 中使用 data.frame(table()) 函数计算行数
  2. 使用 count() 函数计算 R 中的行数
  3. 使用 ddply() 函数来计算 R 中的行数
计算 R 中的行数

在现实生活中的例子中,我们会遇到包含成百上千行和列的大型数据集。为了处理这样大块的数据,我们需要熟悉行、列和数据类型。

本教程将介绍如何在 R 中按组计算行数。

在 R 中使用 data.frame(table()) 函数计算行数

data.frame(table()) 函数创建了一个包含不同因子值计数的表格。它计算一列的总唯一行数。我们可以很容易地将 DataFrame 所需的列传递给函数。下面的代码片段将解释具体如何来做。

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
data.frame(table(df$Month))

输出:

 Var1 Freq
1  Jan    2
2 July    1
3  May    1

使用 count() 函数计算 R 中的行数

R 中的 plyr 库执行基本的数据处理任务,如拆分数据、执行一些函数,然后再合并。它有一个函数 count(),可以返回一个 DataFrame 的唯一行的频率。我们必须传递 DataFrame 和列名作为其参数,如下所示。

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
count(df, "Month")

输出:

  Month freq
1   Jan    2
2  July    1
3   May    1

使用 ddply() 函数来计算 R 中的行数

plyr 库中提供的另一个有趣的函数是 ddply() 函数。它将数据分割成一个子集,指定一些要应用于数据的函数,并将结果合并。在下面的例子中,我们将把 DataFrame 和列名传给函数和 nrow 函数作为参数。

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
ddply(df, .(Month), nrow)

输出:

  Month V1
1   Jan  2
2  July  1
3   May  1
作者: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

相关文章 - R Data Frame