R の行数をカウント

Manav Narula 2023年1月30日
  1. R で行数を数えるには data.frame(table()) 関数を使用する
  2. 関数 count() を用いて R の行数をカウントする
  3. 関数 ddply() を用いて R の行数をカウントする
R の行数をカウント

実際の例では、何百、何千という行や列を含む大規模なデータセットに遭遇することがあります。このような大規模なデータの塊を扱うためには、行、列、データ型に精通している必要があります。

このチュートリアルでは、R でグループごとに行数を数える方法を紹介します。

R で行数を数えるには data.frame(table()) 関数を使用する

関数 data.frame(table()) は、異なる因子の値をカウントした表を作成します。これは列のユニークな行の合計をカウントします。この関数には DataFrame の必要なカラムを簡単に渡すことができます。以下のコードスニペットを参照してください。

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
data.frame(table(df$Month))

出力:

 Var1 Freq
1  Jan    2
2 July    1
3  May    1

関数 count() を用いて R の行数をカウントする

R の plyr ライブラリは、データを分割したり、関数を実行したり、結合したりといった基本的なデータ操作を行う。このライブラリには関数 count() があり、DataFrame のユニークな行の頻度を返します。以下に示すように、パラメータとして DataFrame とカラム名を渡さなければならません。

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
count(df, "Month")

出力:

  Month freq
1   Jan    2
2  July    1
3   May    1

関数 ddply() を用いて R の行数をカウントする

plyr ライブラリで提供されているもう一つの興味深い関数は ddply() 関数です。これはデータをサブセットに分割し、データに適用する関数を指定し、その結果を結合します。以下の例では、関数に DataFrame とカラム名を、パラメータとして nrow 関数を渡します。

df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
                  Month = c("Jan","Jan","May","July"),
                  Age = c(12,10,15,13))
library(plyr)
ddply(df, .(Month), nrow)

出力:

  Month V1
1   Jan  2
2  July  1
3   May  1
著者: Manav Narula
Manav Narula avatar Manav Narula avatar

Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.

LinkedIn

関連記事 - R Data Frame