R の行数をカウント
Manav Narula
2023年1月30日
実際の例では、何百、何千という行や列を含む大規模なデータセットに遭遇することがあります。このような大規模なデータの塊を扱うためには、行、列、データ型に精通している必要があります。
このチュートリアルでは、R でグループごとに行数を数える方法を紹介します。
R で行数を数えるには data.frame(table())
関数を使用する
関数 data.frame(table())
は、異なる因子の値をカウントした表を作成します。これは列のユニークな行の合計をカウントします。この関数には DataFrame の必要なカラムを簡単に渡すことができます。以下のコードスニペットを参照してください。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
data.frame(table(df$Month))
出力:
Var1 Freq
1 Jan 2
2 July 1
3 May 1
関数 count()
を用いて R の行数をカウントする
R の plyr
ライブラリは、データを分割したり、関数を実行したり、結合したりといった基本的なデータ操作を行う。このライブラリには関数 count()
があり、DataFrame のユニークな行の頻度を返します。以下に示すように、パラメータとして DataFrame とカラム名を渡さなければならません。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
library(plyr)
count(df, "Month")
出力:
Month freq
1 Jan 2
2 July 1
3 May 1
関数 ddply()
を用いて R の行数をカウントする
plyr
ライブラリで提供されているもう一つの興味深い関数は ddply()
関数です。これはデータをサブセットに分割し、データに適用する関数を指定し、その結果を結合します。以下の例では、関数に DataFrame とカラム名を、パラメータとして nrow
関数を渡します。
df <- data.frame(Name = c("Jack","Jay","Mark","Sam"),
Month = c("Jan","Jan","May","July"),
Age = c(12,10,15,13))
library(plyr)
ddply(df, .(Month), nrow)
出力:
Month V1
1 Jan 2
2 July 1
3 May 1
著者: Manav Narula
Manav is a IT Professional who has a lot of experience as a core developer in many live projects. He is an avid learner who enjoys learning new things and sharing his findings whenever possible.
LinkedIn