概要
dplyr
パッケージに含まれるn(), n_distinct()
は、行数を取得する関数です。併せてbase
パッケージのsum()
も解説します。主にsummarise()
と併せて使用します。
関連ページ
関数
n()
n_distinct(..., na.rm = FALSE)
引数 | 指定 | 説明 |
---|---|---|
… | 必須 | n_distinct() で使用する重複チェックする列を指定する |
na.rm | 必須 | n_distinct() で使用するNAを集計に含める場合はTRUEを指定する |
使い方
解説用データフレーム
df <- tibble(
x1 = c(1, 1, 2, 3, 5)
)
> df
# A tibble: 5 x 1
x1
<dbl>
1 1
2 1
3 2
4 3
5 5
1.行数を取得する
1-1.行数を取得する
# 行数を取得する
summarise(df, y1 = n())
# A tibble: 1 x 1
y1
<dbl>
1 5
1-2.重複なしの行数を取得する
# 重複なしの行数を取得する
summarise(df, y1 = n_distinct(x1))
# A tibble: 1 x 1
y1
<dbl>
1 4
1-3.重み付きの行数(合計)を取得する
sum()
はR言語のベース関数になります
# 重み付きの行数を取得する
summarise(df, y1 = sum(x1))
# A tibble: 1 x 1
y1
<dbl>
1 12