行数

概要

dplyrパッケージに含まれるn(), n_distinct()は、行数を取得する関数です。併せてbaseパッケージのsum()も解説します。主にsummarise()と併せて使用します。

関連ページ

関数

n()
n_distinct(..., na.rm = FALSE)
引数指定説明
必須n_distinct()で使用する
重複チェックする列を指定する
na.rm必須n_distinct()で使用する
NAを集計に含める場合はTRUEを指定する

使い方

解説用データフレーム

df <- tibble(
  x1 = c(1, 1, 2, 3, 5)
)
> df
# A tibble: 5 x 1
     x1
  <dbl>
1     1
2     1
3     2
4     3
5     5

1.行数を取得する

1-1.行数を取得する

# 行数を取得する
summarise(df, y1 = n())
# A tibble: 1 x 1
     y1
  <dbl>
1     5

1-2.重複なしの行数を取得する

# 重複なしの行数を取得する
summarise(df, y1 = n_distinct(x1))
# A tibble: 1 x 1
     y1
  <dbl>
1     4

1-3.重み付きの行数(合計)を取得する

sum()はR言語のベース関数になります

# 重み付きの行数を取得する
summarise(df, y1 = sum(x1))
# A tibble: 1 x 1
     y1
  <dbl>
1    12
Sponsored Link