概要
dplyr
パッケージに含まれるsummarise()
は、行の集計を行う関数です。summarise()
にはスコープ付き関数とヘルパー関数があります。また、ショートハンド関数を持ちます。
関連ページ
関数
summarise(.data, ...)
summarize(.data, ...) # Alias
引数 | 指定 | 説明 |
---|---|---|
.data | 必須 | データフレーム |
… | 必須 | 集計する列名を指定する集計後の列名 = 関数 の形式で記述する |
使い方
解説用データフレーム
df <- tibble(
x1 = c('A', 'A', 'B', 'B', 'B'),
w1 = c(1, 2, 3, 4, 5)
)
> df
# A tibble: 5 x 2
x1 w1
<chr> <dbl>
1 A 1
2 A 2
3 B 3
4 B 4
5 B 5
1.列の集計
# 列x1でグループ化し、列w1の合計を取得する
group_by(df, x1) %>%
summarise(y1 = sum(w1))
# A tibble: 2 x 2
x1 y1
<chr> <dbl>
1 A 3
2 B 12
summarise()
はヘルパー関数を用いることで、より複雑な処理が可能になります。
詳しくは、各ヘルパー関数を参照してください。