概要
dplyr
パッケージに含まれるsummarise()
は、行の集計を行う関数です。summarise()
にはスコープ付き関数とヘルパー関数があります。また、ショートハンド関数を持ちます。
関連ページ
関数
1 2 | summarise (.data, ...) summarize (.data, ...) # Alias |
引数 | 指定 | 説明 |
---|---|---|
.data | 必須 | データフレーム |
… | 必須 | 集計する列名を指定する集計後の列名 = 関数 の形式で記述する |
使い方
解説用データフレーム
1 2 3 4 | df <- tibble ( x1 = c ( 'A' , 'A' , 'B' , 'B' , 'B' ), w1 = c (1, 2, 3, 4, 5) ) |
> df # A tibble: 5 x 2 x1 w1 <chr> <dbl> 1 A 1 2 A 2 3 B 3 4 B 4 5 B 5 |
1.列の集計
1 2 3 | # 列x1でグループ化し、列w1の合計を取得する group_by (df, x1) %>% summarise (y1 = sum (w1)) |
# A tibble: 2 x 2 x1 y1 <chr> <dbl> 1 A 3 2 B 12 |
summarise()
はヘルパー関数を用いることで、より複雑な処理が可能になります。
詳しくは、各ヘルパー関数を参照してください。