MONTH

2023年5月

  • 2023年12月18日

行列の一意化

概要 dplyrパッケージに含まれるdistinct()は、指定した列の値が重複する行を削除する関数です。 引数 指定 説明 .data 必須 テーブルを指定する … 任意 重複を削除する列を指定する未指定の場合は全ての列が対象になります .keep_all 任意 指定外の列をテーブルに […]

  • 2023年12月18日

行列の一意化(スコープ付き関数)

概要 dplyrパッケージに含まれるdistinct()のスコープ付き関数は、行列の一意化を簡潔なコードで記述できる関数です。 関連ページ 関数 引数 指定 説明 .tbl 必須 データフレーム .funs 任意 値を加工する関数を指定する .vars 必須 mutate_at()で使用する引数対象 […]

  • 2023年12月18日

累計

概要 dplyrパッケージに含まれるcummean(), cumany(), cumall()とbase関数のcumsum(), cumprod(), cummin(), cummax()は、ベクトルの値を累計する関数です。主にmutate()と併せて使用します。 関連ページ 関数 引数 指定 説明 […]

  • 2023年12月18日

欠損値

概要 dplyrパッケージに含まれるcoalesce(), na_if()は、欠損値を操作する関数です。 関連ページ 関数 引数 指定 説明 x 必須 置換する列名を指定する y 必須 参照する 列名または値 を指定する 使い方 解説用データフレーム 1.欠損値を置換する 1-1.列指定 1-2.値 […]

  • 2023年12月18日

条件分岐

概要 dplyrパッケージに含まれるif_else(), case_when(), recode(), recode_factor()は、条件分岐による値を取得する関数です。主にmutate()と併せて使用します。 関連ページ 関数 引数 指定 説明 condition 必須 if_else()で使 […]

  • 2023年12月18日

行の抽出

概要 dplyrパッケージに含まれるsample_n(), sample_frac()は、ランダムサンプリングを行う関数です。 引数 指定 説明 tbl 必須 テーブルを指定する size 必須 抽出する件数(行数または割合)を指定する replace 任意 復元抽出か非復元抽出を指定するデフォルト […]

  • 2023年12月18日

行の取得(降順)

概要 dplyrパッケージに含まれるtop_n(), top_frac()は、指定した行数を指定した列の降順で取得する関数です。 引数 指定 説明 x 必須 テーブルを指定する n 必須 取得する行数(件数または割合)を指定する wt 必須 降順に並べ替える列を指定する 関連ページ 具体例

  • 2023年12月18日

行の取得(欠損値の除外)

概要 tidyrパッケージに含まれるdrop_na()は、欠損値を持つ行を除外する関数です。 関連ページ 関数 引数 指定 説明 data 必須 データフレーム … 任意 欠損値の有無を確認する行を指定する未指定の場合は全ての列が対象になります 使い方 解説用データフレーム 1.欠損値の […]

  • 2023年12月18日

整然化

概要 tidyrパッケージに含まれるpivot_longer()は、データフレームの形状を「広い」形式から「長い」形式に変換する関数です。 関連ページ 関数 引数 指定 説明 data 必須 データフレーム cols 必須 行に変換したい列を指定するセレクトヘルパー関数で指定することが可能です na […]

  • 2023年12月18日

非整然化

概要 tidyrパッケージに含まれるpivot_wider()は、データフレームの形状を「長い」形式から「広い」形式に変換する関数です。 関連ページ 関数 引数 指定 説明 data 必須 データフレーム id_cols 任意 keyになる列を指定する names_from 必須 変換後の列の列名に […]