CATEGORY

分析業務

  • 2023年12月18日

列の結合(フィルタリング)

概要 dplyrパッケージに含まれるsemi_join(), anti_join()は、フィルタリングに特化した列の結合を行う関数です。同じ列の結合を行う関数にはinner_join(), left_join(), right_join(), full_join(), nest_join()が存在し […]

  • 2023年12月18日

列の結合(ネスト化)

概要 dplyrパッケージに含まれるnest_join()は、フィルタリングに特化した列の結合を行う関数です。同じ列の結合を行う関数にはinner_join(), left_join(), right_join(), full_join(), semi_join(), anti_join()が存在し […]

  • 2023年12月18日

行列の一意化

概要 dplyrパッケージに含まれるdistinct()は、指定した列の値が重複する行を削除する関数です。 引数 指定 説明 .data 必須 テーブルを指定する … 任意 重複を削除する列を指定する未指定の場合は全ての列が対象になります .keep_all 任意 指定外の列をテーブルに […]

  • 2023年12月18日

行列の一意化(スコープ付き関数)

概要 dplyrパッケージに含まれるdistinct()のスコープ付き関数は、行列の一意化を簡潔なコードで記述できる関数です。 関連ページ 関数 引数 指定 説明 .tbl 必須 データフレーム .funs 任意 値を加工する関数を指定する .vars 必須 mutate_at()で使用する引数対象 […]

  • 2023年12月18日

累計

概要 dplyrパッケージに含まれるcummean(), cumany(), cumall()とbase関数のcumsum(), cumprod(), cummin(), cummax()は、ベクトルの値を累計する関数です。主にmutate()と併せて使用します。 関連ページ 関数 引数 指定 説明 […]

  • 2023年12月18日

欠損値

概要 dplyrパッケージに含まれるcoalesce(), na_if()は、欠損値を操作する関数です。 関連ページ 関数 引数 指定 説明 x 必須 置換する列名を指定する y 必須 参照する 列名または値 を指定する 使い方 解説用データフレーム 1.欠損値を置換する 1-1.列指定 1-2.値 […]

  • 2023年12月18日

条件分岐

概要 dplyrパッケージに含まれるif_else(), case_when(), recode(), recode_factor()は、条件分岐による値を取得する関数です。主にmutate()と併せて使用します。 関連ページ 関数 引数 指定 説明 condition 必須 if_else()で使 […]

  • 2023年12月18日

行の抽出

概要 dplyrパッケージに含まれるsample_n(), sample_frac()は、ランダムサンプリングを行う関数です。 引数 指定 説明 tbl 必須 テーブルを指定する size 必須 抽出する件数(行数または割合)を指定する replace 任意 復元抽出か非復元抽出を指定するデフォルト […]

  • 2023年12月18日

行の取得(降順)

概要 dplyrパッケージに含まれるtop_n(), top_frac()は、指定した行数を指定した列の降順で取得する関数です。 引数 指定 説明 x 必須 テーブルを指定する n 必須 取得する行数(件数または割合)を指定する wt 必須 降順に並べ替える列を指定する 関連ページ 具体例

  • 2023年12月18日

行の取得(欠損値の除外)

概要 tidyrパッケージに含まれるdrop_na()は、欠損値を持つ行を除外する関数です。 関連ページ 関数 引数 指定 説明 data 必須 データフレーム … 任意 欠損値の有無を確認する行を指定する未指定の場合は全ての列が対象になります 使い方 解説用データフレーム 1.欠損値の […]