YEAR

2023年

  • 2023年1月29日

『データとは何か?』に2分で答える

解説の目的 統計学入門 Step.2の前半では結果に対する理解を深めていき、後半で本質に対する理解を深めていきましょう。 データとは何か データとは 統計学入門 Step.1では『どうして統計を学ぶの?』と題して、本質と結果について解説してきました。この時、データ(値)を以下の通り定義しましょう。 […]

  • 2023年1月30日

『推定量とは何か?』に2分で答える

推定量とは何か 推定量とは 『確率分布とは何か?』では『確率変数の特徴』を確率分布が持つ母数と定義しました。この時、推定量を以下の通り定義しましょう。 定義 『標本から推定した母数』 推定方法 「なぜ、標本から母数が推定できるのか?」という疑問に答えるためには、大数の法則や中心極限定理といった小難し […]

  • 2023年1月29日

『事象とは何か?』に2分で答える

事象とは何か 事象とは 『どうして統計を学ぶの?』では『結果に惑わされず本質を考える学問』を頻度統計学と呼びました。この時、事象を以下の通り定義しましょう。 定義 『結果として起こり得る出来事』 私たちが目にする結果は、事象の中から選ばれた一つの出来事に過ぎません。大切なのは結果に惑わされず本質を考 […]

  • 2023年1月29日

『どうして統計を学ぶの?』を2分で振り返る

Step.1 まとめ 世の中のあらゆる出来事は全て結果から成り立っています。私たちが見たり聞いたりして観測できる出来事は全て結果になります。 この時、結果はランダムによって決まることを解説してきました。そのため、結果だけを見て物事を判断するのではなく、本質を考えることが重要になります。 『目の前の結 […]

  • 2023年1月29日

『母集団とは何か?』に2分で答える

母集団とは何か 母集団とは 『標本とは何か?』では『観測値の数量データ』を標本と定義しました。この時、母集団を以下の通り定義しましょう。 母集団 『理論値の数量データ』 母集団の考え方 母集団を『理論値の観測データ』と定義しましたが『数量データを余すことなく集めたデータ』と定義することもできます。こ […]

  • 2023年1月30日

『どうして統計を使うの?』を2分で振り返る

Step.2 まとめ 標本は『ランダムの影響を受けた後の数量データ』になります。ここから『ランダムの影響を受ける前の数量データ』を推定する方法を解説してきました。 キーワード 余談 Step.2を読んで「データを集めるのは簡単だけど、データを適切に使うのは結構難しい」ということに気が付いた方も多いと […]

  • 2023年12月18日

行の複製

概要 tidyrパッケージに含まれるuncount()は、任意の行を複製する関数です。逆操作を行うcount()が存在します。 関連ページ 関数 引数 指定 説明 data 必須 データフレーム weights 必須 複製する行数を列名または正の値で指定する .remove 任意 weightsで指 […]

  • 2023年12月18日

行の補完

概要 tidyrパッケージに含まれるcomplete()は、指定した列を補完する関数です。 関数 引数 指定 説明 data 必須 データフレーム ... 必須 補完したい列を指定する fill 任意 補完した列の初期値を指定する 使い方 解説用データフレーム 1.型別の補完 1-1.Factor型 […]

  • 2023年12月18日

欠損値の置換

概要 tidyrパッケージに含まれるreplace_na()は、指定した列の欠損値を置換する関数です。 関連ページ 関数 引数 指定 説明 data 必須 データフレーム replace 必須 欠損値を置換する列を 列名 = 代替値 のList型で指定する 使い方 解説用データフレーム 1.欠損値の […]

  • 2023年12月18日

tibble型に変換

概要 data.frame型をtibble型に変換します。 関数 引数 初期値 受付型 説明 data ー data.frame データフレーム rownames NULL chr rownamesの値を格納する任意の列名を指定 .rows NULL num 変換後の行数を指定行数が一致しない場合は […]