CATEGORY

統計

統計学入門

統計を学びたい方に向けた解説記事をまとめています。
数式や専門用語を極力廃止して『統計学とは何か?』という疑問に答えながら、統計学の使い方やデータに騙されない手法を公開していきます。

目安:統計検定 3級

初級者の統計学

統計を使いたい方に向けた解説記事をまとめています。
統計学の基礎をしっかりと理解しながら、なんとなく使っているレベルから脱却することを目的とした記事を公開していきます。

目安:統計検定 2級 ~ 準1級

中級者の統計学

統計を日常的に使う方に向けた解説記事をまとめています。
基本的に全ての項目で証明を行い、必要に応じて辞書のように扱える記事を公開しています。

目安:統計検定 準1級 ~ 1級

コラム

気になった出来事や思い付いた内容を記事にまとめて公開しています。

  • 2023年2月19日

ポアソン分布

ポアソン分布とは ある期間に平均λ回発生する事象があります。この時、発生した事象の回数xを表した離散型の確率分布を表します。 具体的な事象の回数 確率分布 \begin{align}X \sim Po(\lambda)\end{align} ポアソン分布の確率変数と母数は以下の意味を持ちます。なお、 […]

  • 2023年2月19日

二項分布

二項分布とは 確率pで成功するベルヌーイ試行をn回繰り返します。この時、成功した事象の回数xを表した離散型の確率分布になります。 具体的な事象の回数 確率分布 \begin{align}X \sim B(n, p)\end{align} 二項分布の確率変数と母数は以下の意味を持ちます。なお、ここでは […]

  • 2023年2月19日

幾何分布

幾何分布とは 確率pで成功するベルヌーイ試行を繰り返します。この時、成功するまでの試行回数x(または失敗回数y)を表した離散型の確率分布になります。 注意点 幾何分布には以下の2つの定義が存在します。幾何分布がどちらの意味で利用されているか常に注意を払ってください。 事象の具体例 確率分布 \beg […]

  • 2023年1月26日

相対的リスクとオッズ比

リスクとオッズ リスクとオッズは、それぞれ『全体に占める割合』と『成功と失敗の比率』を表しています。例えば、総勢100名にアンケートを行い、60名がYES、40名がNOと答えたとしましょう。 相対的リスクとオッズ比 Point 調査対象 コントロール群 合計 状態A \(T_A\) \(C_A\) […]

  • 2023年2月19日

正規分布

正規分布 確率分布 \(X \sim N(\mu, \sigma^2)\) 母数 \(\mu\) \((\in \mathbb{R})\)\(\sigma^2\) \((\geq 0)\) 台 \(\mathbb{R}\) \((-\infty < X < \infty)\) 確率密度関 […]

  • 2023年2月19日

ベルヌーイ分布

ベルヌーイ分布とは 成功(1)と失敗(0)のどちらかの値を取る離散型の確率分布になります。成功確率をpで表し、ベルヌーイ分布に従う試行をベルヌーイ試行と呼びます。 具体的な事象 確率分布 \begin{align}X \sim Be(p)\end{align} ベルヌーイ分布の確率変数と母数は以下の […]

  • 2023年2月4日

ブラウン運動

ブラウン運動とは ブラウン運動とは、連続でランダムに動く物体を表現する確率過程モデルになります。 具体例 グラフ 具体例:3人の親父の千鳥足 定義 \(t(0 \leq t)\)を基準からの経過時刻、\(t=0\)を基準時刻と置きます。この時、\(t\)だけ経過した時の現在位置を\(B_t\)と表し […]

  • 2023年1月30日

『確率分布とは何か?』に2分で答える

確率分布とは何か 確率分布とは 『確率変数とは何か?』では『データの本質』を確率変数と定義しました。この時、確率分布を以下の通り定義しましょう。 定義 『確率変数の種類と特徴』 正確には確率分布自体を種類、確率分布が持つ母数を特徴と表します。 具体例 全ての確率変数は『確率分布 × 母数』の組み合わ […]

  • 2023年1月26日

平均

平均とは 観測した値(または取り得る値)の重心を『平均』と呼びます。平均は数量データの代表値(統計量)の一つです。 標本の平均 標本の平均を『標本平均』と呼びます。 標本平均は『観測した値』を『観測した個数』で割って計算します。なお、観測した値を\(x_i\)、観測した個数を\(n\)と表します。 […]

  • 2023年1月26日

分散

前提知識 分散とは 数量データの代表値(統計量)の一つです。観測した値(または取り得る値)のばらつき具合を表す値になります。 補足 標本の分散 標本の分散を『不偏分散』と呼びます。 不偏分散は『観測した値と標本平均との差の二乗和』を標本サイズ -1 で割って計算します。なお、標本サイズを\(n\)、 […]