解説の目的
統計学入門 Step.2の前半では結果に対する理解を深めていき、後半で本質に対する理解を深めていきましょう。
データとは何か
データとは
統計学入門 Step.1では『どうして統計を学ぶの?』と題して、本質と結果について解説してきました。この時、データ(値)を以下の通り定義しましょう。
定義
『収集した結果』
統計学とデータ
統計学は理論だけでは成り立たず、データを活用して初めて効果を発揮します。
昨今では多くの企業でデータの重要性が見直されています。中でもデータに基づいて判断を下すことを『データドリブン』と呼びます。
具体例
- 視聴率の高い番組を再放送する
- 過去の実績をもとに見積もりを作成する
- 得意な作業や資格を加味してシフトを組む
これまでは経験や勘による作業の裏付けとしてデータが使われてきました。
最近では、データに従って自動的に判断を下す仕組みづくりが主体となってきています。
ランダムの影響
サイコロを振った時の値は毎回ランダムです。これと同じように、いかなるデータも常にランダムの影響を受けて変化します。
これに対して私たちが知りたいのは本質であり、ランダムの影響を受ける前の状態です。
統計学入門 Step.2では、頻度統計学を用いて『ランダムの影響を受ける前のデータ』を推定する流れについて解説していきます。