目次
不偏分散と標本分散
こんにちは。伊川(@naonaoke)です。
今回も、統計学を紹介します。
不偏分散と標本分散について説明します。
統計学は、言葉が、難しいですね。
この不変分散と標本分散には、バラツキという概念も少しだけ絡んできます。
このようなことは、自分で計算すると、面倒なのですが、計算は、Excelが行ってくれます。
言葉の意味を押さえておけば大丈夫です。
学問的な言葉でなくても、自分なりにかみ砕いて記憶してください。
このブログはこんな人にお勧め
- Excelで統計学を勉強したいと思っている人
- 不変分散と標本分散をExcelで実行したい人
- Excelで統計関数を勉強している人
このブログを、読み終わるころには・・・・
不変分散と標本分散が理解できます。VAR.S(バリアンス・エス)関数と、VAR.P (バリアンス・ピー)関数を使えるようになります。Excelの統計関数は、名前は難しいですが、使い方は、SUM関数と同じです。難しくないので、みなさんのスキルにして下さい。
どれくらいの人がダウンロードしたのか?
2020年10月24日時点で、私のYouTubeのチャネル登録数は。約12,400人です。
また、サンプルファイルの総ダウンロード数は、約11,400ダウンロードです。
ほぼ、1人が、1回、ダウンロードしている計算になります。
しかし、こんな推測は全く役に立ちません。
なぜならば、大雑把すぎるからです。
この大雑把すぎる概念を、不変分散と標本分散で推測をしていきます。
不偏分散とは?
全体のダウンロード数から、どれくらいの人がダウンロードをしたのかを推定するものになります。
統計学的に言うと、サンプルから、母集団の値を推定するために使います。
上の図で言うなら、赤の大きな円が、母集団とします。
青の円の中にいる人が、ダウンロードをした人になります。
この青の円の中にいる人から、赤の大きな円の中にいる人を推定するために使います。
これを、不変分散といいます。
用語は、難しいですが、理解すると、そうでもないと思います。
標本分散とは?
標本分散とは、すでに、下図のように、母集団が決まっています。
つまり、データが母集団全体であるときの分散です。
わかりやすい例では、母集団が学校で、統計を取るのは、数学の試験です。
数学の試験で、平均点から、どれくらいの散らばるのか?
統計学的に言うと、母集団が、データ全体そのものであるときに使います。
不偏分散の求め方 作業手順 その1 VAR.S関数を使う
ACCESSのダウンロード数は、2308ダウンロードです。
このダウンロード数から、どれだけの母集団が存在するのかを、VAR.S関数で求めると、519人という事がわかりました。
また、Excelのダウンロード数は、1339ダウンロードです。
同じく、Excelのダウンロード数から、どれだけの母集団が存在するかを、VAR.S関数で求めると、634人という事がわかりました。
Excelの方が、ACCESSより、母集団が大きいことがわかりました。
標本分散の求め方 作業手順 その1 VAR.P関数を使う
詳しい数字の説明は、不偏分散と同じなので、割愛します。
また関数は、VAR.S関数と全く同じです。
サンプルから母集団を求める⇒不変分散
母集団がデータ全体そのもの⇒標本分散(学校の定期試験を思い出してください)
ここがポイント
統計学は、いわゆる確率です。今まで私は、統計と確率は、異なる分野の学問と思っていました。異なるのかもしれませんが、考え方は同じです。
一定の現象が発生しときに、何かを予測する学問だと思っています。
そうなると、競馬と同様に、親近感が沸いてきた今日この頃であります。
まとめ
興味が沸いてきたついでに、【競馬 統計学】で検索すると、意外とヒットしました。
同じような考え方を持っている人は存在するという事が、うれしかったです。
競馬と統計は、ゆくゆく紹介をしたいと思います。
今回のサンプルファイルは、No181です。
わからない事を延々と考えるのは、無駄です。
- なんで作動かないの?
- もうやだ!VBAなんか嫌い!
- ネットで調べても情報がない!
必ず作動するコードが、ここにあります。