目次
Excelで学ぶやさしい統計学 偏差値ってなに?
こんにちは。伊川(@naonaoke)です。
今回は、統計学を紹介します。
偏差値は、学生時代に、よく使われました。
高校時代の私の偏差値は、63前後です。
よくわからないけど、偏差値70はすごいと教えられ、偏差値70を目指して頑張っていました。
だけど、誰からも偏差値の意味は、教えてもらえませんでした。
今回は、偏差値について説明します。
このブログはこんな人にお勧め
- 偏差値の意味を、なんとなく理解している人
- Excelで統計関数を勉強している人
- 偏差値の計算式がわからない人
このブログを、読み終わるころには・・・・
Excelで偏差値を算出できるようになります。また、偏差値の意味を理解できると、グループの中で、自分の位置がわかります。
現在、自分がどの位置にいるのかを考えることは重要なことなのです。
偏差値
学問的な感じで言います。
偏差値とは、データの標準偏差を一律10にし、平均50からどれだけ離れているかを示す指標です。
偏差値は、データの分布が正規分布に近いことを前提としています。
したがって、分布が正規分布から大きく外れる場合は、偏差値は必ずしも適切な指標とはいえないのです。
偏差値の題材と言えば、テストの点数ですね。
偏差値 | 最上位からの割合 | 1,000人中の順位 |
---|---|---|
80 | 0.0013 | 1.3 |
75 | 0.0062 | 6.2 |
70 | 0.0228 | 22.8 |
65 | 0.0668 | 66.8 |
60 | 0.1587 | 158.7 |
55 | 0.3085 | 308.5 |
50 | 0.5 | 500 |
45 | 0.6915 | 690.1 |
40 | 0.8413 | 840.1 |
35 | 0.9332 | 933.3 |
30 | 0.9772 | 997.2 |
各競走馬の偏差値を求める 作業手順 その1 データベース確認
2020年11月7日 東京12レースを題材にします。
セルB2~セルF17は、スピード指数と言います。
各競走馬が、過去、どれくらいのスピードで走ったのかを表す数値です。
競馬と偏差値がどれくらい、関連があるのかを調べたいと思います。
各競走馬の偏差値を求める 作業手順 その2
偏差値を求める
偏差値を一発で求める関数は存在しません。
- 各データの平均を算出
- 標準偏差を算出
- 偏差値=(各テータ-各データの平均)÷標準偏差×10+50
上の図のように、3段階の手順が必要です。
各競走馬の偏差値を求める 作業手順 その3 標準偏差を求めるSTDEV.P関数
STDEV.P関数(スタンダード・ディストリビューション・ピー)と言います。
この関数は、標準偏差を一発で求めてくれます。
使い方は、SUM関数と同じです。
つまり、バラツキを求めることができます。
標準偏差がないと、偏差値は求めることができません。
これで偏差値は完了です。
レース結果に、偏差値がどのようにかかわるか?
偏差値 作業手順 その1 数字だけでは、わからないので、グラフにする
偏差値には、平均点が異なるレース同士(通常は、英語、数学等のテスト)を比較できるという利点があります。
2番、3番、16番の馬のグラフが目立ちます。
グラフは、数字の羅列を、見やすくする手法の1つですね。
バラツキの少ないレースのみをグラフ化
今度は、2番、8番、16番の馬がよく見えます。
偏差値 作業手順 その2 競馬新聞社発表の数値をクリアしているか?
今回の競馬新聞社が発表した、数値は、85です。
つまり、今回のメンツで、競馬をやったら、85が、基準の数値ということになります。
では、過去、85以上で走ったことのある馬は、何頭いるかを確認します。
2番の馬だけです。
1着 2番
2着 4番
3着 16番
配当は書きませんが、偏差値も、少しは、競馬に使えるということでしょうか?
ここがポイント
学生時代は、偏差値で比べられるのは、嫌でした。しかし、偏差値という漠然として数字しか教えられなかったので、偏差値の正体がわかりませんでした。順を追って勉強していくと、競馬にも応用できるので、楽しいものです。
まとめ
偏差値の意味、計算方法、利用方法を理解できましたでしょうか?
競馬の部分は、洒落で書きました。
しかし、競馬にも応用できると思います。
今回も最後まで読んでいただきありがとうございました。
今回のサンプルファイルは、No187です。
わからない事を延々と考えるのは、無駄です。
- なんで作動かないの?
- もうやだ!VBAなんか嫌い!
- ネットで調べても情報がない!
必ず作動するコードが、ここにあります。