目次
Excelで学ぶやさしい統計学 歪度 尖度とは?
こんにちは。伊川(@naonaoke)です。
今回も、Excelで学ぶやさしい統計学の紹介です。
統計学は、様々な公式があり、シグマ(Σ)、ルート(√)など、難しい記号がたくさん出てきます。
しかし、Excelは、そのような記号を使わなくでも、Excelの統計関数が計算してくれます。
統計学で用いる、用語、どの場面でどの統計を使うのかという事がわかれば、計算はExcelがやってくれます。
今回は、歪度、尖度を紹介します。
また、正規分布についても、少し解説してますので、最後まで読んでいただけたら幸いです。
このブログはこんな人にお勧め
- Excelで統計学を勉強している人
- Excelの統計関数を勉強している人
- データ分析の方法を知りたい人
このブログを、読み終わるころには・・・・
歪度を算出するSKEW関数が使えるようになります。
尖度を算出するKURT関数が使えるようになります。
歪度、尖度の意味を理解できます。
歪度 尖度
これは、口で説明するよりも、グラフを見た方が早いです、
歪度は、平均の偏りです。
尖度は、平均値に集中しているのかを判定できます。
特に、歪度が、0の時は、正規分布といいます。
今回紹介する関数は、グラフを描かなくても、一瞬ので、歪度、尖度を判定してくれる関数です。
歪度 尖度 作業手順 その1 データべース確認
ACCESSとExcelのダウンロード数で、歪度、尖度を算出します。
歪度 尖度 作業手順 その2 ACCESSとExcelの歪度
ACCESSと、Excelを比べると、Excelの歪度が、限りなく0に近づいています。
Excelの方が、正規分布に近いことを示しています。
歪度 尖度 作業手順 その3 ACCESSとExcelの尖度
ACCESSと、Excelの尖度はマイナスの値になっていますので、尖らず、なだらかになっているのがわかります。
つまり、平均値から、散らばっているという事になります。
正規分布とは
なぜ、このような計算をするのか?という疑問が出てきそうなので、正規分布について解説します。
正規分布とは統計・統計学を理解する上で一番大切な確率分布です。
正規分布 は、英語でnormal distribution(ノーマル・ディストリビューション)からもわかる通り、”normal”な、通常の確率分布です。
名前の所以は、自然界や人間の行動・性質など様々な現象に対して、よく当てはまるところから来ています。
そして、そのグラフは、下図のように左右対称な曲線になります。
これも、言ってしまえば確率なのです。
中学生のとき、サイコロ振って、偶数が出る確率は、50%です。
この確率と同じ考え方です。
この確率は、二項分布といいます。
正規分布の計算式は、非常に難しい式で、出来ています。
もちろん、知っておいて損はないですが、実務で、正規分布の公式を使うことは、ほとんどないと思います。
正規分布 その1 正規分布をネットで調べると?
正規分布はガウス分布と呼ばれることもしばしばあります。
これは18世紀から19世紀に渡って活躍した数学者C.F.ガウスに由来します。
ガウスは天文学の観測データの研究から測定誤差がある法則に従うことを導き出し、誤差理論を確立しました。
これが正規分布の基礎となったと言われています。
正規分布 その2 正規分布の性質
平均値を中心にして左右対称である。(直線x=μに関して対称)
x軸が漸近線である。
分散(標準偏差)が大きくなると、曲線の山は低くなり、左右に広がって平らになる。分散(標準偏差)が小さくなると、山は高くなり、よりとんがった形になる。
このグラフを見るとわかるのですが、σ(シグマ)は無視してください。
平均から、左右対称に、3ずれた場合の確率が、99.7%です。
例えば、皆さんが、エンピツを作ったとします。
平均の長さが、10㎝とします。
そうすると、最大で、10.3㎝、最低で、9.7㎝とします。
これが、生産ラインで許される誤差の範囲内という事になります。
10.3㎝以上、9.7㎝以下は、不良品として出荷されることはありません。
そういえば、アーモンド入りチョコレートも大きさは、大体同じです。
フリスクも、ミンティアも大きさは同じです。
この正規分布に照らし合わせて、正規品と、不良品を判別していると思います。
※動画ないでは、97%といっていますが、99.7%が正しいです。
ここがポイント
今回は、Excelよりも、統計がメインになりました。歪度、尖度、正規分布とは、結局は、確率の話なのです。統計的にいえば、今回は、〇〇である。という話は、確率ですよね。
競馬や、丁半博奕よりも、もっともっと複雑な計算をして、世の中はまわっているのですね。
まとめ
正規分布を、何となく理解していただけましたでしょうか?
統計は難しいですね。
本当に難しいです。
しかし、一定のエビデンスをもって、証明をしないと、だれも信じてくれません。
その、ツールが統計学ですね。
正直、方程式は、関数よりも、統計学は、勉強していて、楽しいと思う今日この頃です。
Excelにも、データサイエンス試験(初級)があるという事なので、受験してみようかなと思います。
最後まで、読んでいただきありがとうございました。
今回のサンプルファイルは、No179です。
わからない事を延々と考えるのは、無駄です。
- なんで作動かないの?
- もうやだ!VBAなんか嫌い!
- ネットで調べても情報がない!
必ず作動するコードが、ここにあります。