Excelで学ぶやさしい統計学 中央値 最頻値ってなに?

こんにちは。伊川(@naonaoke)です。

今回は、中央値、最頻値について説明します。

相加平均(Averege関数)においては、平均する数に開きがある場合は、役に立たないと言いました。

相乗平均(GEOMEAN関数)においても、役に立たないこともあるかもしれません。

その場合は、中央値、最頻値(さいひんち)というものを使って、表します。

このブログはこんな人にお勧め

このブログはこんな人にお勧め
  • 統計学の基礎を勉強している人
  • Excelで統計関数を使いたい人
  • 代表値を知りたい人

このブログを読み終わるころには・・・

MEDIAN関数
MODE.SNGL関数
MODE.MULT関数
上記3つの関数を使えるようになります。


スポンサーリンク

中央値とは

データで、真ん中に位置する値です、メディアンとも言います。

例えば、ある会社で、10人中、7人が月給10万円とします。

しかし、あとの3人が、月給100万とします。

そうすると、平均の月給は、37万円となり、実態との乖離が大きくなります。

一方中央値は、年収が低い順,高い順に社員を並べたときに丁度真ん中になる人の年収を表しています。

一部の高給取りの月給は中央値に影響せず、中央値は普通の社員の生活水準により近くなります。

これが中央値です。

最頻値

例えば日本で姓の標本を採取すると、佐藤という姓が他の姓より頻繁に出現します。

ちなみに、1,893,000人です。

したがってこの場合の最頻値は「佐藤」となります。

ヒストグラムで考えた場合は、ヒストグラムの一番高いところが、最頻値となります。

では、実際に、Excelの関数で中央値、最頻値を計算します。

中央値、最頻値を算出 作業手順 その1 データベース確認

いつものように、ダウンロード数をサンプルに中央値をMEDIAN関数で算出します。

中央値、最頻値を算出 作業手順 その2 MEDIAN関数の使い方

使い方は特にSUM関数と変わりません。

中央値を表示させたい、セルに、MEDIANと入力して、対象のセルをなぞるだけです。

これで、中央値は算出されます。

中央値、最頻値を算出 作業手順 その3 
MODE.SNGL関数の使い方

これも、SUM関数と使い方は変わりません。

最頻値を表示させたい、セルに、MODE.SNGLと入力して、対象のセルをなぞるだけです。

これで、最頻値は算出されます。

中央値、最頻値を算出 作業手順 その4 
MODE.MULT関数の使い方

MODE.MULT関数は、最頻値の次の最頻値を算出することができます。

この場合は、配列を使いますので、最後は、Shift+Ctrl+Enterで決めます。

MODE.MULT関数を使うときは、最頻値を表示させたいセルを全部選択してください。

全部選択して、Shift+Ctrl+Enterで決めます。


これで、全ての、代表的な、代表値が求まりました。

ここがポイント

ここがポイント
Function8.png
統計関数を利用するときは、なぜ、そのような値が必要なのかという事を理解しなければなりません。関数の使い方に関しては、集計関数から比べても全然カンタンだと思います。今回のように、相加平均なのか、相乗平均なのか、中央値なのか、最頻値なのは、Excelではなく、

人間が判断するものになります。

どの関数を利用するのか、意味合いをしっかりと理解しましょう。

動画とブログでわかりやすくExcelとACCESSを紹介しています
created by Rinker
¥2,420 (2020/10/31 05:03:35時点 Amazon調べ-詳細)

まとめ

今回は、平均値が正しく反映されない場合に、中央値、最頻値があるという事を紹介しました。

平均値が必ずしも代表値ではありません。

統計学には、いろいろな代表値があることを忘れてはいけません。

最後まで読んでいただき、ありがとうございました。

スポンサーリンク

Twitterでフォローしよう

おすすめの記事