今回はデータの分析で出てくる、平均値・最頻値・中央値について解説します。
平均値・最頻値・中央値は同じ時に習うので、どれがどれか分からなくなりやすいです。
3つの値の求め方とメリットデメリットを解説することで、違いをわかりやすく理解できる解説をしました!
最後には平均値・最頻値・中央値を求める問題も準備しています。
ぜひ最後まで読んでみてください!
平均値、最頻値、中央値
データの分析を学習するとまず出てくるこの用語たち。
言葉自体は難しそうでも意味をイメージすることができれば案外簡単に問題を解くことが出来ますよ。
まずは一つ一つ意味を確認して、実際に求めてみましょう。
平均値とは|メリットとデメリット

まずは、一番よく聞く「平均値」から。
大体真ん中の値を求めるときに使う言葉ですね。
「平均値」とは一言でいうと「全体を均した時の値」のことです。
適当にジュースが入っているコップいくつかをイメージしてください。
それを量りを使ってすべてのコップに「均等に」「同じ量だけ」分けていきます。そうしたら全てのコップには「同じ量だけ」ジュースが入っていることになりますよね?
その時の量が「平均値」です。
イメージしやすい「平均値」ですがメリット・デメリットがあるので使うときには注意が必要です。
平均値のメリット
平均値のメリットは数字の変化に細かく対応できること、になります。
おさらいすると、「平均値」とは全体を均して求める値のことです。
先ほどのジュースの入ったコップを思い出してください。
もしも、その中に一つだけさっきよりも多い量のジュースが入っていたら。
均した後もちょっとずつ多くなっているはずですよね?
このように数字が少しでも変わってもきちんと計算の結果に反映することができるのです。
逆にこのメリットはデメリットにもなりえるので注意しましょう。
平均値のデメリット
例えば、増やしたジュースの量が極端に多かった場合、均した後も当然多くなりますが、ほとんどのコップはもともとよりも多くなっているはずです。
これでは極端に多い一つの数字にすべてが影響されて正しい大体真ん中の値があやふやになってしまっています。
なので、極端に大きい・小さいものはあえて先に除外してから計算することでより実用的なデータを求めることが出来ます。
最頻値とは|メリットとデメリット

次に「最頻値(さいひんち)」です。
これも漢字が難しそうですがイメージできるととても簡単です。
「最頻値」とはいくつか与えられたデータの中で「最も多く登場した値」のことです。
多数決で何かを決めるときのことをイメージしてください。
多数決を取るときには一番多かった案を採用しますよね?
それを数字に置き換えるだけです!
いくつか与えられた数字の中から「最も多く登場した値」を最頻値とします。
この「最頻値」にもメリット・デメリットがあります。
最頻値のメリット
メリットは極端に大きい・小さい数字を無視して求めることが出来ることです。
単純に一番登場回数が多いものを調べるだけなので、データのばらつきに左右されることがありません。
最頻値のデメリット
一方でデメリットは、データ数が少ない時には使えない、という点です。
例えば「3個のデータの中で最も多く登場した値」では偶然性がありそうですが「100個のデータの中で最も多く登場した値」ではきちんと意味のあるデータになっていそうですよね。
なので「最頻値」とは母数が多ければ多いほど意味のある値になってきます。
中央値とは|メリットとデメリット

最後に「中央値」です。
こちらも「平均値」と同じように真ん中の値を表しています。
平均値が「均す」ことに対しこちらは「並べる」ことがポイントです。
データを小さい順に並べていったときの真ん中の値が「中央値」です。
中央値のメリット
順位などを表すときに中央値は最大のメリットを発揮します。
順番に並べるわけですから、自分は真ん中よりも上なのか下なのかが一目でわかりますね。
中央値のデメリット
しかし、デメリットもあります。
それはすべてのデータのうち真ん中付近しか反映されないということです。
全体を大まかに見て分析したいときには不向きですね。
なので、全体よりも真ん中だけに注目したいときに使っていきましょう。
平均値の求め方
平均値の求め方です。
均せばよいので、一度すべてを足してしまって、人数や個数で割り、一つ分を求められれば大丈夫です。
公式:データをそれぞれ\(x_1,\ x_2,\ x_3,\ \cdots,\ x_n\)とすると
平均値\(=(x_1+x_2+x_3+\cdots+x_n)\times \displaystyle \frac{1}{n}\)
問題
ある5人の数学の点数は58点、46点、72点、89点、61点でした。平均点を求めなさい。
解答と解説
公式に沿って計算してみましょう。
$$平均点=(58+46+72+89+61)\times\displaystyle \frac{1}{5}=65.2$$
つまり、平均点は65.2点ということになります。
最頻値の求め方
最頻値はデータの中で最も多く登場した値のことですので、データをよく見て数えていきましょう。
問題
ある10人の漢字テストの点数は
5点、7点、2点、5点、8点、7点、9点、10点、10点、7点でした。
最頻値を求めなさい。
解答と解説
問題文の中で最も多く登場した点数は何点でしたか?
答えは7点です。
\ おすすめの参考書! /
中央値の求め方
中央値を求めるには、まずデータを小さい順に並べていく必要があります。
そしてちょうど真ん中の値を見つけます。
しかし、データの個数が奇数なのか偶数なのかで中央値は変わってきます。
例えばデータが3個だった場合はちょうど真ん中は2番目になりますよね。
しかし、データが4個だったらどうでしょうか。
ちょうど真ん中がないので2番目と3番目の平均値を中央値とします。
公式:データをそれぞれ小さい順に\(x_1,\ x_2,\ x_3,\ \cdots,\ x_n\)とすると、
中央値は、
$x_{\displaystyle \frac{1+n}{2}\)(\(n\)は奇数)$
\((x_{\displaystyle \frac{n}{2}}+x_{\displaystyle \frac{n}{2}+1}\times\displaystyle \frac{1}{2}\)
問題
ある5人の計算テストの点数は6点、4点、7点、8点、5点でした。
また、そこに9点を取った1人を加えたときのそれぞれの中央値を求めなさい。
解答と解説
まずは5人の時から順番に並べると、4点、5点、6点、7点、8点になりますので中央値は6点です。
そこに1人加えたときは、4点、5点、6点、7点、8点、9点になりますので真ん中の2つ(6点と7点)の平均を求めます。
$$(6+7)\times\displaystyle \frac{1}{2}=6.5$$
となり、中央値は6.5点と分かります。
まとめ
いかがだったでしょうか。
特に平均値と中央値については混同してしまいがちなので、計算の仕方からしっかりと確認しておきましょう。
コメント