こちらの記事では「相関係数」について詳しく解説します。
「相関係数」と聞いて、どのようなものをイメージしますか。
「係数」と書いてあるから、何かの値なのかなと思った人もいるでしょう。
これから相関係数についてはもちろん、2つのデータの相関関係についても説明します。
この機会に2つのデータを分析するアイテムを1つ獲得してくださいね。
※参考記事
[数1]係数とは?係数の意味と求め方、単項式と多項式で解説
相関係数とは?
「相関係数」とは2つのデータの相関の正負と強弱を表す値のことです。相関係数の値を$r$とすると、$-1 \leq r \leq 1$の不等式が成り立ちます。相関係数の値が1に近いほど正の相関が強く、-1に近いほど負の相関が強いです。また相関係数の値が0に近いほど、データの相関関係は弱いと分析ができます。
2つのデータの相関関係を散布図で表すと図1です。
このように散布図を見ると、相関関係を分析することができ、相関の正負や強弱がわかります。
この散布図をみて、どのような特徴があると思いますか?正の相関がある散布図は右上がりのグラフのようにデータが散らばっています。また負の相関がある散布図は、データの点が右下がりに散らばっている様子がわかるのではないでしょうか。また相関関係が強くなればなるほど、データが密集しており、直線に近いものになっています。つまり、一次関数のグラフと同様の形をしていることが読み取れます。
散布図から相関関係を分析するときは、一次関数のグラフを思い浮かべるとわかりやすくなるでしょう。
※参考記事
[中2]一次関数のグラフ|書き方と求め方を分数の場合も解説
相関係数の公式と求め方
「相関係数」の値は次の公式で求められます。
\begin{equation} \text{相関係数} = \frac{\text{xとyの共分散}}{\text{xの標準偏差} \times \text{yの標準偏差}} \end{equation}
それでは実際に相関係数を求めていきましょう。次のデータの相関係数を求めます。(図2)
またこのデータにはどのような相関係数があるかも一緒に考えていきましょう。まずはx、yの平均をそれぞれ$x\bar{x}$、$\bar{y}$として求めます。 \begin{align*} \bar{x} &= \frac{1}{5}(72+76+93+84+85) = 82 \ \bar{y} &= \frac{1}{5}(69+76+88+75+87) = 79 \end{align*} 相関係数を$r$とし、計算すると図3です。
よって$r\approx0.86$。したがって、このデータには正の相関が強いと考えられます。
このように相関係数を求めるときは、共分散と標準偏差を理解している必要があります。まだ理解が不十分な人はこの機会にしっかり復習しておきましょう。
※参考記事
[数1]共分散とは?求め方と公式、相関係数との関係を解説
[数1]標準偏差とは?標準偏差の公式と求め方、分散と偏差を解説
相関係数の性質
問題
図4のような2つの変数$x$、$y$のデータがある。$x$と$y$にはどのような相関関係があると考えられるか。相関係数$r$を計算して求めよ。ただし、少数第3位を四捨五入せよ。
解答
$r \approx -0.85$
2つのデータの間には強い負の相関があると考えられる。
解説
$x$、$y$の平均をそれぞれ$\bar{x}$、$\bar{y}$として求めます。 \begin{align*} \bar{x} &= \frac{1}{5}(3+5+6+4+7)=5 \ \bar{y} &= \frac{1}{5}(4+7+10+6+8)=7 \end{align*} よって、相関係数$r$は図5のように求められます。
相関係数が-1に近い負の値なので、2つのデータには強い負の相関があると考えられます。
\ おすすめの参考書! /
相関係数とは?のまとめ
相関係数について解説しました。ポイントは下記の3つです。
- 相関係数とは2つのデータの相関の正負と強弱を表す値のことです。
- 相関係数は$(x$と$y$の相関係数) = $(x$と$y$の共分散) / $(x$の標準偏差) $\times$ $(y$の標準偏差)$で求めることができます。
- 相関係数を求めることで、2つのデータの相関関係がわかります。
(締めの文章) 以上のように相関係数を求めることで、2つのデータの相関関係を分析することができます。また相関関係を求めるためには、共分散や標準偏差を理解しておくことが重要です。この機会にしっかりと復習しておくことで、さまざまな視点からデータを分析できるようになりますね。
コメント