相関係数

2つの変量を持つ$N$個のデータ $(x_1, y_1), (x_2, y_2),\ldots, (x_N, y_N)$ が与えられたとき, $\overline{x}=\frac1{N}\sum_{i=1}^N x_i$, $\overline{y}=\frac1{N}\sum_{i=1}^N y_i$をそれぞれの平均値とすると, $s_{xy} = \frac1{N} \sum_{i=1}^N (x_i-\overline{x})(y_i-\overline{y})$ を共分散と言います. $s_x=\sqrt{\frac1{N}\sum_{i=1}^N (x_i-\overline{x})^2},~
s_y=\sqrt{\frac1{N}\sum_{i=1}^N (y_i-\overline{y})^2}$をそれぞれ データ$(x_i), (y_i)$の標準偏差と言います. このとき相関係数は $r=\frac{s_{xy}}{s_x x_y}$で定義されます. $-1\leq r \leq 1$が証明され, データ $(x_i), (y_i)$に関係がありそうか否かの数値的な指標になります.

これらの内容は, 旧教育課程では, 数学 B (選択領域なので ほとんどの人は勉強していない)に書かれていましたが, 新教育課程では, 数学 I に移動し, 必修になりました. 教員を目指す人は,「統計と社会」や 3年次の「確率統計学」で, これらの数字の意味をしっかり勉強して下さい.

student
2015-06-19