next up previous
Next: 練習問題1 Up: 情報科学演習 第11回 表計算ソフトを用いた統計処理 Previous: 本日の目標

本日の実習

としひこ, せいこ, まさひこ, なおこ, いよ, よしおの6人が ある試験でそれぞれ, 3点, 4点, 8点, 10点, 7点, 5点を取ったとします. これらのデータをもとに, 平均点と各人の偏差値を計算します.

\epsfbox{fig11-1.eps}

偏差値は, 素点を $x$とすると, 標準偏差$\sigma$と平均$\bar{x}$を使って次の式で定義されます.

\begin{displaymath}
10\times\frac{ x - \bar{x}}{\sigma} + 50
\end{displaymath}

標準偏差は, 偏差(平均値からの偏り)の平均です. 正確には次のように, 分散の平方根として定義されます: $n$人の人の点数が, $x_1, x_2, \ldots, x_n$とし, 平均を$\bar{x}$, 分散を$V$, 標準偏差を$\sigma$とすると,

\begin{eqnarray*}
\bar{x} &=& \frac{x_1+\cdots +x_n}{n}\\
V &=& \frac{ (x_1 - \...
...ft( \frac{x_1+\cdots +x_n }{n} \right)^2\\
\sigma &=& \sqrt{V}
\end{eqnarray*}

となります. 分散の式の 2番目の等式は簡単に証明できるので, 証明してみて下さい.

なお, 偏差値は受験用語で数学用語(統計用語)ではありません (純粋に日本語で, 例えば英語に対応する言葉はありません. deviation valueと直訳すると違う意味になります.)が, 分散,標準偏差は, 医学や工学など実験系はもちろん, 経済学, 社会学, 教育学などデータ分析をするときには 必要とされる基本用語です. 定義も簡単なので, この機会に覚えて下さい.

次の指示に従い, 図1の表を完成させます.

  1. 図1にあるデータおよび項目名を入力して下さい.
  2. 次に, 関数AVERAGEを使用して, セルB8に 6人の成績の平均値を計算する 式を書きます.
  3. C2に「としひこ」の得点(B2)と6人の平均点(B8)の差を 式で入力します.
この時,「=B2-B8」と入力してしまうと, C3にこの式をコピーした時に「=B3-B9」が入力され, 本来求める値とは異なる計算結果になります. (このようなセルの参照を「相対参照」といいます.)

これに対して, 平均点の記述されたセル(B8)のように どのセルからもそのセルの値を共通に利用したい場合, 「絶対参照」という方法を用います. 絶対参照では, セルの行番号と列のアルファベットの前に, $を入れます. 例えば, セルB8を絶対参照するには, $B$8とします. したがって, C2 に入れる式は, B2-$B$8 となります. 他に「複合参照」がありますが, こちらは自習して下さい.

絶対参照とコピー&ペーストを利用して, 表を完成させます.

  1. C2をコピーしてから C3〜C7 にペーストします
  2. D2〜D7にはC列の2乗を式で入力します.
  3. E 列には, B列の 2乗が入るように式を入力します.
  4. E8には「各人の得点の2乗」の平均を入力します. (E2〜E7の平均を計算する式を入力.)
  5. B9に 6人の成績の分散を入力します.(分散は「2乗の平均-平均の2乗」ですから, E8からB8の2乗を引いた式を書くことになります.)
  6. D8にD2〜D7の平均を計算する式を入力します. (この値は「各人の得点から平均点を引いたもの」の2乗ですから, 分散の定義式です. B9の値と一致することを確認して下さい.)
  7. B10 に標準偏差を入力します. 平方根を求めるには, SQRTという関数を 利用します.)
  8. F2〜F7に各人の偏差値を計算する式を入力します.
  9. C8にC2〜C7の平均を計算する式を書きます. (これは, 理論上0 となりますが, $x.xxxxE-10$のように表示されることがあります. これは, $x.xxxx\times 10^{-10}$の意味で0に近い値です. 小数計算では, 計算機は無限小数や小さい数を 途中で値を四捨五入するため, 理論値との誤差を生じることがあります.)

注意

  1. 分散や標準偏差は標準的な統計関数なので, それを求める関数が 備わっています. 但し, それを Helpで正確に探すのは難しいです. 理由は, 抽出調査をして検定, 推定をする場合の不偏分散と言う概念と, 母集団の分散と言う概念があり, これらの正確な説明が Helpに書かれていないのです (この事情は Excelも同じ). 詳しくは, 統計関連の授業で勉強して下さい. 「偏差値」に関しては, 統計上の意味が全くありませんので, それを計算する関数が, 備わっていることはありません.

  2. 上の成績を後述の 5段階相対評価で評価すると, 2が2人, 3が3人, 5が1人となります.



Subsections
next up previous
Next: 練習問題1 Up: 情報科学演習 第11回 表計算ソフトを用いた統計処理 Previous: 本日の目標

平成23年7月15日