標準偏差とは?意味や求め方、計算方法、分散・標準語差との違い

この記事では、「標準偏差」の意味や求め方、計算方法などを解説していきます。

分散や標準語差との違いもわかりやすく紹介していくので、この記事を通してぜひマスターしてくださいね!

 

標準偏差とは?

標準偏差とは、データの散らばり度合い(ばらつき)を表す値のことをいいます。

標準偏差が大きいほどデータのばらつきが大きく、標準偏差が小さいほどばらつきが小さいことを意味します。

 

標準偏差の記号

標準偏差は、「\(\sigma\)」または「\(s\)」の記号で表されます。

  • \(\sigma\):母集団の標準偏差
  • \(s\):標本の標準偏差

統計調査において母集団全体のデータを集めるのはなかなか難しいので、よく目にするのは標本の標準偏差 \(s\) かもしれませんね。

補足

母集団は「対象となるすべての集合」、標本は「母集団から選び出した部分集合」のことを指します。

例えば、日本人の意識調査という統計においては、母集団は「日本人全員」、標本は「アンケート回答者」といえます。

 

標準偏差の公式

標準偏差は、以下の公式で求められます。

標準偏差の公式

標準偏差を \(s\)、データの総数を \(n\)、それぞれのデータの値を \(x_1\), \(x_2\), \(\cdots\), \(x_n\)、平均値を \(\overline{x}\)  とすると、

\begin{align}\color{red}{s = \displaystyle \sqrt{\frac{1}{n} \{(x_1 − \overline{x})^2 + (x_2 − \overline{x})^2 + \cdots + (x_n − \overline{x})^2\}}}\end{align}

または

\begin{align}\color{red}{s = \displaystyle \sqrt{\overline{x^2} − (\overline{x})^2}}\end{align}

(見切れる場合は横へスクロール)

標準偏差は、分散の正の平方根の値をとります。

つまり、「\(\color{red}{\text{標準偏差} = \sqrt{\text{分散}}}\)」ということを覚えておけば、新たに公式を覚える必要はありませんね!

補足

「分散」については、以下の記事で説明しています。

分散とは?公式、求め方や計算問題、分散分析・多重比較の意味も!

 

標準偏差の求め方

それでは、例題を通して標準偏差の求め方を説明していきます。

例題

次のデータは、\(5\) 人の学生が一日に読書する時間 \(x\) (分) である。

\(5\), \(30\), \(10\), \(40\), \(15\)

このデータの標準偏差 \(s\) を求めなさい。

 

標準偏差は分散の正の平方根なので、途中までは分散の求め方とまったく同じです。

ステップごとに見ていきましょう。

STEP.1
平均値を求める

まず、このデータの平均値 \(\overline{x}\) を求めます。

平均値 \(\overline{x}\) は、すべてのデータの値を足してデータの総数で割ると出てきますね。

\(\begin{align} \overline{x} &= \frac{x_1 + x_2 + x_3 + x_4 + x_5}{5} \\&= \frac{5 + 30 + 10 + 40 + 15}{5} \\ &= \frac{100}{5} \\ &= 20 \end{align}\)

 

STEP.2
偏差を求める

次に、それぞれのデータの値から平均値を引いた偏差 \(x_i − \overline{x}\) を求めます。

\(x_1 − \overline{x} = 5 − 20 = − 15\)

\(x_2 − \overline{x} = 30 − 20 = 10\)

\(x_3 − \overline{x} = 10 − 20 = − 10\)

\(x_4 − \overline{x} = 40 − 20 = 20\)

\(x_5 − \overline{x} = 15 − 20 = − 5\)

 

STEP.3
偏差の 2 乗を求める

先ほどの偏差を \(2\) 乗していきます。

公式でいうと、

\((x_1 − \overline{x})^2\), \((x_2 − \overline{x})^2\), \(\cdots\) の部分にあたります。

\((x_1 − \overline{x})^2 = (− 15)^2 = 225\)

\((x_2 − \overline{x})^2 = 10^2 = 100\)

\((x_3 − \overline{x})^2 = (− 10)^2 = 100\)

\((x_4 − \overline{x})^2 = 20^2 = 400\)

\((x_5 − \overline{x})^2 = (− 5)^2 = 25\)

 

STEP.4
偏差の 2 乗の平均値を求める

偏差の \(2\) 乗の合計をデータの総数で割ると、分散 \(s^2\) が求まります。

\(s^2\)

\(= \displaystyle \frac{(x_1 − \overline{x})^2 + (x_2 − \overline{x})^2 + \cdots + (x_5 − \overline{x})^2}{5}\)

\(= \displaystyle \frac{225 + 100 + 100 + 400 + 25}{5}\)

\(= \displaystyle \frac{850}{5}\)

\(= 170\)

分散までわかれば、あとは解けたも同然です。

 

STEP.5
分散の正の平方根をとる

分散の正の平方根をとれば、標準偏差が求められます。

\(s = \sqrt{s^2} = \sqrt{170}\)

このように、標準偏差が \(\color{red}{\sqrt{170}}\) と求められました!

 

完了

 

Tips

分散は、表を使って効率的に計算できます。

標準偏差は分散の正の平方根をとるだけなので、分散まで表で求めるのもオススメですよ!

\(i\) \(x_i\) \(x_i − \overline{x}\) \((x_i − \overline{x})^2\)
\(1\) \(5\) \(−15\) \(225\)
\(2\) \(30\) \(10\) \(100\)
\(3\) \(10\) \(−10\) \(100\)
\(4\) \(40\) \(20\) \(400\)
\(5\) \(15\) \(−5\) \(25\)
合計 \(100\) \(850\)
平均 \(20\)

\(\color{red}{170}\)
(分散)

 

分散・標準誤差との違い

次に、標準偏差とよく似ている、分散や標準誤差との違いについて解説していきます。

それぞれを記号で表すと次のようになります。

  • 分散: \(s^2\)
  • 標準偏差: \(s\)
  • 標準誤差: \(\displaystyle \frac{s}{\sqrt{n}}\)

 

標準偏差と分散の違い

標準偏差と分散は、どちらもデータの散らばり度合い(ばらつき)を示す値です。

両者の最大の違いは、標準偏差が分散の正の平方根であることです。

この計算上、分散と標準偏差は単位の次元が異なります

分散は実際のデータの \(2\) 乗の次元になっているのに対し、標準偏差は実際のデータと同じ単位の次元となります。

よって、データのばらつきを評価するときには、分散よりも標準偏差の方が直感的にわかりやすく、よく用いられやすいといえます。

(例)クラス \(30\) 人の期末テストの結果

  • 平均点:\(69 \ \mathrm{(点)}\)
  • 分散:\(315.4 \ \mathrm{(点^2)}\)
  • 標準偏差:\(17.8 \ \mathrm{(点)}\)

→ 大半の人がテストで \(69 \pm 17.8 \mathrm{(点)}\) の結果だった

 

標準偏差と標準誤差の違い

標準誤差とは、推定量の標準偏差です。

標準偏差が得られたデータのばらつき具合を示すのに対し、標準誤差はそのデータの平均値がどの程度の精度をもっているか(= 母集団の平均値に近いかどうか)を示します。

推定量

標本から母集団の性質を推定した統計量のこと。

母集団の性質と標本の性質は、まったく同じとは限りません。

あるデータを分析するときに本当に知りたいのは母集団の情報ですが、それを知るためには標本から推定する必要があるのです。

つまり、推定量と本当の(母集団の)統計量には必ず誤差が生じます。

標準誤差は、この誤差を推定量の標準偏差として表したものなのです。

したがって、標準誤差が小さいほど推定量のばらつきが小さい、つまり、推定された平均値が母集団の平均値に近いことを示します。

(例)日本人女性(母集団)の身長を推定するために、\(100\) 人(標本)の身長を測定

 

  • 標本の平均値が \(158 \ \mathrm{cm}\)、標準誤差が \(2 \ \mathrm{cm}\) の場合
    → 母集団の平均値も \(158 \ \mathrm{cm}\) に近い可能性が高い
  • 標本の平均値が \(158 \ \mathrm{cm}\)、標準誤差が \(10 \ \mathrm{cm}\) の場合
    → 母集団の平均値は \(158 \ \mathrm{cm}\) 付近ではない可能性も…

このように、標準偏差と標準誤差は似ているようで、まったく違うことを意味するのですね。

これらの違いをしっかりと理解しておきましょう!

 

標準偏差の計算問題

最後に、標準偏差の計算問題を解いてみましょう。

計算問題①「欠席者数の標準偏差を求める」

計算問題①

次のデータは、ある小学校の学年ごとの \(1\) 日の欠席者数である。

このデータの標準偏差を求めなさい。

学年 \(1\) \(2\) \(3\) \(4\) \(5\) \(6\)
欠席者数 (人) \(8\) \(4\) \(5\) \(10\) \(7\) \(8\)

 

「平均値」→「偏差の \(2\) 乗」→「分散」→「標準偏差」の順に着実に求めていきましょう。

解答

 

欠席者数の平均値は、

\(\displaystyle \frac{8 + 4 + 5 + 10 + 7 + 8}{6} = 7\)

 

各学年の欠席者数の偏差の \(2\) 乗は、

\((8 − 7)^2 = 1^2 = 1\)

\((4 − 7)^2 = (− 3)^2 = 9\)

\((5 − 7)^2 = (− 2)^2 = 4\)

\((10 − 7)^2 = 3^2 = 9\)

\((7 − 7)^2 = 0\)

\((8 − 7)^2 = 1^2 = 1\)

 

よって、分散 \(s^2\) は

\(\begin{align} s^2 &= \displaystyle \frac{1}{6} (1+ 9 + 4 + 9 + 0 + 1) \\ &= \frac{1}{6} \cdot 24 \\ &= 4\end{align}\)

 

したがって、標準偏差 \(s\) は

\(s = + \sqrt{s^2} = \sqrt{4} = 2\)

 

答え:  \(2\)

 

計算問題②「表を使って標準偏差を求める」

計算問題②

次の表を埋め、データの標準偏差を求めなさい。

データ番号 データ \(x\) 偏差 \(x − \overline{x}\) 偏差\({}^2\) \((x − \overline{x})^2\)
\(1\) \(70\)
\(2\) \(80\)
\(3\) \(80\)
\(4\) \(75\)
\(5\) \(70\)
合計
平均 分散 ⑭

 

表を埋めていくと、分散が求まります。

それを利用して標準偏差を求めましょう。

解答

 

表より、データの合計は

\(70 + 80 + 80 + 75 + 70 = 375 \text{ …①}\)

 

データの平均は

\(\overline{x} = 375 \div 5 = 75 \text{ …②}\)

 

それぞれの偏差は

\(x_1 − \overline{x} = 70 − 75 = −5 \text{ …③}\)

\(x_2 − \overline{x} = 80 − 75 = 5 \text{ …④}\)

\(x_3 − \overline{x} = 80 − 75 = 5 \text{ …⑤}\)

\(x_4 − \overline{x} = 75 − 75 = 0 \text{ …⑥}\)

\(x_5 − \overline{x} = 70 − 75 = −5 \text{ …⑦}\)

 

これらをそれぞれ \(2\) 乗すると、

\((x_1 − \overline{x})^2 = (−5)^2 = 25 \text{ …⑧}\)

\((x_2 − \overline{x})^2 = 5^2 = 25 \text{ …⑨}\)

\((x_3 − \overline{x})^2 = 5^2 = 25 \text{ …⑩}\)

\((x_4 − \overline{x})^2 = 0^2 = 0 \text{ …⑪}\)

\((x_5 − \overline{x})^2 = (−5)^2 = 25 \text{ …⑫}\)

 

偏差の \(2\) 乗の和は、

\(25 + 25 + 25 + 0 + 25 = 100 \text{ …⑬}\)

 

よって、分散は

\(100 \div 5 = 20 \text{ …⑭}\)

 

また、標準偏差は分散の正の平方根の値をとるので、

\(+\sqrt{20} = 2\sqrt{5}\)

 

答え:

表は次の通り。

個数 \(n\) データ \(x_n\) 偏差 \(x_n − \overline{x}\) 偏差\({}^2\) \((x_n − \overline{x})^2\)
\(1\) \(70\) ③ \(\color{red}{−5}\) ⑧  \(\color{red}{25}\)
\(2\) \(80\) ④ \(\color{red}{5}\) ⑨  \(\color{red}{25}\)
\(3\) \(80\) ⑤ \(\color{red}{5}\) ⑩  \(\color{red}{25}\)
\(4\) \(75\) ⑥ \(\color{red}{0}\) ⑪ \(\color{red}{0}\)
\(5\) \(70\) ⑦ \(\color{red}{−5}\) ⑫  \(\color{red}{25}\)
合計 \(\sum x_n\) ① \(\color{red}{375}\) ⑬ \(\color{red}{100}\)
平均 \(\overline{x}\) ② \(\color{red}{75}\) 分散 ⑭ \(\color{red}{20}\)

標準偏差 \(\color{red}{2\sqrt{5}}\)

以上で練習問題も終わりです!

 

標準偏差について理解が深まりましたか?

分散や標準誤差との違いもしっかりと区別しておけるといいですね!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です