度数分布とは?表や多角形の作り方、平均値・中央値・最頻値の問題

この記事では、「度数分布」についてわかりやすく解説していきます。

度数分布表や度数分布多角形の作り方、平均値・中央値・最頻値を問う問題も説明していくので、ぜひこの記事を通してマスターしてくださいね!

 

度数分布とは?

度数分布とは、集めたデータをいくつかの区間に分けたとき、各区間にどのくらいの個数のデータが属するかを確認するものです。

 

度数分布の用語

度数分布を表す上で、次の \(4\) つの用語を理解しておきましょう。

  • 階級
    度数分布の \(1\) つの区間。
  • 度数
    各階級に属するデータの個数。
  • 階級の幅
    階級の値の範囲。
  • 階級値
    各階級の中央の値。

 

度数分布の表し方

度数分布を表すには、次のような図表を用います。

  • 度数分布表
    度数分布を表に表したもの
  • ヒストグラム
    度数分布の階級を横軸、度数を縦軸にとって棒グラフで表したもの
  • 度数分布多角形
    度数分布の階級値を横軸、度数を縦軸にとって折れ線グラフで表したもの(ヒストグラムの各棒グラフ上部の中点を結んでも作成できる)

これらを作成することにより、データの分布が把握しやすくなります。

ヒストグラムは、データの分布状況を視覚的に把握するのに適しています。

一方、\(2\) セット以上のデータの度数分布を比較する際には、度数分布多角形を使うと比較しやすいです。

 

度数分布の例

度数分布について、例を見ながらより詳しく見ていきましょう。

例えば、\(20\) 人のクラスで \(20\) 点満点の小テストの結果を度数分布表に表すとします。

このとき知りたいのは、大まかな点数ごとの人数の分布ですよね。

したがって、「テストの点数」を階級、「人数」を度数とします。

階級の幅は自由にとることができるので、データの分布の特徴が把握しやすい幅を考えます。

テストの点数【階級】 人数【度数】
\(0\) 以上 \(5\) 未満 \(2\)
\(5\) 以上 \(10\) 未満 \(5\)
\(10\) 以上 \(15\) 未満 \(10\)
\(15\) 以上 \(3\)
合計 \(20\)

上記の例では、階級の幅は \(5\)、階級値は上からそれぞれ \(2.5\), \(7.5\), \(12.5\), \(17.5\) となりますね。

 

度数分布表の作り方

次に、度数分布表の作り方について、例題を用いて解説していきます。

例題

次のデータの度数分布表を作りなさい。

ただし、階級は \(10\) から始め、階級の幅は \(10\) とする。

\(11\), \(12\), \(18\), \(18\), \(20\), \(21\), \(25\), \(26\), \(31\), \(32\), \(34\), \(36\), \(37\), \(37\), \(39\), \(41\), \(44\), \(45\), \(46\), \(50\), \(51\), \(54\), \(55\), \(57\), \(57\)

 

まず、散らばっているデータを階級ごとに分類し、度数を数えていきます

階級の幅は \(10\) と与えられていて、一番小さいデータは \(11\)、一番大きいデータは \(57\) です。

  • 階級が \(10\) 以上 \(20\) 未満
    \(11\), \(12\), \(18\), \(18\) の計 \(4\) 個
  • 階級が \(20\) 以上 \(30\) 未満
    \(20\), \(21\), \(25\), \(26\) の計 \(4\) 個
  • 階級が \(30\) 以上 \(40\) 未満
    \(31\), \(32\), \(34\), \(36\), \(37\), \(37\), \(39\) の計 \(7\) 個
  • 階級が \(40\) 以上 \(50\) 未満
    \(41\), \(44\), \(45\), \(46\) の計 \(4\) 個
  • 階級が \(50\) 以上 \(60\) 未満
    \(50\), \(51\), \(54\), \(55\), \(57\), \(57\) の計 \(6\) 個

となります。

Tips

「以上」はその数を含み、「未満」はその数を含まないことに注意しましょう!

また、実際に数える際は問題部分にスラッシュなどを書き足すと楽です。

\(11\), \(12\), \(18\), \(18\),/ \(20\), \(21\), \(25\), \(26\),/ \(31\), \(32\), \(34\), \(36\), \(37\), \(37\), \(39\)/, \(41\), \(44\), \(45\), \(46\)/, \(50\), \(51\), \(54\), \(55\), \(57\), \(57\)

 

そして、これらを表にまとめていきます。

階級列を左に、度数列を右に並べましょう。

階級 度数
\(10\) 以上 \(20\) 未満 \(4\)
\(20\) 以上 \(30\) 未満 \(4\)
\(30\) 以上 \(40\) 未満 \(7\)
\(40\) 以上 \(50\) 未満 \(4\)
\(50\) 以上 \(60\) 未満 \(6\)
合計 \(25\)

これで、度数分布表の完成です。

 

【補足】相対度数分布表とは?

度数を、度数の合計に対する割合で表したものを「相対度数」といい、これを用いた表を「相対度数分布表」といいます。

度数の合計を \(1\) とすることもあれば、\(100 \text{%}\) とすることもあります。

また、低い階級から相対度数を足し上げていく「累積相対度数」という考え方もあります。

たまに聞かれることがあるので、覚えておきましょう!

階級 度数 相対度数 累積相対度数
\(10\) 以上 \(20\) 未満 \(4\) \(0.16\) \(0.16\)
\(20\) 以上 \(30\) 未満 \(4\) \(0.16\) \(0.32\)
\(30\) 以上 \(40\) 未満 \(7\) \(0.28\) \(0.60\)
\(40\) 以上 \(50\) 未満 \(4\) \(0.16\) \(0.76\)
\(50\) 以上 \(60\) 未満 \(6\) \(0.24\) \(1\)
合計 \(25\) \(1\) \(1\)

 

度数分布表からヒストグラムの作図

ここでは、度数分布表からヒストグラムを作図する手順について解説していきます。

先ほどの例題で作成した度数分布表からヒストグラムを作図してみましょう。

例題

次のデータのヒストグラムを作成せよ。

階級 度数
\(10\) 以上 \(20\) 未満 \(4\)
\(20\) 以上 \(30\) 未満 \(4\)
\(30\) 以上 \(40\) 未満 \(7\)
\(40\) 以上 \(50\) 未満 \(4\)
\(50\) 以上 \(60\) 未満 \(6\)
合計 \(25\)

 

STEP.1
軸をとる

まず、横軸に「階級」、縦軸に「度数」をとります。

 

STEP.2
軸に目盛りをふる

次に、階級と度数の最大の値を考慮して目盛りをふっていきます。

 

STEP.3
各階級に度数の値をとる

そして、それぞれの階級の中央あたりに度数の値の点を打っていきます。

 

STEP.4
階級ごとに棒グラフを書く

最後に、それらの点を上辺とした長方形を書いていきます。

これでヒストグラムの完成です!

 

完了
補足

「ヒストグラム」については、以下の記事も参考にしてくださいね!

ヒストグラムとは?作り方(書き方)や階級・データ区間の決め方

 

度数分布表から度数分布多角形の作図

ここでは、度数分布表から度数分布多角形を作図する手順について解説していきます。

同じ例題で度数分布多角形を作図してみましょう!

例題

次のデータのヒストグラムを作成せよ。

階級 度数
\(10\) 以上 \(20\) 未満 \(4\)
\(20\) 以上 \(30\) 未満 \(4\)
\(30\) 以上 \(40\) 未満 \(7\)
\(40\) 以上 \(50\) 未満 \(4\)
\(50\) 以上 \(60\) 未満 \(6\)
合計 \(25\)

 

度数分布多角形は、階級値(階級の中央の値)に対する度数を表す折れ線グラフでしたね。

STEP.1
階級値を求める

まずは階級値を求めます。度数分布表に階級値の列を追加しましょう。

階級 階級値 度数
\(10\) 以上 \(20\) 未満 \(15\) \(4\)
\(20\) 以上 \(30\) 未満 \(25\) \(4\)
\(30\) 以上 \(40\) 未満 \(35\) \(7\)
\(40\) 以上 \(50\) 未満 \(45\) \(4\)
\(50\) 以上 \(60\) 未満 \(55\) \(6\)
合計 \(25\)

この表を元に、度数分布多角形を作図していきます。

 

STEP.2
軸をとり、目盛りをふる

まず、横軸に階級、縦軸に度数をとり、それぞれの最大値を考慮して目盛りをふっていきます。

 

STEP.3
階級値ごとに度数の値をとる

そして、階級値に対する度数の点を打っていきます。

 

STEP.4
点を直線でつなぐ

次に、それらの点を直線で結びます。

これで完成ではありません。

 

STEP.5
両端へ直線を伸ばす

度数分布多角形では、折れ線の両端が横軸に交わるのがルールです。

存在している階級値の外にさらに階級値があり、その度数が \(0\) であるととらえ、両端に点を書き足します。

そして、そこへ直線を伸ばしましょう。

これで度数分布多角形の完成です!

 

完了

いかがでしたか?

最後に横軸と折れ線グラフを交わらせることを忘れないようにしましょう!

 

度数分布表と代表値

次に、度数分布表から各代表値(平均値・中央値・最頻値)を求める方法を解説していきます。

補足

通常の代表値の求め方については、以下の記事で詳しく説明しています。

平均値・中央値・最頻値の違い!求め方、使い分け、計算問題

度数分布表と平均値

平均値とは、すべてのデータの値を足して、データの個数で割った値のことでしたね。

しかし、度数分布表からは具体的な個々のデータの値がわかりません。

そこで、個々のデータの値は階級値に等しいと仮定して合計を算出し、それを度数の合計(データ個数)で割ることによって求めます。

度数分布表と平均値

\begin{align}\color{red}{\displaystyle \text{平均値} = \frac{\text{(階級値) $\times$ (度数) の合計}}{\text{度数の合計}}}\end{align}

 

度数分布表と中央値

中央値とは、データを大きさ順に並べたとき、ちょうど真ん中にくる値のことでした。

ちょうど真ん中の値が属する階級の階級値を中央値とします。

度数分布表と中央値

\(n\) 個のデータがあるとき、中央値は以下の通り。

  •  \(n\) が奇数の場合
    大きさが \(\color{red}{\displaystyle \frac{n + 1}{2}}\) 番目のデータが属する階級の階級値。
  • \(n\) が偶数の場合
    大きさが \(\color{red}{\displaystyle \frac{n}{2}}\) 番目と \(\color{red}{\displaystyle \frac{n}{2} + 1}\) 番目のデータが属する階級の階級値。

 

度数分布表と最頻値

最頻値とは、データの中で最も頻繁に出てくる値のことですね。

度数分布表から求める場合は、度数が最も多い階級の階級値が最頻値となります。

度数分布表と最頻値

最頻値は、度数が最も多い階級の階級値。

これはとても簡単ですね。

 

例題「度数分布表から代表値を求める」

それでは、例題でそれぞれの代表値を求めてみましょう!

例題

次の度数分布表より、平均値・中央値・最頻値の値をそれぞれ求めなさい。

ただし、平均値は小数第一位まで求めなさい。

階級 度数
\(0\) 以上 \(10\) 未満 \(7\)
\(10\) 以上 \(20\) 未満 \(5\)
\(20\) 以上 \(30\) 未満 \(6\)
\(30\) 以上 \(40\) 未満 \(3\)
\(40\) 以上 \(50\) 未満 \(9\)
合計 \(30\)

 

代表値を知るには、階級値が必要です。

度数分布表に階級値を追加しましょう。

階級 階級値 度数
\(0\) 以上 \(10\) 未満 \(5\) \(7\)
\(10\) 以上 \(20\) 未満 \(15\) \(5\)
\(20\) 以上 \(30\) 未満 \(25\) \(6\)
\(30\) 以上 \(40\) 未満 \(35\) \(3\)
\(40\) 以上 \(50\) 未満 \(45\) \(9\)
合計 \(30\)

 

それでは、まず平均値を求めましょう。

階級値と度数をかけ合わせたものを足して、度数の合計 \(30\) で割ります。

\(\displaystyle \frac{5 \cdot 7 + 15 \cdot 5 + 25 \cdot 6 + 35 \cdot 3 + 45 \cdot 9}{30}\)

\(= \displaystyle \frac{770}{30}\)

\(= 25.666\cdots ≒ 25.6\)

よって平均値は \(\color{red}{25.6}\) となります。

 

次に中央値を求めます。

度数の合計が \(30\) と偶数なので、真ん中にくるデータは \(15\) 番目と \(16\) 番目ですね。

\(15\) 番目と \(16\) 番目はともに \(20\) 以上 \(30\) 未満の階級に属しています。

よって、この階級の階級値、\(\color{red}{25}\) が中央値となります。

補足

もし中央に位置する \(2\) つが異なる階級に属している場合は、その \(2\) つの階級値の平均が中央値となります。

 

最後に最頻値です。

度数分布表より、最も多いのは度数が \(9\) の階級(\(40\) 以上 \(50\) 未満)です。

よって最頻値は、その階級値である \(\color{red}{45}\) と求められます。

答えをまとめると次の通りです。

答え:

平均値 \(\color{red}{25.6}\)

中央値 \(\color{red}{25}\)

最頻値 \(\color{red}{45}\)

 

度数分布の練習問題

それでは、最後に度数分布の練習問題を解いていきましょう!

練習問題「表、多角形の作成と代表値」

練習問題

次のデータは、あるクラス \(26\) 人の握力の測定値(\(\mathrm{kg}\))である。このデータについて、以下の問いに答えなさい。

\(12\), \(15\), \(17\), \(18\), \(19\), \(20\), \(21\), \(21\), \(22\), \(22\), \(22\), \(23\), \(24\), \(24\), \(25\), \(25\), \(26\), \(27\), \(27\), \(28\), \(30\), \(33\), \(35\), \(36\), \(40\), \(48\)

 

(1) 度数分布表を作りなさい。ただし、階級は \(10\) から始め、階級の幅は \(5\) とする。

(2) 度数分布多角形を作りなさい。

(3) 階級値から平均値、中央値、最頻値を求めなさい。ただし、小数第一位までとする。

 

まずはデータの値を階級ごとに分けて、正確な度数分布表を作りましょう。

今回は、階級が「握力(\(\mathrm{kg}\))」、度数は「人数(人)」ですね。

解答

 

(1) データを階級ごとに分けていくと、

\(12\),/ \(15\), \(17\), \(18\), \(19\),/ \(20\), \(21\), \(21\), \(22\), \(22\), \(22\), \(23\), \(24\), \(24\),/ \(25\), \(25\), \(26\), \(27\), \(27\), \(28\),/ \(30\), \(33\),/ \(35\), \(36\),/ \(40\),/ \(48\)

 

よって、これらをまとめていくと、

答え:

握力(kg) 人数(人)
\(10\) 以上 \(15\) 未満 \(1\)
\(15\) 以上 \(20\) 未満 \(4\)
\(20\) 以上 \(25\) 未満 \(9\)
\(25\) 以上 \(30\) 未満 \(6\)
\(30\) 以上 \(35\) 未満 \(2\)
\(35\) 以上 \(40\) 未満 \(2\)
\(40\) 以上 \(45\) 未満 \(1\)
\(45\) 以上 \(50\) 未満 \(1\)
合計 \(26\)

 

 

(2) 度数分布表を元に度数分布多角形を作成すると、

答え:

 

 

(3) 度数分布表を元に階級値をとると

握力(kg) 階級値(kg) 人数(人)
\(10\) 以上 \(15\) 未満 \(12.5\) \(1\)
\(15\) 以上 \(20\) 未満 \(17.5\) \(4\)
\(20\) 以上 \(25\) 未満 \(22.5\) \(9\)
\(25\) 以上 \(30\) 未満 \(27.5\) \(6\)
\(30\) 以上 \(35\) 未満 \(32.5\) \(2\)
\(35\) 以上 \(40\) 未満 \(37.5\) \(2\)
\(40\) 以上 \(45\) 未満 \(42.5\) \(1\)
\(45\) 以上 \(50\) 未満 \(47.5\) \(1\)
合計 \(26\)

 

平均値は、

\(\{(12.5 \cdot 1) + (17.5 \cdot 4) + (22.5 \cdot 9) \) \( +\ (27.5 \cdot 6) + (32.5 \cdot 2) + (37.5 \cdot 2) \) \(+ \ (42.5 \cdot 1) + (47.5 \cdot 1)\} \div 26\)

 

\(= (12.5 + 70 + 202.5 + 165 + 65 \) \( + \ 75 + 42.5 + 47.5) \div 26\)

 

\(= 660 \div 26\)

 

\(= 25.3846\cdots\)

 

\(≒ 25.4\)

 

 

また、人数の合計は \(26\) 人で、握力の強さが \(13\) 番目と \(14\) 番目の人は「\(20\) 以上 \(25\) 未満」の階級に属する。

よって、中央値は \(22.5 \ \mathrm{kg}\)。

 

さらに、最も人数の多い握力値は \(22 \ \mathrm{kg}\)(\(3\) 人)であるから、

最頻値は \(22 \ \mathrm{kg}\)。

 

答え:

平均値 \(\color{red}{25.4 \ \mathrm{kg}}\)、中央値 \(\color{red}{22.5 \ \mathrm{kg}}\)、最頻値 \(\color{red}{22 \ \mathrm{kg}}\)

以上で練習問題も終わりです!

 

度数分布について理解が深まりましたか?

用語の意味をきちんと理解することが大切です。必ずマスターしておきましょうね!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です