この記事では、「度数分布」についてわかりやすく解説していきます。
度数分布表や度数分布多角形の作り方、平均値・中央値・最頻値を問う問題も説明していくので、ぜひこの記事を通してマスターしてくださいね!
目次
度数分布とは?
度数分布とは、集めたデータをいくつかの区間に分けたとき、各区間にどのくらいの個数のデータが属するかを確認するものです。
度数分布の図表
度数分布を表すには、次のような図表を用います。
- 度数分布表
度数分布を表にまとめたもの - ヒストグラム
度数分布の階級を横軸、度数を縦軸にとって棒グラフで表したもの - 度数分布多角形
度数分布の階級値を横軸、度数を縦軸にとって折れ線グラフで表したもの(ヒストグラムの各棒グラフ上部の中点を結んでも作成できる)
こうした図表を作成することにより、データの分布が把握しやすくなります。
ヒストグラムは、データの分布状況を視覚的に把握するのに適しています。
一方、\(2\) セット以上のデータの度数分布を比較する際には、度数分布多角形を使うと比較しやすいです。
度数分布の階級・度数・幅・階級値
度数分布を表す上で、次の \(4\) つの用語を理解しておく必要があります。
- 階級:度数分布の \(1\) つの区間
- 度数:各階級に属するデータの個数
- 階級の幅:階級の値の範囲
- 階級値:各階級の中央値
具体例を見て用語の意味を確認しましょう。
次の度数分布表は、\(20\) 人のクラスで \(20\) 点満点の小テストの結果を表したものです。
テストの点数 | 人数 |
---|---|
\(0\) 以上 \(5\) 未満 | \(2\) |
\(5\) 以上 \(10\) 未満 | \(5\) |
\(10\) 以上 \(15\) 未満 | \(10\) |
\(15\) 以上 | \(3\) |
合計 | \(20\) |
このとき、
- 階級:テストの点数
- 度数:人数
- 階級の幅:\(5\)
- 階級値:上から \(2.5\), \(7.5\), \(12.5\), \(17.5\)
となっています。
度数分布表の作り方
次の例題を通して、度数分布表の作り方を説明します。
次のデータの度数分布表を作りなさい。
ただし、階級は \(10\) から始め、階級の幅は \(10\) とする。
\(11\), \(12\), \(18\), \(18\), \(20\), \(21\), \(25\), \(26\), \(31\), \(32\), \(34\), \(36\), \(37\), \(37\), \(39\), \(41\), \(44\), \(45\), \(46\), \(50\), \(51\), \(54\), \(55\), \(57\), \(57\)
まず、散らばっているデータを階級ごとに分類し、度数を数えていきます。
階級の幅は \(10\) と与えられていて、一番小さいデータは \(11\)、一番大きいデータは \(57\) なので、「\(10\) 以上 \(20\) 未満」〜「\(50\) 以上 \(60\) 未満」の階級を用意すればよいですね。
度数を数える際は問題部分にスラッシュなどを書き足すと抜け漏れを防げます。
\(11\), \(12\), \(18\), \(18\),/ \(20\), \(21\), \(25\), \(26\),/ \(31\), \(32\), \(34\), \(36\), \(37\), \(37\), \(39\)/, \(41\), \(44\), \(45\), \(46\)/, \(50\), \(51\), \(54\), \(55\), \(57\), \(57\)
- 階級が \(10\) 以上 \(20\) 未満
\(11\), \(12\), \(18\), \(18\) の計 \(4\) 個 - 階級が \(20\) 以上 \(30\) 未満
\(20\), \(21\), \(25\), \(26\) の計 \(4\) 個 - 階級が \(30\) 以上 \(40\) 未満
\(31\), \(32\), \(34\), \(36\), \(37\), \(37\), \(39\) の計 \(7\) 個 - 階級が \(40\) 以上 \(50\) 未満
\(41\), \(44\), \(45\), \(46\) の計 \(4\) 個 - 階級が \(50\) 以上 \(60\) 未満
\(50\), \(51\), \(54\), \(55\), \(57\), \(57\) の計 \(6\) 個
「以上」はその数を含み、「未満」はその数を含まないことに注意しましょう!
度数分布を書き込む表を用意します。階級列を左に、度数列を右に配置します。
STEP.1 で階級を \(5\) つ用意すればよいことがわかったので、タイトル行、\(5\) つのデータ行、合計行の計 \(7\) 行を作っておきましょう。
階級 | 度数 |
---|---|
合計 |
あとは、対応する階級と度数、そして度数の合計を表にまとめるだけです。
階級 | 度数 |
---|---|
\(10\) 以上 \(20\) 未満 | \(4\) |
\(20\) 以上 \(30\) 未満 | \(4\) |
\(30\) 以上 \(40\) 未満 | \(7\) |
\(40\) 以上 \(50\) 未満 | \(4\) |
\(50\) 以上 \(60\) 未満 | \(6\) |
合計 | \(25\) |
これで、度数分布表の完成です。
【補足】相対度数分布表
度数を、度数の合計に対する割合で表したものを「相対度数」といい、これを用いた表を「相対度数分布表」といいます。
また、低い階級から相対度数を足し上げたものを「累積相対度数」といいます。
階級 | 度数 | 相対度数 | 累積相対度数 |
\(10\) 以上 \(20\) 未満 | \(4\) | \(0.16\) | \(0.16\) |
\(20\) 以上 \(30\) 未満 | \(4\) | \(0.16\) | \(0.32\) |
\(30\) 以上 \(40\) 未満 | \(7\) | \(0.28\) | \(0.60\) |
\(40\) 以上 \(50\) 未満 | \(4\) | \(0.16\) | \(0.76\) |
\(50\) 以上 \(60\) 未満 | \(6\) | \(0.24\) | \(1\) |
合計 | \(25\) | \(1\) | \(1\) |
度数の合計は、\(1\) で表すこともあれば、\(100 \) % と百分率で表すこともあります。
相対度数についてもたまに聞かれることがあるので、覚えておきましょう!
度数分布表からヒストグラムの作図
ここでは、度数分布表からヒストグラムを作図する手順について解説していきます。
先ほどの例題で作成した度数分布表からヒストグラムを作図してみましょう。
次のデータのヒストグラムを作成せよ。
階級 | 度数 |
\(10\) 以上 \(20\) 未満 | \(4\) |
\(20\) 以上 \(30\) 未満 | \(4\) |
\(30\) 以上 \(40\) 未満 | \(7\) |
\(40\) 以上 \(50\) 未満 | \(4\) |
\(50\) 以上 \(60\) 未満 | \(6\) |
合計 | \(25\) |
まず、横軸に「階級」、縦軸に「度数」をとります。
次に、階級と度数の最大の値を考慮して目盛りをふっていきます。
今回、階級の上端は \(60\) なので横軸は \(60\) 以上、最も多い度数は \(7\) なので縦軸は \(7\) 以上の目盛りをとるとよいでしょう。
そして、それぞれの階級の中央あたりに度数の値の点を打っていきます。
度数は一番下の階級(\(10\) 以上 \(20\) 未満)から順に、\(4\), \(4\), \(7\), \(4\), \(6\) ですね。
最後に、それらの点を上辺とした長方形を書いていきます。
これでヒストグラムの完成です!
ヒストグラムについて、より詳しく解説しています。
ヒストグラムとは?書き方(階級や幅の決め方)を解説
度数分布表から度数分布多角形の作図
同じ例題で、度数分布表から度数分布多角形を作図する手順を説明します。
次のデータの度数分布多角形を作成せよ。
階級 | 度数 |
\(10\) 以上 \(20\) 未満 | \(4\) |
\(20\) 以上 \(30\) 未満 | \(4\) |
\(30\) 以上 \(40\) 未満 | \(7\) |
\(40\) 以上 \(50\) 未満 | \(4\) |
\(50\) 以上 \(60\) 未満 | \(6\) |
合計 | \(25\) |
度数分布多角形は、階級値(階級の中央の値)に対する度数を表す折れ線グラフでしたね。
まずは階級値を求めます。度数分布表に階級値の列を追加しましょう。
階級 | 階級値 | 度数 |
---|---|---|
\(10\) 以上 \(20\) 未満 | \(15\) | \(4\) |
\(20\) 以上 \(30\) 未満 | \(25\) | \(4\) |
\(30\) 以上 \(40\) 未満 | \(35\) | \(7\) |
\(40\) 以上 \(50\) 未満 | \(45\) | \(4\) |
\(50\) 以上 \(60\) 未満 | \(55\) | \(6\) |
合計 | − | \(25\) |
この表を元に、度数分布多角形を作図します。
横軸に階級、縦軸に度数をとります。
階級と度数の最大値を考慮して目盛りをふります。
そして、階級値に対する度数の点を打っていきます。
今回の \((\text{階級値}, \text{度数})\) は \((15, 4)\), \((25, 4)\), \((35, 7)\), \((45, 4)\), \((55, 6)\) ですね。
次に、それらの点を直線で結びます。
これで完成ではありません。
度数分布多角形では、折れ線の両端が横軸に交わるのがルールです。
存在している階級値の外にさらに階級値があり、その度数が \(0\) であるととらえ、両端に点を書き足します。
そして、そこへ直線を伸ばしましょう。
これで度数分布多角形の完成です!
いかがでしたか?
最後に横軸と折れ線グラフを交わらせることを忘れないようにしましょう!
度数分布表からの代表値の求め方
度数分布表から各代表値(平均値・中央値・最頻値)を求める方法を解説していきます。
通常の代表値の求め方については、以下の記事で詳しく説明しています。
平均値・中央値・最頻値の違い!求め方、使い分け、計算問題度数分布表における平均値
平均値は、すべてのデータの値を足してデータの個数で割った値ですが、度数分布表からは具体的な個々のデータの値がわかりません。
そこで、個々のデータの値は階級値に等しいと仮定して合計を算出し、それを度数の合計(データ個数)で割ることによって求めます。
\begin{align}\color{red}{\displaystyle \text{平均値} = \frac{\text{(階級値) $\times$ (度数) の合計}}{\text{度数の合計}}}\end{align}
次の度数分布表から平均値を求めなさい(小数第一位まで)。
階級 | 度数 |
\(0\) 以上 \(10\) 未満 | \(7\) |
\(10\) 以上 \(20\) 未満 | \(5\) |
\(20\) 以上 \(30\) 未満 | \(6\) |
\(30\) 以上 \(40\) 未満 | \(3\) |
\(40\) 以上 \(50\) 未満 | \(9\) |
合計 | \(30\) |
度数分布表に階級値を追加します。
平均値を求めるには、階級値と度数をかけ合わせたものを足して、度数の合計 \(30\) で割ります。
各階級の階級値は次のとおり。
階級 | 階級値 | 度数 |
\(0\) 以上 \(10\) 未満 | \(5\) | \(7\) |
\(10\) 以上 \(20\) 未満 | \(15\) | \(5\) |
\(20\) 以上 \(30\) 未満 | \(25\) | \(6\) |
\(30\) 以上 \(40\) 未満 | \(35\) | \(3\) |
\(40\) 以上 \(50\) 未満 | \(45\) | \(9\) |
合計 | - | \(30\) |
求める平均値は、
\(\displaystyle \frac{5 \cdot 7 + 15 \cdot 5 + 25 \cdot 6 + 35 \cdot 3 + 45 \cdot 9}{30}\)
\(= \displaystyle \frac{770}{30}\)
\(= 25.666\cdots\)
\(≒ 25.6\)
答え: 平均値 \(\color{red}{25.6}\)
度数分布表における中央値
中央値は、データを大きさ順に並べたときにちょうど真ん中にくる値です。
度数分布表においては、ちょうど真ん中の値が属する階級の階級値を中央値とします。
\(n\) 個のデータがあるとき、中央値は以下の通り。
- \(n\) が奇数の場合
大きさが \(\color{red}{\displaystyle \frac{n + 1}{2}}\) 番目のデータが属する階級の階級値。 - \(n\) が偶数の場合
大きさが \(\color{red}{\displaystyle \frac{n}{2}}\) 番目と \(\color{red}{\displaystyle \frac{n}{2} + 1}\) 番目のデータが属する階級の階級値。
次の度数分布表から中央値を求めなさい。
階級 | 度数 |
\(0\) 以上 \(10\) 未満 | \(7\) |
\(10\) 以上 \(20\) 未満 | \(5\) |
\(20\) 以上 \(30\) 未満 | \(6\) |
\(30\) 以上 \(40\) 未満 | \(3\) |
\(40\) 以上 \(50\) 未満 | \(9\) |
合計 | \(30\) |
度数分布表に階級値を追加します。
度数を数えて真ん中にあるデータの階級値が中央値です。
各階級の階級値は次のとおり。
階級 | 階級値 | 度数 |
\(0\) 以上 \(10\) 未満 | \(5\) | \(7\) |
\(10\) 以上 \(20\) 未満 | \(15\) | \(5\) |
\(20\) 以上 \(30\) 未満 | \(25\) | \(6\) |
\(30\) 以上 \(40\) 未満 | \(35\) | \(3\) |
\(40\) 以上 \(50\) 未満 | \(45\) | \(9\) |
合計 | - | \(30\) |
度数の合計が \(30\) と偶数なので、真ん中にくるデータは \(15\) 番目と \(16\) 番目である。
\(15\) 番目と \(16\) 番目はともに \(20\) 以上 \(30\) 未満の階級に属しているから、
中央値は \(25\)
答え: 中央値 \(\color{red}{25}\)
もし中央に位置する \(2\) つが異なる階級に属している場合は、その \(2\) つの階級値の平均が中央値となります。
度数分布表における最頻値
最頻値は、データの中で最も頻繁に出てくる値です。
度数分布表から求める場合は、度数が最も多い階級の階級値が最頻値となります。
最頻値は、度数が最も多い階級の階級値。
次の度数分布表から最頻値を求めなさい。
階級 | 度数 |
\(0\) 以上 \(10\) 未満 | \(7\) |
\(10\) 以上 \(20\) 未満 | \(5\) |
\(20\) 以上 \(30\) 未満 | \(6\) |
\(30\) 以上 \(40\) 未満 | \(3\) |
\(40\) 以上 \(50\) 未満 | \(9\) |
合計 | \(30\) |
度数分布表に階級値を追加します。
度数が最も多い階級を見つけ、その階級値を答えましょう。
各階級の階級値は次のとおり。
階級 | 階級値 | 度数 |
\(0\) 以上 \(10\) 未満 | \(5\) | \(7\) |
\(10\) 以上 \(20\) 未満 | \(15\) | \(5\) |
\(20\) 以上 \(30\) 未満 | \(25\) | \(6\) |
\(30\) 以上 \(40\) 未満 | \(35\) | \(3\) |
\(40\) 以上 \(50\) 未満 | \(45\) | \(9\) |
合計 | - | \(30\) |
度数分布表より、最も多いのは度数が \(9\) である \(40\) 以上 \(50\) 未満の階級であるから、
最頻値は、その階級値 \(45\)
答え: 最頻値 \(\color{red}{45}\)
度数分布の練習問題
最後に度数分布の練習問題に挑戦しましょう。
練習問題「度数分布表、多角形の作成と代表値」
次のデータは、あるクラス \(26\) 人の握力の測定値(\(\mathrm{kg}\))である。このデータについて、以下の問いに答えなさい。
\(12\), \(15\), \(17\), \(18\), \(19\), \(20\), \(21\), \(21\), \(22\), \(22\), \(22\), \(23\), \(24\), \(24\), \(25\), \(25\), \(26\), \(27\), \(27\), \(28\), \(30\), \(33\), \(35\), \(36\), \(40\), \(48\)
(1) 度数分布表を作りなさい。ただし、階級は \(10\) から始め、階級の幅は \(5\) とする。
(2) 度数分布多角形を作りなさい。
(3) 階級値から平均値、中央値、最頻値を求めなさい。ただし、小数第一位までとする。
まずはデータの値を階級ごとに分けて、正確な度数分布表を作りましょう。
今回は、階級が「握力(\(\mathrm{kg}\))」、度数は「人数(人)」ですね。
(1)
データを階級ごとに分けていくと、
\(12\),/ \(15\), \(17\), \(18\), \(19\),/ \(20\), \(21\), \(21\), \(22\), \(22\), \(22\), \(23\), \(24\), \(24\),/ \(25\), \(25\), \(26\), \(27\), \(27\), \(28\),/ \(30\), \(33\),/ \(35\), \(36\),/ \(40\),/ \(48\)
よって、度数分布表は次のとおり。
答え:
握力(kg) | 人数(人) |
---|---|
\(10\) 以上 \(15\) 未満 | \(1\) |
\(15\) 以上 \(20\) 未満 | \(4\) |
\(20\) 以上 \(25\) 未満 | \(9\) |
\(25\) 以上 \(30\) 未満 | \(6\) |
\(30\) 以上 \(35\) 未満 | \(2\) |
\(35\) 以上 \(40\) 未満 | \(2\) |
\(40\) 以上 \(45\) 未満 | \(1\) |
\(45\) 以上 \(50\) 未満 | \(1\) |
合計 | \(26\) |
(2)
度数分布表を元に度数分布多角形を作成すると次のとおり。
答え:
(3)
度数分布表を元に階級値をとると、
握力(kg) | 階級値(kg) | 人数(人) |
---|---|---|
\(10\) 以上 \(15\) 未満 | \(12.5\) | \(1\) |
\(15\) 以上 \(20\) 未満 | \(17.5\) | \(4\) |
\(20\) 以上 \(25\) 未満 | \(22.5\) | \(9\) |
\(25\) 以上 \(30\) 未満 | \(27.5\) | \(6\) |
\(30\) 以上 \(35\) 未満 | \(32.5\) | \(2\) |
\(35\) 以上 \(40\) 未満 | \(37.5\) | \(2\) |
\(40\) 以上 \(45\) 未満 | \(42.5\) | \(1\) |
\(45\) 以上 \(50\) 未満 | \(47.5\) | \(1\) |
合計 | − | \(26\) |
平均値は、
\(\{(12.5 \cdot 1) + (17.5 \cdot 4) + (22.5 \cdot 9) \) \( +\ (27.5 \cdot 6) + (32.5 \cdot 2) + (37.5 \cdot 2) \) \(+ \ (42.5 \cdot 1) + (47.5 \cdot 1)\} \div 26\)
\(= (12.5 + 70 + 202.5 + 165 + 65 \) \( + \ 75 + 42.5 + 47.5) \div 26\)
\(= 660 \div 26\)
\(= 25.3846\cdots\)
\(≒ 25.4\)
また、人数の合計は \(26\) 人で、握力の強さが \(13\) 番目と \(14\) 番目の人は「\(20\) 以上 \(25\) 未満」の階級に属する。
よって、中央値は \(22.5 \ \mathrm{kg}\)。
さらに、最も人数が多い階級は「\(20\) 以上 \(25\) 未満」である(\(9\) 人)。
最頻値はこの階級の階級値であるから、\(22.5 \ \mathrm{kg}\)。
答え:
平均値 \(\color{red}{25.4 \ \mathrm{kg}}\)、中央値 \(\color{red}{22.5 \ \mathrm{kg}}\)、最頻値 \(\color{red}{22.5 \ \mathrm{kg}}\)
以上で練習問題も終わりです!
度数分布について理解が深まりましたか?
用語の意味をきちんと理解することが大切です。必ずマスターしておきましょうね!