この記事では、「確率密度関数」についてわかりやすく解説します。
確率密度関数を用いた連続型確率変数の期待値・分散などの求め方も説明しますので、ぜひこの記事を通してマスターしてくださいね!
目次
確率密度関数とは?
連続型確率変数 \(X\) の確率分布をある曲線 \(y = f(x)\) に対応させることができるとき、この曲線 \(y = f(x)\) を \(\bf{X}\) の分布曲線といい、関数 \(f(x)\) を確率密度関数といいます。
確率密度関数のグラフ
確率密度関数 \(y = f(x)\) を座標平面に表したとき、横軸 \(x\) は確率変数 \(X\) の値を、縦軸 \(y\) は確率密度 \(f(x)\) を表します。
このとき、縦軸が「確率密度」であって「確率」ではないことに注意しましょう。
確率密度とは?
確率密度は、確率変数 \(X\) の微小な範囲の幅 \(\Delta x\) あたりの確率を表していて、
\(\text{確率密度} \ f(x) \times \text{幅} \ \Delta x\) \(= \text{確率} \ P(x \leq X \leq x + \Delta x)\)
という関係にあります。
つまり、連続型確率分布では、高さと幅、すなわち面積が確率を表すのです。
ですので、\(y\) 軸の高さの大小には注目しても、その数値自体にはそれほど注目しなくてよいのです。
確率変数 \(X = a\) のときの \(y\) 軸の値が \(f(a) = 0.231\) だったとして、その数値自体をどうこう議論する意味はありません。
一方で、確率変数 \(X\) がとる値 \(a\), \(b\) における高さを見比べて、「\(b\) 付近よりも \(a\) 付近の値をとる確率の方が大きそうだ」と相対的かつ定性的に比較することはできますね。
連続型確率分布では、確率変数 \(X\) が特定の値にドンピシャになるときの確率は考えません(厳密にいうと、ドンピシャになる確率は限りなく小さい)。
例えば、「身長が \(162 \ \mathrm{cm}\) の人の割合を調べる」としても、実際は「測定機器の性能や測定者の目視判断に従って \(162 \ \mathrm{cm}\) と計測された人の割合」を調べます。
つまり、「ちょうどピッタリ \(162.00000\cdots \mathrm{cm}\) の人の割合」を調べているわけではなく、\(161.5\) ~ \(162.4 \ \mathrm{cm}\) なり、\(161.95\) ~ \(162.04 \ \mathrm{cm}\) なりの幅に収まる人の割合を調べているのですね。
連続型確率分布では「確率 = 面積」!
このように、連続型確率分布ではグラフ(分布曲線)の高さを見るだけではダメで、面積を計算することで確率が求められます。
離散型確率分布とは縦軸の捉え方が異なるので、違いをしっかり理解しておきましょう。
さて、曲線下の面積はどのように求められたでしょうか?
そう、曲線を表す関数を定積分すればよいですね!
確率密度関数の性質
それでは、確率密度関数の性質を説明していきます。
実数のある区間全体に値をとる連続型確率変数 \(X\) の分布が確率密度関数 \(f(x)\) と対応するとき、次の性質が成り立つ。
- 常に \(f(x) \geq 0\)
- \(P(a \leq X \leq b) = \displaystyle \int_a^b f(x) \ dx\)
- \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\) のとき \(\displaystyle \int_\alpha^\beta f(x) \ dx = 1\)
連続型確率分布における確率は、定積分で求められます。
これらは、確率分布の性質を式として表しただけです。離散型確率分布と比較すると次のように対応します。
連続型確率変数の期待値・分散・標準偏差の公式
連続型確率変数 \(X\) の期待値・分散・標準偏差は、確率密度関数 \(f(x)\) を利用して求められます。
連続型確率変数 \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\)、確率密度関数が \(f(x)\) であるとき、
- \(X\) の期待値
\begin{align}m = E(X) = \displaystyle \int_\alpha^\beta xf(x) \ dx\end{align} - \(X\) の分散
\begin{align}V(X) = \displaystyle \int_\alpha^\beta (x − m)^2 f(x) \ dx\end{align}
(または \(V(X) = E(X^2) − \{E(X)\}^2\) でもよい) - \(X\) の標準偏差
\begin{align}\sigma(X) = \sqrt{V(X)}\end{align}
期待値と分散の公式は、定義どおりの計算を定積分で表しただけと捉えてくださいね。
離散型確率分布の公式と比較すると、次のように対応します。
確率密度関数の計算問題
それでは、確率密度関数の計算問題に挑戦してみましょう。
計算問題①「\(f(x)\) を使った確率の求め方」
確率変数 \(X\) の確率密度関数が次の \(f(x)\) で与えられているとき、それぞれの確率を求めよ。
(1) \(f(x) = \left\{\begin{array}{l} x + 1 \ (−1 \leq x \leq 0)\\ 1 − x \ (0 \leq x \leq 1)\end{array}\right.\) のとき、\(P(−0.5 \leq x \leq 0.3)\)
(2) \(f(x) = \displaystyle \frac{3}{500} x(10 − x)\) のとき、\(P(3 \leq x \leq 7)\)
(1) のように \(f(x)\) が一次式程度の簡単な関数であれば、図示して図形の面積を考える方が簡単です。
そうでない場合は、積分を利用して面積を求めましょう。
(1)
\(f(x) = \left\{\begin{array}{l} x + 1 \ (−1 \leq x \leq 0)\\ 1 − x \ (0 \leq x \leq 1)\end{array}\right.\) において、\(P(−0.5 \leq x \leq 0.3)\) は以下の図の斜線部の面積に等しい。
よって
\(P(−0.5 \leq x \leq 0.3)\)
\(= 1 − {P(−1 \leq x \leq −0.5) + P(0.3 \leq x \leq 1)}\)
\(= 1 − \displaystyle \frac{1}{2}(0.5 \cdot 0.5 + 0.7 \cdot 0.7)\)
\(= 1 − \displaystyle \frac{1}{2} \cdot 0.74\)
\(= 1 − 0.37\)
\(= 0.63\)
(見切れる場合は横へスクロール)
答え: \(0.63\)
(2)
\(P(3 \leq x \leq 7)\)
\(= \displaystyle \int_3^7 f(x) \ dx\)
\(= \displaystyle \frac{3}{500} \int_3^7 x(10 − x) \ dx\)
\(= \displaystyle \frac{3}{500} \int_3^7 (10x − x^2) \ dx\)
\(= \displaystyle \frac{3}{500} \left[5x^2 − \displaystyle \frac{x^3}{3}\right]_3^7\)
\(= \displaystyle \frac{3}{500} \left\{5(7^2 − 3^2) − \displaystyle \frac{7^3 − 3^3}{3}\right\}\)
\(= \displaystyle \frac{3}{500} \left(200 − \displaystyle \frac{316}{3}\right)\)
\(= \displaystyle \frac{3}{500} \cdot \displaystyle \frac{284}{3}\)
\(= \displaystyle \frac{71}{125}\)
答え: \(\displaystyle \frac{71}{125}\)
定積分の計算に不安を覚える人は、この機会に復習しておきましょう。
定積分とは?計算・面積公式や求め方をわかりやすく解説!
計算問題②「\(f(x)\) の定数と期待値・分散・標準偏差を求める」
確率密度変数 \(X\) が次の \(f(x)\) で与えられているとき、定数 \(a\) の値を求めよ。
また、\(X\) の期待値および分散を求めよ。
\(f(x) = \left\{\begin{array}{l} ax(2 − x) \ (0 \leq x \leq 2)\\ 0 \ (x < 0, 2 < x)\end{array}\right.\)
\(f(x)\) 下の面積が \(1\) になることに着目して定数 \(a\) を求めましょう。
あとは、公式を利用して期待値と分散を求めるだけですね。
\(0 \leq x \leq 2\) で \(f(x) = ax(2 − x) \geq 0\) より
\(a \geq 0\)
\(\begin{align}\displaystyle \int_0^2 f(x) \ dx &= \int_0^2 ax(2 − x) \ dx\\&= a \int_0^2 (2x − x^2) \ dx\\&= a \left[x^2 − \displaystyle \frac{x^3}{3} \right]_0^2\\&= a\left(4 − \displaystyle \frac{8}{3}\right)\\&= \displaystyle \frac{4}{3}a\end{align}\)
ここで、\(\displaystyle \int_0^2 f(x) \ dx = 1\) であるから
\(\displaystyle \frac{4}{3}a = 1\) すなわち \(a = \displaystyle \frac{3}{4}\)
これは \(a \geq 0\) を満たす。
また、\(X\) の期待値 \(E(X)\) および分散 \(V(X)\) は
\(\begin{align}E(X) &= \displaystyle \int_0^2 xf(x) \ dx\\&= \displaystyle \int_0^2 x \cdot \frac{3}{4}x(2 − x) \ dx\\&= \displaystyle \frac{3}{4} \int_0^2 (2x^2 − x^3) \ dx\\&= \displaystyle \frac{3}{4} \left[\frac{2x^3}{3} − \frac{x^4}{4} \right]_0^2\\&= \displaystyle \frac{3}{4} \left(\frac{16}{3} − 4 \right)\\&= \displaystyle \frac{3}{4} \cdot \frac{4}{3}\\&= 1\end{align}\)
\(\begin{align}V(X) &= \displaystyle \int_0^2 \{x − E(X)\}^2 f(x) \ dx\\&= \displaystyle \int_0^2 (x − 1)^2 \cdot \frac{3}{4}x(2 − x) \ dx\\&= \displaystyle \frac{3}{4}\int_0^2 (x^2 − 2x + 1)(2x − x^2) \ dx\\&= \displaystyle \frac{3}{4}\int_0^2 (−x^4 + 4x^3 − 5x^2 + 2x) \ dx\\&= \displaystyle \frac{3}{4}\left[−\frac{x^5}{5} + x^4 − \frac{5x^3}{3} + x^2 \right]_0^2\\&= \displaystyle \frac{3}{4}\left(−\frac{32}{5} + 16 − \frac{40}{3} + 4 \right)\\&= \displaystyle \frac{3}{4}\left(\frac{−96 − 200}{15} + 20\right)\\&= \displaystyle \frac{3}{4}\left(\frac{−296}{15} + \frac{300}{15}\right)\\&= \displaystyle \frac{3}{4} \cdot \frac{4}{15}\\&= \displaystyle \frac{1}{5}\end{align}\)
(見切れる場合は横へスクロール)
答え: \(a = \displaystyle \frac{3}{4}\)、\(E(X) = 1\)、\(V(X) = \displaystyle \frac{1}{5}\)
以上で問題も終わりです!
確率分布の基本が理解できていれば、離散型でも連続型でも怖くありません。
確率密度関数を使った定積分の計算には慣れが大切なので、さまざまな問題を解きながらマスターしていってくださいね!
「確率密度関数の性質」の図中の式の積分範囲が、ab逆になってないでしょうか?
コメントありがとうございます。返信が遅くなってしまい申し訳ありません。
該当部分を修正いたしました。
このようにご指摘いただけるととても助かります。
今後ともどうぞ当サイトをよろしくお願いいたします。