確率密度関数とは？連続型確率変数の期待値・分散の求め方

※本ページは広告を含む場合がございます

この記事では、「確率密度関数」についてわかりやすく解説します。

確率密度関数を用いた連続型確率変数の期待値・分散などの求め方も説明しますので、ぜひこの記事を通してマスターしてくださいね！

確率密度関数とは？
確率密度関数の性質
連続型確率変数の期待値・分散・標準偏差の公式
確率密度関数の計算問題
- 計算問題①「\(f(x)\) を使った確率の求め方」
- 計算問題②「\(f(x)\) の定数と期待値・分散・標準偏差を求める」

確率密度関数とは？

連続型確率変数 \(X\) の確率分布をある曲線 \(y = f(x)\) に対応させることができるとき、この曲線 \(y = f(x)\) を \(\bf{X}\) の分布曲線といい、関数 \(f(x)\) を確率密度関数といいます。

補足

確率変数には、「離散型」と「連続型」の \(2\) 通りがあります。

離散型確率分布は棒グラフで表現されます。

確率分布・確率変数とは？公式や求め方をわかりやすく解説！

確率密度関数のグラフ

確率密度関数 \(y = f(x)\) を座標平面に表したとき、横軸 \(x\) は確率変数 \(X\) の値を、縦軸 \(y\) は確率密度 \(f(x)\) を表します。

このとき、縦軸が「確率密度」であって「確率」ではないことに注意しましょう。

確率密度とは？

確率密度は、確率変数 \(X\) の微小な範囲の幅 \(\Delta x\) あたりの確率を表していて、

\(\text{確率密度} \ f(x) \times \text{幅} \ \Delta x\) \(= \text{確率} \ P(x \leq X \leq x + \Delta x)\)

という関係にあります。

つまり、連続型確率分布では、高さと幅、すなわち面積が確率を表すのです。

ですので、\(y\) 軸の高さの大小には注目しても、その数値自体にはそれほど注目しなくてよいのです。

確率変数 \(X = a\) のときの \(y\) 軸の値が \(f(a) = 0.231\) だったとして、その数値自体をどうこう議論する意味はありません。

一方で、確率変数 \(X\) がとる値 \(a\), \(b\) における高さを見比べて、「\(b\) 付近よりも \(a\) 付近の値をとる確率の方が大きそうだ」と相対的かつ定性的に比較することはできますね。

補足

連続型確率分布では、確率変数 \(X\) が特定の値にドンピシャになるときの確率は考えません（厳密にいうと、ドンピシャになる確率は限りなく小さい）。

例えば、「身長が \(162 \ \mathrm{cm}\) の人の割合を調べる」としても、実際は「測定機器の性能や測定者の目視判断に従って \(162 \ \mathrm{cm}\) と計測された人の割合」を調べます。

つまり、「ちょうどピッタリ \(162.00000\cdots \mathrm{cm}\) の人の割合」を調べているわけではなく、\(161.5\) ~ \(162.4 \ \mathrm{cm}\) なり、\(161.95\) ~ \(162.04 \ \mathrm{cm}\) なりの幅に収まる人の割合を調べているのですね。

連続型確率分布では「確率 = 面積」！

このように、連続型確率分布ではグラフ（分布曲線）の高さを見るだけではダメで、面積を計算することで確率が求められます。

離散型確率分布とは縦軸の捉え方が異なるので、違いをしっかり理解しておきましょう。

さて、曲線下の面積はどのように求められたでしょうか？

そう、曲線を表す関数を定積分すればよいですね！

確率密度関数の性質

それでは、確率密度関数の性質を説明していきます。

確率密度関数の性質

実数のある区間全体に値をとる連続型確率変数 \(X\) の分布が確率密度関数 \(f(x)\) と対応するとき、次の性質が成り立つ。

常に \(f(x) \geq 0\)
\(P(a \leq X \leq b) = \displaystyle \int_a^b f(x) \ dx\)
\(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\) のとき \(\displaystyle \int_\alpha^\beta f(x) \ dx = 1\)

連続型確率分布における確率は、定積分で求められます。

これらは、確率分布の性質を式として表しただけです。離散型確率分布と比較すると次のように対応します。

連続型確率変数の期待値・分散・標準偏差の公式

連続型確率変数 \(X\) の期待値・分散・標準偏差は、確率密度関数 \(f(x)\) を利用して求められます。

連続型確率変数の期待値・分散・標準偏差

連続型確率変数 \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\)、確率密度関数が \(f(x)\) であるとき、

\(X\) の期待値
\begin{align}m = E(X) = \displaystyle \int_\alpha^\beta xf(x) \ dx\end{align}
\(X\) の分散
\begin{align}V(X) = \displaystyle \int_\alpha^\beta (x − m)^2 f(x) \ dx\end{align}
（または \(V(X) = E(X^2) − \{E(X)\}^2\) でもよい）
\(X\) の標準偏差
\begin{align}\sigma(X) = \sqrt{V(X)}\end{align}

期待値と分散の公式は、定義どおりの計算を定積分で表しただけと捉えてくださいね。

離散型確率分布の公式と比較すると、次のように対応します。

確率密度関数の計算問題

それでは、確率密度関数の計算問題に挑戦してみましょう。

計算問題①「\(f(x)\) を使った確率の求め方」

計算問題①

確率変数 \(X\) の確率密度関数が次の \(f(x)\) で与えられているとき、それぞれの確率を求めよ。

(1) \(f(x) = \left\{\begin{array}{l} x + 1 \ (−1 \leq x \leq 0)\\ 1 − x \ (0 \leq x \leq 1)\end{array}\right.\) のとき、\(P(−0.5 \leq x \leq 0.3)\)

(2) \(f(x) = \displaystyle \frac{3}{500} x(10 − x)\) のとき、\(P(3 \leq x \leq 7)\)

(1) のように \(f(x)\) が一次式程度の簡単な関数であれば、図示して図形の面積を考える方が簡単です。

そうでない場合は、積分を利用して面積を求めましょう。

解答

(1)

\(f(x) = \left\{\begin{array}{l} x + 1 \ (−1 \leq x \leq 0)\\ 1 − x \ (0 \leq x \leq 1)\end{array}\right.\) において、\(P(−0.5 \leq x \leq 0.3)\) は以下の図の斜線部の面積に等しい。

よって

\(P(−0.5 \leq x \leq 0.3)\)

\(= 1 − {P(−1 \leq x \leq −0.5) + P(0.3 \leq x \leq 1)}\)

\(= 1 − \displaystyle \frac{1}{2}(0.5 \cdot 0.5 + 0.7 \cdot 0.7)\)

\(= 1 − \displaystyle \frac{1}{2} \cdot 0.74\)

\(= 1 − 0.37\)

\(= 0.63\)

（見切れる場合は横へスクロール）

答え：　\(0.63\)

(2)

\(P(3 \leq x \leq 7)\)

\(= \displaystyle \int_3^7 f(x) \ dx\)

\(= \displaystyle \frac{3}{500} \int_3^7 x(10 − x) \ dx\)

\(= \displaystyle \frac{3}{500} \int_3^7 (10x − x^2) \ dx\)

\(= \displaystyle \frac{3}{500} \left[5x^2 − \displaystyle \frac{x^3}{3}\right]_3^7\)

\(= \displaystyle \frac{3}{500} \left\{5(7^2 − 3^2) − \displaystyle \frac{7^3 − 3^3}{3}\right\}\)

\(= \displaystyle \frac{3}{500} \left(200 − \displaystyle \frac{316}{3}\right)\)

\(= \displaystyle \frac{3}{500} \cdot \displaystyle \frac{284}{3}\)

\(= \displaystyle \frac{71}{125}\)

答え：　\(\displaystyle \frac{71}{125}\)

補足

定積分の計算に不安を覚える人は、この機会に復習しておきましょう。

定積分とは？計算・面積公式や求め方をわかりやすく解説！

計算問題②「\(f(x)\) の定数と期待値・分散・標準偏差を求める」

計算問題②

確率密度変数 \(X\) が次の \(f(x)\) で与えられているとき、定数 \(a\) の値を求めよ。

また、\(X\) の期待値および分散を求めよ。

\(f(x) = \left\{\begin{array}{l} ax(2 − x) \ (0 \leq x \leq 2)\\ 0 \ (x < 0, 2 < x)\end{array}\right.\)

\(f(x)\) 下の面積が \(1\) になることに着目して定数 \(a\) を求めましょう。

あとは、公式を利用して期待値と分散を求めるだけですね。

解答

\(0 \leq x \leq 2\) で \(f(x) = ax(2 − x) \geq 0\) より

\(a \geq 0\)

\(\begin{align}\displaystyle \int_0^2 f(x) \ dx &= \int_0^2 ax(2 − x) \ dx\\&= a \int_0^2 (2x − x^2) \ dx\\&= a \left[x^2 − \displaystyle \frac{x^3}{3} \right]_0^2\\&= a\left(4 − \displaystyle \frac{8}{3}\right)\\&= \displaystyle \frac{4}{3}a\end{align}\)

ここで、\(\displaystyle \int_0^2 f(x) \ dx = 1\) であるから

\(\displaystyle \frac{4}{3}a = 1\) すなわち \(a = \displaystyle \frac{3}{4}\)

これは \(a \geq 0\) を満たす。

また、\(X\) の期待値 \(E(X)\) および分散 \(V(X)\) は

\(\begin{align}E(X) &= \displaystyle \int_0^2 xf(x) \ dx\\&= \displaystyle \int_0^2 x \cdot \frac{3}{4}x(2 − x) \ dx\\&= \displaystyle \frac{3}{4} \int_0^2 (2x^2 − x^3) \ dx\\&= \displaystyle \frac{3}{4} \left[\frac{2x^3}{3} − \frac{x^4}{4} \right]_0^2\\&= \displaystyle \frac{3}{4} \left(\frac{16}{3} − 4 \right)\\&= \displaystyle \frac{3}{4} \cdot \frac{4}{3}\\&= 1\end{align}\)

\(\begin{align}V(X) &= \displaystyle \int_0^2 \{x − E(X)\}^2 f(x) \ dx\\&= \displaystyle \int_0^2 (x − 1)^2 \cdot \frac{3}{4}x(2 − x) \ dx\\&= \displaystyle \frac{3}{4}\int_0^2 (x^2 − 2x + 1)(2x − x^2) \ dx\\&= \displaystyle \frac{3}{4}\int_0^2 (−x^4 + 4x^3 − 5x^2 + 2x) \ dx\\&= \displaystyle \frac{3}{4}\left[−\frac{x^5}{5} + x^4 − \frac{5x^3}{3} + x^2 \right]_0^2\\&= \displaystyle \frac{3}{4}\left(−\frac{32}{5} + 16 − \frac{40}{3} + 4 \right)\\&= \displaystyle \frac{3}{4}\left(\frac{−96 − 200}{15} + 20\right)\\&= \displaystyle \frac{3}{4}\left(\frac{−296}{15} + \frac{300}{15}\right)\\&= \displaystyle \frac{3}{4} \cdot \frac{4}{15}\\&= \displaystyle \frac{1}{5}\end{align}\)

（見切れる場合は横へスクロール）

答え：　\(a = \displaystyle \frac{3}{4}\)、\(E(X) = 1\)、\(V(X) = \displaystyle \frac{1}{5}\)

以上で問題も終わりです！

確率分布の基本が理解できていれば、離散型でも連続型でも怖くありません。

確率密度関数を使った定積分の計算には慣れが大切なので、さまざまな問題を解きながらマスターしていってくださいね！

確率密度関数とは？連続型確率変数の期待値・分散の求め方