確率分布と統計的な推測に関する公式をまとめています。
詳細記事へのリンクも載せていますので、気になる問題や解き方があればぜひそちらを参考にしてくださいね!
目次
確率分布
確率分布に関する公式をまとめました。
詳しくは、以下の記事で説明しています。
確率分布・確率変数とは?公式や求め方をわかりやすく解説!
確率変数と確率分布
- 確率変数
ある試行の結果によってその値が定まり、各値に対応して確率が定まるような変数 - 確率分布(分布)
確率変数 \(X\) のとりうる値と、その値をとる確率 \(P\) との対応関係
確率分布の性質
\(P(X = x_k) = p_k (k = 1, 2, 3, \cdots, n)\) であるとき、次が成り立つ。
- 確率は負の値をとらない
\(p_k \geq 0\) - 確率の和は必ず \(1\) になる
\(\displaystyle \sum_{k = 1}^n p_k = p_1 + p_2 + \cdots + p_n = 1\)
確率変数 \(X\) の期待値・分散・標準偏差
確率変数 \(X\) が \(P(X = x_k) = p_k\) \((k = 1, 2, 3, \cdots, n)\) を満たすとき、
- \(X\) の期待値
\(\begin{align}E(X) = m &= \sum_{k = 1}^n x_kp_k \\&= x_1p_1 + x_2p_2 + \cdots + x_np_n\end{align}\) - \(X\) の分散
\(\begin{align}V(X) &= E((X − m)^2) \\&= \sum_{k = 1}^n (x_k − m)^2p_k \\&= (x_1 − m)^2p_1 + (x_2 − m)^2p_2 + \cdots + (x_n − m)^2p_n\end{align}\)
または
\(V(X) = E(X^2) − \{E(X)\}^2\) - \(X\) の標準偏差
\(\sigma(X) = \sqrt{V(X)}\)
(見切れる場合は横へスクロール)
確率変数 \(aX + b\) の期待値・分散・標準偏差
\(X\) を確率変数、\(a\), \(b\) を定数(ただし \(a \neq 0\), \(b \neq 0\))とする。
- \(aX + b\) の期待値(平均)
\begin{align}E(aX + b) = aE(x) + b\end{align} - \(aX + b\) の分散
\begin{align}V(aX + b) = a^2V(x)\end{align} - \(aX + b\) の標準偏差
\begin{align}\sigma(aX + b) = |a|\sigma(x)\end{align}
確率変数の和と積の期待値・分散
\(X\), \(Y\) を確率変数、\(a\), \(b\) を定数(ただし \(a \neq 0\), \(b \neq 0\))とする。
- 和の期待値
\(\begin{align}E(X + Y) = E(X) + E(Y)\end{align}\) - 一次式の期待値
\(\begin{align}E(aX + bY) = aE(X) + bE(Y)\end{align}\) - 積の期待値
\(X\) と \(Y\) が互いに独立ならば
\(\begin{align}E(XY) = E(X)E(Y)\end{align}\) - 和の分散
\(X\) と \(Y\) が互いに独立ならば
\(\begin{align}V(X + Y) = V(X) + V(Y)\end{align}\) - 一次式の分散
\(X\) と \(Y\) が互いに独立ならば
\(\begin{align}V(aX + bY) = a^2V(X) + b^2V(Y)\end{align}\)
連続型確率変数と確率密度関数
連続型確率変数と確率密度関数に関する公式をまとめました。
詳しくは、以下の記事で説明しています。
確率密度関数とは?連続型確率変数の期待値・分散の求め方
確率密度関数
実数のある区間全体に値をとる連続型確率変数 \(X\) の分布が確率密度関数 \(f(x)\) と対応するとき、次の性質が成り立つ。
- 常に \(f(x) \geq 0\)
- \(P(a \leq X \leq b) = \displaystyle \int_a^b f(x) \ dx\)
- \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\) のとき
\(\displaystyle \int_\alpha^\beta f(x) \ dx = 1\)
連続型確率変数の期待値・分散・標準偏差
連続型確率変数 \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\)、確率密度関数が \(f(x)\) であるとき、
- \(X\) の期待値
\begin{align}m = E(X) = \displaystyle \int_\alpha^\beta xf(x) \ dx\end{align} - \(X\) の分散
\begin{align}V(X) = \displaystyle \int_\alpha^\beta (x − m)^2 f(x) \ dx\end{align} - \(X\) の標準偏差
\begin{align}\sigma(X) = \sqrt{V(X)}\end{align}
二項分布
二項分布に関する公式を以下にまとめました。
詳しくは、以下の記事で説明しています。
二項分布とは?期待値・分散の計算や、正規分布による近似
二項分布の定義
ある試行で事象 \(A\) が起こる確率を \(p\)、起こらない確率を \(q = (1 − p)\) とする。
この試行を \(n\) 回行う反復試行において、事象 \(A\) が起こる回数を \(X\) とすると、\(X\) は確率変数であり、その確率分布を二項分布といい、\(B(n, p)\) で表す。
二項分布に従う確率変数 \(X\) の期待値・分散・標準偏差
確率変数 \(X\) が二項分布 \(B(n, p)\) に従うとき、
- \(X\) の期待値 \(E(X) = np\)
- \(X\) の分散 \(V(X) = npq\)
- \(X\) の標準偏差 \(\sigma(X) = \sqrt{npq}\)
(ただし、\(q = 1 − p\))
二項分布の正規分布による近似
二項分布 \(B(n, p)\) に従う確率変数 \(X\) は、\(n\) が十分に大きいとき、近似的に正規分布 \(N(np, npq)\) に従う。
さらに、\(Z = \displaystyle \frac{X − np}{\sqrt{npq}}\) とおくと、\(Z\) は標準正規分布 \(N(0, 1)\) に従う。
正規分布
正規分布に関する公式をまとめました。
詳しくは、以下の記事で説明しています。
正規分布とは?表の見方や計算問題をわかりやすく解説!
正規分布の定義
連続型確率変数 \(X\) の期待値(平均)を \(m\)、分散を \(\sigma^2\)、標準偏差 \(\sigma\) とする。(\(m\) は実数、\(\sigma\) は正の実数)
\(X\) の確率密度関数 \(f(x)\) が
\begin{align}f(x) = \displaystyle \frac{1}{\sqrt{2\pi}\sigma}e^{− \frac{(x − m)^2}{2\sigma^2}}\end{align}
で与えられているとき、\(X\) は正規分布 \(N(m, \sigma^2)\) に従うという。
標準正規分布の定義
正規分布 \(N(0, 1)\) を標準正規分布という。
\(N(0, 1)\) に従う連続型確率変数 \(Z\) の確率密度関数 \(f(z)\) は
\begin{align}f(z) = \displaystyle \frac{1}{\sqrt{2\pi}}e^{− \displaystyle \frac{z^2}{2}}\end{align}
正規分布の標準化
確率変数 \(X\) が正規分布 \(N(m, \sigma^2)\) に従うとき、
\begin{align}Z = \displaystyle \frac{X − m}{\sigma}\end{align}
とおくと、確率変数 \(Z\) は標準正規分布 \(N(0, 1)\) に従う。
統計的な調査
統計的な調査に関する用語・公式をまとめました。
詳しくは、以下の記事で説明しています。
母集団と標本とは?統計調査の意味や求め方をわかりやすく解説!
統計的な調査の用語
調査方法
- 全数調査:対象全体のすべてのデータを集め、調べる
- 標本調査:対象の一部のデータを抜き出して、調べる
母集団と標本
- 母集団:調査の対象全体
- 個体:母集団に属する個々の対象
- 母集団の大きさ:個体の総数
- 標本:調査のため母集団から抜き出された個体の集合
- 標本の大きさ:標本に属する個体の数
標本の抽出
- 抽出:母集団から標本を抜き出すこと
- 無作為抽出:母集団の各個体を等しい確率で抽出する方法(乱数表、乱数さいなどを用いる)
- 無作為標本:無作為抽出によって選ばれた標本
- 復元抽出:母集団から標本を抽出する際、毎回もとに戻しながら \(1\) 個ずつ抽出すること
- 非復元抽出:母集団から標本を抽出する際、もとに戻さず抽出し続けること
母集団分布
- 特性:調査の対象である特定の性質(身長、時間など)
- 変量:ある特性を表す数量
- 母集団分布:母集団における変量 \(x\) の分布
- 母平均 \(m\):母集団における変量 \(x\) の平均値
- 母標準偏差 \(\sigma\):母集団における変量 \(x\) の標準偏差
標本平均
母集団から無作為抽出した大きさ \(n\) の標本の変量 \(x\) の値を \(X_1, X_2, \cdots, X_n\) とするとき、標本平均 \(\overline{X}\) は
\begin{align}\overline{X} = \displaystyle \frac{X_1 + X_2 + \cdots + X_n}{n}\end{align}
\(\overline{X}\) は、抽出される標本によって変化する確率変数である。
母平均 \(m\)、母標準偏差 \(\sigma\) の母集団から大きさ \(n\) の無作為標本を抽出するとき、その標本平均を \(\overline{X}\) とすると
- \(\overline{X}\) の期待値
\begin{align}E(\overline{X}) = m\end{align} - \(\overline{X}\) の分散
\begin{align}V(\overline{X}) = \displaystyle \frac{\sigma^2}{n}\end{align} - \(\overline{X}\) の標準偏差
\begin{align}\sigma(\overline{X}) = \displaystyle \frac{\sigma}{\sqrt{n}}\end{align}
標本平均の分布(中心極限定理)
母平均 \(m\)、母標準偏差 \(\sigma\) の母集団から無作為抽出された大きさ \(n\) の標本について、標本平均 \(\overline{X}\) の分布は、\(n\) が大きいとき、近似的に正規分布 \(N\left(m, \displaystyle \frac{\sigma^2}{n}\right)\) に従う。
すなわち、
確率変数 \(Z = \displaystyle \frac{\overline{X} − m}{\displaystyle \frac{\sigma}{\sqrt{n}}}\)
は近似的に標準正規分布 \(N(0, 1)\) に従う。
大数の法則
母平均 \(m\) の母集団から大きさ \(n\) の無作為標本を抽出するとき、\(n\) が大きくなるに従い、その標本平均 \(\overline{X}\) は母平均 \(m\) に近づく。
標本比率
母集団の中で、ある特性 \(A\) をもつ個体の割合 \(p\) を「特性 \(A\) の母比率」という。
一方、抽出された標本の中で特性 \(A\) をもつ個体の割合 \(R\) を「特性 \(A\) の標本比率」という。
大きさ \(n\) の標本の中で特性 \(A\) をもつ個体数を \(X\) とおくと、
\begin{align}R = \displaystyle \frac{X}{n}\end{align}
標本比率の分布(中心極限定理)
特性 \(A\) の母比率が \(p\) である母集団から大きさ \(n\) の標本を無作為抽出するとき、特性 \(A\) の標本比率 \(R\) は、\(n\) が大きいとき、近似的に正規分布 \(N\left(p, \displaystyle \frac{p(1 − p)}{n}\right)\) に従うとみなせる。
統計的な推測
統計的な推測に関する公式をまとめました。
詳しくは、以下の記事で説明しています。
信頼区間とは?母平均・母比率の推定の公式や問題の解き方
母平均の推定
母平均 \(m\)、母標準偏差 \(\sigma\) の母集団から抽出された大きさ \(n\) の無作為標本の標本平均 \(\overline{X}\) から、母平均 \(m\) を信頼度 \(95 \) % で推定することを考える。
\(n\) が大きいとき、母平均 \(m\) に対する信頼度 \(95\) % の信頼区間は
\begin{align}\left[\overline{X} − 1.96 \cdot \displaystyle \frac{\sigma}{\sqrt{n}}, \overline{X} + 1.96 \cdot \displaystyle \frac{\sigma}{\sqrt{n}} \right]\end{align}
母比率の推定
ある特性の母比率 \(p\) の母集団から抽出された大きさ \(n\) の無作為標本の標本比率 \(R\) から、母比率 \(p\) を信頼度 \(95\) % で推定することを考える。
\(n\) が大きいとき、母比率 \(p\) に対する信頼度 \(95\) % の信頼区間は
\begin{align}\left[R − 1.96 \cdot \sqrt{\displaystyle \frac{R(1 − R)}{n}}, R + 1.96 \cdot \sqrt{\displaystyle \frac{R(1 − R)}{n}} \right]\end{align}
(見切れる場合は横へスクロール)
以上が公式一覧でした!
「確率分布と統計的な推測」は選択制の単元であることから、学校の授業で詳しく習わなかった人もいるかと思います。
一方で、社会のいろいろなところで活用されている「統計学」の基礎となる大切な内容でもあります。
関連記事も確認しながら、ぜひ確率分布と統計的な推測をマスターしてくださいね!
最後の母比率求めるところで
R +1.96〜
のところが
Xバー+1.96〜
になってます!
この度はコメントいただきありがとうございます。
該当部分、修正いたしました。
このようにご指摘いただけるととても助かります。
今後ともどうぞ当サイトをよろしくお願いいたします。
「正規分布の標準化」の正規分布 N(m,σ) のσってσ²じゃないのでしょうか。
当該箇所、ご指摘のとおり修正いたしました。
お知らせくださりありがとうございました。