確率分布と統計的な推測を総まとめ!統計学入門【重要記事一覧】

確率分布と統計的な推測に関する公式をまとめていきます。

詳細記事へのリンクも載せていますので、気になる問題や解き方があればぜひ参考にしてくださいね!

 

確率分布

確率分布に関する公式をまとめました。

詳しくは、以下の記事で説明しています。

確率分布・確率変数とは?公式や求め方をわかりやすく解説!

 

確率変数と確率分布

確率変数と確率分布
  • 確率変数
    ある試行の結果によってその値が定まり、各値に対応して確率が定まるような変数
  • 確率分布(分布)
    確率変数 \(X\) のとりうる値と、その値をとる確率 \(P\) との対応関係

 

確率分布の性質

確率分布の性質

\(P(X = x_k) = p_k (k = 1, 2, 3, \cdots, n)\) であるとき、次が成り立つ。

  1. 確率は負の値をとらない
    \(p_k \geq 0\)
  2. 確率の和は必ず \(1\) になる
    \(\displaystyle \sum_{k = 1}^n p_k = p_1 + p_2 + \cdots + p_n = 1\)

 

確率変数 \(X\) の期待値・分散・標準偏差

確率変数 X の期待値・分散・標準偏差

確率変数 \(X\) が \(P(X = x_k) = p_k\) \((k = 1, 2, 3, \cdots, n)\) を満たすとき、

  • \(X\) の期待値
    \(\begin{align}E(X) = m &= \sum_{k = 1}^n x_kp_k \\&= x_1p_1 + x_2p_2 + \cdots + x_np_n\end{align}\)
  • \(X\) の分散
    \(\begin{align}V(X) &= E((X − m)^2) \\&= \sum_{k = 1}^n (x_k − m)^2p_k \\&= (x_1 − m)^2p_1 + (x_2 − m)^2p_2 + \cdots + (x_n − m)^2p_n\end{align}\)
    または
    \(V(X) = E(X^2) − \{E(X)\}^2\)
  • \(X\) の標準偏差
    \(\sigma(X) = \sqrt{V(X)}\)

(見切れる場合は横へスクロール)

 

確率変数 \(aX + b\) の期待値・分散・標準偏差

確率変数 aX + b の期待値・分散・標準偏差

\(X\) を確率変数、\(a\), \(b\) を定数(ただし \(a \neq 0\), \(b \neq 0\))とする。

  • \(aX + b\) の期待値(平均)
    \begin{align}E(aX + b) = aE(x) + b\end{align}
  • \(aX + b\) の分散
    \begin{align}V(aX + b) = a^2V(x)\end{align}
  • \(aX + b\) の標準偏差
    \begin{align}\sigma(aX + b) = |a|\sigma(x)\end{align}

 

確率変数の和と積の期待値・分散

確率変数の和と積

\(X\), \(Y\) を確率変数、\(a\), \(b\) を定数(ただし \(a \neq 0\), \(b \neq 0\))とする。

  • 和の期待値
    \(\begin{align}E(X + Y) = E(X) + E(Y)\end{align}\)
  • 一次式の期待値
    \(\begin{align}E(aX + bY) = aE(X) + bE(Y)\end{align}\)
  • 積の期待値
    \(X\) と \(Y\) が互いに独立ならば
    \(\begin{align}E(XY) = E(X)E(Y)\end{align}\)
  • 和の分散
    \(X\) と \(Y\) が互いに独立ならば
    \(\begin{align}V(X + Y) = V(X) + V(Y)\end{align}\)
  • 一次式の分散
    \(X\) と \(Y\) が互いに独立ならば
    \(\begin{align}V(aX + bY) = a^2V(X) + b^2V(Y)\end{align}\)

 

連続型確率変数と確率密度関数

連続型確率変数と確率密度関数に関する公式をまとめました。

詳しくは、以下の記事で説明しています。

確率密度関数とは?連続型確率変数の期待値・分散の求め方

 

確率密度関数

確率密度関数の性質

実数のある区間全体に値をとる連続型確率変数 \(X\) の分布が確率密度関数 \(f(x)\) と対応するとき、次の性質が成り立つ。

  1. 常に \(f(x) \geq 0\)
  2. \(P(a \leq X \leq b) = \displaystyle \int_a^b f(x) \ dx\)
  3. \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\) のとき
    \(\displaystyle \int_\alpha^\beta f(x) \ dx = 1\)

 

連続型確率変数の期待値・分散・標準偏差

連続型確率変数の期待値・分散・標準偏差

連続型確率変数 \(X\) のとる値の範囲が \(\alpha \leq X \leq \beta\)、確率密度関数が \(f(x)\) であるとき、

  • \(X\) の期待値
    \begin{align}m = E(X) = \displaystyle \int_\alpha^\beta xf(x) \ dx\end{align}
  • \(X\) の分散
    \begin{align}V(X) = \displaystyle \int_\alpha^\beta (x − m)^2 f(x) \ dx\end{align}
  • \(X\) の標準偏差
    \begin{align}\sigma(X) = \sqrt{V(X)}\end{align}

 

二項分布

二項分布に関する公式を以下にまとめました。

詳しくは、以下の記事で説明しています。

二項分布とは?期待値・分散の計算や、正規分布による近似

 

二項分布の定義

二項分布

ある試行で事象 \(A\) が起こる確率を \(p\)、起こらない確率を \(q = (1 − p)\) とする。

この試行を \(n\) 回行う反復試行において、事象 \(A\) が起こる回数を \(X\) とすると、\(X\) は確率変数であり、その確率分布を二項分布といい、\(B(n, p)\) で表す。

 

二項分布に従う確率変数 \(X\) の期待値・分散・標準偏差

二項分布に従う確率変数 X の期待値・分散・標準偏差

確率変数 \(X\) が二項分布 \(B(n, p)\) に従うとき、

  • \(X\) の期待値 \(E(X) = np\)
  • \(X\) の分散 \(V(X) = npq\)
  • \(X\) の標準偏差 \(\sigma(X) = \sqrt{npq}\)

(ただし、\(q = 1 − p\))

 

二項分布の正規分布による近似

二項分布の正規分布による近似

二項分布 \(B(n, p)\) に従う確率変数 \(X\) は、\(n\) が十分に大きいとき、近似的に正規分布 \(N(np, npq)\) に従う。

さらに、\(Z = \displaystyle \frac{X − np}{\sqrt{npq}}\) とおくと、\(Z\) は標準正規分布 \(N(0, 1)\) に従う。

 

正規分布

正規分布に関する公式をまとめました。

詳しくは、以下の記事で説明しています。

正規分布とは?表の見方や計算問題をわかりやすく解説!

 

正規分布の定義

正規分布

連続型確率変数 \(X\) の期待値(平均)を \(m\)、分散を \(\sigma^2\)、標準偏差 \(\sigma\) とする。(\(m\) は実数、\(\sigma\) は正の実数)

\(X\) の確率密度関数 \(f(x)\) が

\begin{align}f(x) = \displaystyle \frac{1}{\sqrt{2\pi}\sigma}e^{− \frac{(x − m)^2}{2\sigma^2}}\end{align}

で与えられているとき、\(X\) は正規分布 \(N(m, \sigma^2)\) に従うという。

 

標準正規分布の定義

標準正規分布

正規分布 \(N(0, 1)\) を標準正規分布という。

\(N(0, 1)\) に従う連続型確率変数 \(Z\) の確率密度関数 \(f(z)\) は

\begin{align}f(z) = \displaystyle \frac{1}{\sqrt{2\pi}}e^{− \displaystyle \frac{z^2}{2}}\end{align}

 

正規分布の標準化

正規分布の標準化

確率変数 \(X\) が正規分布 \(N(m, \sigma)\) に従うとき、

\begin{align}Z = \displaystyle \frac{X − m}{\sigma}\end{align}

とおくと、確率変数 \(Z\) は標準正規分布 \(N(0, 1)\) に従う。

 

統計的な調査

統計的な調査に関する用語・公式をまとめました。

詳しくは、以下の記事で説明しています。

母集団と標本とは?統計調査の意味や求め方をわかりやすく解説!

 

統計的な調査の用語

調査方法

  • 全数調査:対象全体のすべてのデータを集め、調べる
  • 標本調査:対象の一部のデータを抜き出して、調べる

 

母集団と標本

  • 母集団:調査の対象全体
  • 個体:母集団に属する個々の対象
  • 母集団の大きさ:個体の総数
  • 標本:調査のため母集団から抜き出された個体の集合
  • 標本の大きさ:標本に属する個体の数

 

標本の抽出

  • 抽出:母集団から標本を抜き出すこと
  • 無作為抽出:母集団の各個体を等しい確率で抽出する方法(乱数表、乱数さいなどを用いる)
  • 無作為標本:無作為抽出によって選ばれた標本
  • 復元抽出:母集団から標本を抽出する際、毎回もとに戻しながら \(1\) 個ずつ抽出すること
  • 非復元抽出:母集団から標本を抽出する際、もとに戻さず抽出し続けること

 

母集団分布

  • 特性:調査の対象である特定の性質(身長、時間など)
  • 変量:ある特性を表す数量
  • 母集団分布:母集団における変量 \(x\) の分布
  • 母平均 \(m\):母集団における変量 \(x\) の平均値
  • 母標準偏差 \(\sigma\):母集団における変量 \(x\) の標準偏差

 

標本平均

標本平均

母集団から無作為抽出した大きさ \(n\) の標本の変量 \(x\) の値を \(X_1, X_2, \cdots, X_n\) とするとき、標本平均 \(\overline{X}\) は

\begin{align}\overline{X} = \displaystyle \frac{X_1 + X_2 + \cdots + X_n}{n}\end{align}

\(\overline{X}\) は、抽出される標本によって変化する確率変数である。

 

母平均 \(m\)、母標準偏差 \(\sigma\) の母集団から大きさ \(n\) の無作為標本を抽出するとき、その標本平均を \(\overline{X}\) とすると

  • \(\overline{X}\) の期待値
    \begin{align}E(\overline{X}) = m\end{align}
  • \(\overline{X}\) の分散
    \begin{align}V(\overline{X}) = \displaystyle \frac{\sigma^2}{n}\end{align}
  • \(\overline{X}\) の標準偏差
    \begin{align}\sigma(\overline{X}) = \displaystyle \frac{\sigma}{\sqrt{n}}\end{align}

 

標本平均の分布(中心極限定理)

標本平均の分布の正規分布による近似

母平均 \(m\)、母標準偏差 \(\sigma\) の母集団から無作為抽出された大きさ \(n\) の標本について、標本平均 \(\overline{X}\) の分布は、\(n\) が大きいとき、近似的に正規分布 \(N\left(m, \displaystyle \frac{\sigma^2}{n}\right)\) に従う。

すなわち、

確率変数 \(Z = \displaystyle \frac{\overline{X} − m}{\displaystyle \frac{\sigma}{\sqrt{n}}}\)

は近似的に標準正規分布 \(N(0, 1)\) に従う。

 

大数の法則

大数の法則

母平均 \(m\) の母集団から大きさ \(n\) の無作為標本を抽出するとき、\(n\) が大きくなるに従い、その標本平均 \(\overline{X}\) は母平均 \(m\) に近づく。

 

標本比率

標本比率

母集団の中で、ある特性 \(A\) をもつ個体の割合 \(p\) を「特性 \(A\) の母比率」という。

一方、抽出された標本の中で特性 \(A\) をもつ個体の割合 \(R\) を「特性 \(A\) の標本比率」という。

大きさ \(n\) の標本の中で特性 \(A\) をもつ個体数を \(X\) とおくと、

\begin{align}R = \displaystyle \frac{X}{n}\end{align}

 

標本比率の分布(中心極限定理)

標本比率の分布の正規分布による近似

特性 \(A\) の母比率が \(p\) である母集団から大きさ \(n\) の標本を無作為抽出するとき、特性 \(A\) の標本比率 \(R\) は、\(n\) が大きいとき、近似的に正規分布 \(N\left(p, \displaystyle \frac{p(1 − p)}{n}\right)\) に従うとみなせる。

 

統計的な推測

統計的な推測に関する公式をまとめました。

詳しくは、以下の記事で説明しています。

信頼区間、母平均・母比率の推定とは?公式や問題の解き方

 

母平均の推定

母平均に対する信頼区間の推定

母平均 \(m\)、母標準偏差 \(\sigma\) の母集団から抽出された大きさ \(n\) の無作為標本の標本平均 \(\overline{X}\) から、母平均 \(m\) を信頼度 \(95 \) % で推定することを考える。

 

\(n\) が大きいとき、母平均 \(m\) に対する信頼度 \(95\) % の信頼区間は

\begin{align}\left[\overline{X} − 1.96 \cdot \displaystyle \frac{\sigma}{\sqrt{n}}, \overline{X} + 1.96 \cdot \displaystyle \frac{\sigma}{\sqrt{n}} \right]\end{align}

 

母比率の推定

母比率に対する信頼区間の推定

ある特性の母比率 \(p\) の母集団から抽出された大きさ \(n\) の無作為標本の標本比率 \(R\) から、母比率 \(p\) を信頼度 \(95\) % で推定することを考える。

 

\(n\) が大きいとき、母比率 \(p\) に対する信頼度 \(95\) % の信頼区間は

\begin{align}\left[R − 1.96 \cdot \sqrt{\displaystyle \frac{R(1 − R)}{n}}, \overline{X} + 1.96 \cdot \sqrt{\displaystyle \frac{R(1 − R)}{n}} \right]\end{align}

(見切れる場合は横へスクロール)

 

以上が公式一覧でした!

「確率分布と統計的な推測」は選択制の単元であることから、学校の授業で詳しく習わなかった人もいるかと思います。

一方で、社会のいろいろなところで活用されている「統計学」の基礎となる大切な内容でもあります。

関連記事も確認しながら、ぜひ確率分布と統計的な推測をマスターしてくださいね!

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です