中学/高校数学 大学数学

【高校数学】
確率変数の定義をわかりやすく説明

確率変数とは世の中の事象と数学とを
結び付ける仕組みのことで、

厳密な定義は測度論を用いて為されます。

測度論は大学数学の範疇で
かなり難しいこと。

また一般の人は
実用に耐え得る知識があれば良くて、

厳密さはあまり求めてないと思います。

なので、ここでは

高校数学レベルの確率変数の定義を
説明したいと思います。

確率変数の定義

確率変数の定義は、

「コイン投げやサイコロ振り等」

起きる事象が有限個の離散変数

「0~1までのランダムな小数をとる、など」

起きる事象が無限個の連続変数の二つに分かれます。

最初に離散の確率変数の定義を述べて

必要な道具を揃えてから
連続の場合に進みたいと思います。

確率変数(離散)

変数Xは次を満たすとき確率変数という。

  • Xは根元事象に応じた値xiをとる。
  • Xがxiをとる確率が定まっている。

根元事象とは?

これ以上に分けられない事象のことです。

コイン投げの例で言うと

  • 表が出たらXの値は1
  • 裏が出たらXの値は0

にしましょう、と取り決めて

それぞれの確率は1/2で定まっているので

この時Xは確率変数となります。

$$ \left\{ \begin{eqnarray} 1/2 \quad (X=1) \\ 1/2 \quad (X=0) \end{eqnarray} \right. \hspace{20cm}$$

なぜ、こんな変数を用意するかと言うと
事象を数学で扱える形にしたいからです。

一般的に世の中の事象は

部活の試合で勝てた。

今日は雨だった。

など、数とは無関係に存在しているので

数学で取り扱うためには
数字を与える必要があります。

確率変数のおかげで今

「コインで表が出たら1、裏が出たら0」

の様に数を通して事象を考えられます。

確率変数のとる値は自由に決められる

先程の例において

  • 表が出たら1
  • 裏が出たら-1

としても確率変数です。

$$ \left\{ \begin{eqnarray} &1/2& \quad (X=1) \\ &1/2& \quad (X=-1) \end{eqnarray} \right. \hspace{20cm}$$

  • 表が出たら1
  • 裏が出たら2

でも良いですし

$$ \left\{ \begin{eqnarray} 1/2 \quad (X=1) \\ 1/2 \quad (X=2) \end{eqnarray} \right. \hspace{20cm}$$

  • 表が出たら100
  • 裏が出たら1

$$ \left\{ \begin{eqnarray} &1/2& \quad (X=100) \\ &1/2& \quad (X=1) \end{eqnarray} \right. \hspace{20cm}$$

すべて確率変数です。

確率さえ正しく定まっていれば
数の割り当て方は自由です。

サイコロ振り

確率の問題によく登場するサイコロ振りも

  • サイコロを振って1の目が出たらX=1
  • サイコロを振って2の目が出たらX=2
  • サイコロを振って6の目が出たらX=6

として

それぞれの確率は1/6で
定まっているので確率変数になります。

確率1/61/61/61/61/61/6
確率変数X123456

確率の記法

確率変数が値xiをとる時の確率pi

\( p_i = P(X=x_i ) \)

の様に書きます。

サイコロ振りなら

  • P(X=1)=1/6
  • P(X=4)=1/6

です。

範囲を指定して書くことも
できて例えば

P(1≦X≦4)=4/6=2/3

です。

1≦X≦4となるのはサイコロを振って
1、2、3、4の目が出た時。

確率密度関数

離散変数について関数

$$ f(x) = \left\{ \begin{eqnarray} &p_i& \quad (x=x_i) \\ &0& \quad (x \neq x_i, \; i=1, 2, \cdots, n) \end{eqnarray} \right. \hspace{20cm} $$

は確率変数のとる値の所で
その事象の確率を示します。

この様に事象の起きる確率を表す関数を

確率密度(または確率密度関数)と呼びます。

サイコロ振りの確率密度

連続変数

確率密度関数を用いて
連続の場合の確率変数を定義します。

確率変数(連続)

変数Xは次を満たすとき確率変数という。

  • Xは根元事象に応じた値xをとる。
  • 確率P(a≦X≦b)が定まっている。

宅急便を例に説明します。

日時指定により、

午後0時~1時のランダムな時間に
配達員の人が現れるとします。

配達員の人が

  • 午後0.5時(12時半)に現れたらXの値は0.5
  • 午後0.1時(12時6分)に現れたらXの値は0.1
  • 午後0.1666…時(12時10分)に現れたらXの値は0.1666…

と言った具合に
時間をそのままXの値に採用すれば、

各々の確率は等しく定まっているので

Xは0~1の小数を値に持つ確率変数となります。

2番目の文章の意味

「確率P(a≦X≦b)が定まっている」とは

具体的には、
ある確率密度関数f(x)が与えられていて

任意のa、bに対して

$$ P(a \leq X \leq b) = \int_a^b f(x) dx $$

が満たされる事を意味します。

宅急便の例だと

$$ f(x) = \left\{ \begin{eqnarray} &1& \quad (x \in [0, 1]) \\ &0& \quad (x \notin [0, 1]) \end{eqnarray} \right. \hspace{20cm}$$

です。

宅急便の確率密度

配達員の人が午後0時~0.1時に現れる確率は

$$ \int_0^{0.1} 1 \, dx = \big[ x \big]_0^{0.1} = 0.1 \hspace{20cm}$$

午後0.5時~0.8時に現れる確率は

$$ \int_{0.5}^{0.8} 1 \, dx= \big[ x \big]_{0.5}^{0.8} = 0.3 \hspace{20cm}$$

午後0時~1時に現れる確率は

$$ \int_0^1 1 \, dx = \big[ x \big]_0^{1} = 1 \hspace{20cm}$$

正しく計算できています。

離散との注意点

離散の時とは異なり
連続変数の確率は範囲でのみ求められます。

起きる事象が無限にあるので、

点での確率pを与えてしまうと

\( p \times \infty = \infty \)

全事象の確率の合計が1とはならず
無限大に発散してしまうからです。

連続変数についての確率密度関数は
積分した際、正しい確率が求まるよう書かれます。

離散変数についての確率密度関数は
点での値を見るだけで大丈夫です。

測度論的確率論大学生向けの話

確率変数が本質的にしている事は
事象と数との対応、つまり写像です。

本格的な確率変数の定義には写像を使います。

興味のある人におすすめ。

まとめ

確率変数とは

事象に数字という記号を与え、
数学を通して理解する仕組みです。

離散変数と連続変数の2種類あり、

前者は直感的に理解しやすい一方

後者は確率密度関数の積分で
確率を求める必要がある分難しいです。

高校数学の定義で十分
実際の仕事に役立ちますが、

大学ではさらに厳密な定義をします。

-中学/高校数学, 大学数学