機率概論 · Chapter II · Topic 1

隨機變數，從樣本空間到數線

Random Variables as Maps from Sample Space to the Real Line

Abstract. 事件機率把事件送到機率數值；隨機變數則先把樣本點送到實數，使我們可以用數線、函數與微積分方法描述機率。

上一章最後一篇文章說明了獨立性。到那裡為止，我們討論的主要對象仍是事件。事件是樣本空間的子集合，而機率函數把可測事件送到 $0$ 與 $1$ 之間的數值。

\[\mathbb{P}:\mathcal{F}\longrightarrow [0,1]\]

第一章建立的是集合上的機率。由於事件本身就是集合，若要討論事件機率，便必須處理這些集合之間的關係。只是，若始終停留在集合運算，微積分、函數分析與極限方法就不容易直接使用。因此，下一步仍以事件為基礎，先把樣本空間中的結果轉成實數。

隨機變數用來完成這個轉換。它把每個樣本點 $\omega$ 送到一個實數 $X(\omega)$，使我們可以把「結果」放到數線上，再討論數值與機率之間的關係。

隨機變數把樣本空間中的樣本點映到實數線。數線上的區間 (-infinity, x] 會對應回樣本空間中的事件。 — Fig. 2.1. 隨機變數 $X$ 把樣本點送到實數。數線上的區間 $(-\infty,x]$ 會被 $X$ 拉回樣本空間中的事件 $\{X\leq x\}$。

隨機變數不是隨機的數

隨機變數 (random variable) 的名稱容易讓人誤會。隨機的是實驗結果 $\omega$；$X$ 本身則是定義在樣本空間上的函數。一旦 $\omega$ 確定，$X(\omega)$ 就是確定的實數。

以下定義先採用半直線版本。這個寫法與稍後的累積分配函數直接相連，也最容易看出隨機變數如何把數線上的門檻拉回樣本空間。

Definition 2.1

令 $(S,\mathcal{F},\mathbb{P})$ 為一個機率空間。若 $X:S\to\mathbb{R}$ 為定義在樣本空間 $S$ 上的實值函數，且對任意 $x\in\mathbb{R}$，皆有

\[\{\omega\in S\mid X(\omega)\leq x\}\in\mathcal{F}\]

則稱 $X$ 為定義於 $(S,\mathcal{F},\mathbb{P})$ 上的隨機變數 (random variable)。

有些教科書會採用反映射版本。這個寫法需要實數線上的 Borel $\sigma$-域 $\mathcal{B}(\mathbb{R})$，若需要回顧，可先參考事件集合族與 $\sigma$-域。對任意 $B\in\mathcal{B}(\mathbb{R})$，要求

\[X^{-1}(B)=\{\omega\in S\mid X(\omega)\in B\}\in\mathcal{F}\]

半直線版本與反映射版本在實值情形中等價，因為 $(-\infty,x]$ 這類半直線會生成 $\mathcal{B}(\mathbb{R})$。半直線版本和接下來的 CDF 定義相連；反映射版本則直接說明可測性的來源。

這個條件的用途很明確。對每一個實數 $x$，所有滿足 $X(\omega)\leq x$ 的樣本點必須形成 $\mathcal{F}$ 中的事件，如此才可以賦予其機率。

從樣本點到數值

投擲一顆公正骰子一次。為了先把樣本點與數值分開，將六個可能結果記作

\[S=\{\omega_1,\omega_2,\omega_3,\omega_4,\omega_5,\omega_6\}\]

其中 $\omega_i$ 表示擲出點數 $i$ 的樣本點。定義點數隨機變數 $X$ 為

\[X(\omega_i)=i,\qquad i=1,\ldots,6\]

則 $X$ 就是觀察點數本身。此時

\[\{X\leq 3\}=\{\omega_1,\omega_2,\omega_3\}\]

公正骰子有六個均等可能的樣本點，其中三個落在這個事件中，故機率為

\[\mathbb{P}(X\leq 3)=\frac{3}{6}=\frac{1}{2}\]

同一個樣本空間也可以對應到不同的隨機變數。例如，定義另一個隨機變數 $Y$ 為

\[Y(\omega_i)= \begin{cases} 1, & i \text{ 為偶數},\\[0.35em] 0, & i \text{ 為奇數} \end{cases}\]

則 $Y$ 只記錄點數是否為偶數。它捨去點數細節，只保留奇偶性；所有偶數結果都送到 $1$，所有奇數結果都送到 $0$。

直覺校準 2.1

請分辨下列三個層次。$X$ 是一個函數，$x$ 是一個實數，而 $X=x$ 是一個事件。

\[\{X=x\}=\{\omega\in S\mid X(\omega)=x\}\]

所以 $\mathbb{P}(X=x)$ 的機率對象，是由 $X$ 定出的事件 ${X=x}$；數字 $x$ 只是用來指定這個事件的取值。

由門檻事件定義累積分配函數

隨機變數把樣本點送到數線上後，可以固定一個門檻 $x$，回頭審視哪些樣本點滿足 $X(\omega)\leq x$。這些樣本點形成事件 ${X\leq x}$，其機率即為累積分配函數 (cumulative distribution function, CDF)。在本講義中，CDF 也簡稱為分配函數 (distribution function, DF)。

Definition 2.2

令 $X$ 為一個隨機變數。定義

\[F_X(x)=\mathbb{P}(X\leq x),\qquad x\in\mathbb{R}\]

則稱 $F_X$ 為 $X$ 的累積分配函數 (cumulative distribution function, CDF)，也稱為分配函數 (distribution function, DF)。

若把 ${X\leq x}$ 完整寫回樣本空間，CDF 計算的是

\[F_X(x) = \mathbb{P}\bigl(\{\omega\in S\mid X(\omega)\leq x\}\bigr)\]

因此，CDF 是一個由實數到機率的函數。輸入是實數 $x$，輸出是機率 $F_X(x)$。隨機變數把樣本點轉成實數後，便能在機率論中討論函數圖形、單調性、極限、微分與積分。

同一個定義涵蓋不同型態

CDF 的定義比單純列出幾個機率更抽象。對每一個門檻 $x$，它都給出事件 ${X\leq x}$ 的機率。

這個定義先不區分型態。無論 $X$ 之後屬於離散型或連續型，只要 $X$ 是實值隨機變數，事件 ${X\leq x}$ 都有意義，函數 $F_X$ 也都可以被定義。下一篇累積分配函數如何累積機率會從離散型與連續型開始，說明同一個 $F_X$ 如何呈現機率資訊。

本篇小結

第一章建立事件機率。事件 $A$ 是樣本空間中的可測集合，機率函數 $\mathbb{P}$ 將事件送到 $[0,1]$。

\[\mathbb{P}:\mathcal{F}\longrightarrow [0,1]\]

第二章開始，我們把樣本空間中的結果透過隨機變數送到數線上。

\[X:S\longrightarrow \mathbb{R}\]

隨機變數定義後，便可固定門檻 $x$，回頭審視並計算 ${X\leq x}$ 此一事件的機率。這就是累積分配函數的起點。

\[F_X(x)=\mathbb{P}(X\leq x)\]

這一步使機率論不只停留在集合運算，也開始進入函數觀點。下一篇累積分配函數如何累積機率會進一步說明 CDF 如何累積機率，並由此區分離散型與連續型隨機變數。

參考文獻與延伸閱讀

Patrick Billingsley, Probability and Measure, 3rd ed., Wiley, 1995, chapters on random variables and distribution functions.
William Feller, An Introduction to Probability Theory and Its Applications, Volume I, 3rd ed., Wiley, 1968, chapters on random variables and distribution functions.
George Casella and Roger L. Berger, Statistical Inference, 2nd ed., Duxbury, 2002, sections on random variables and distribution functions.
Sheldon M. Ross, A First Course in Probability, 10th ed., Pearson, 2019, chapters on random variables.
Joseph K. Blitzstein and Jessica Hwang, Introduction to Probability, 2nd ed., CRC Press, 2019, chapters on random variables and CDFs.