機率概論 · Chapter I · Topic 1

機率論的起點：隨機實驗、樣本空間與事件

Random Experiments, Sample Spaces, and Events

Abstract. 機率論不是從公式開始，而是從一個可重複、結果不確定、但所有可能結果可先描述的隨機實驗開始。樣本空間負責收納所有可能結果，事件則是我們真正想詢問的那些結果集合。

機率論 (probability theory) 的第一步不是計算機率，而是先說清楚「我們正在觀察什麼」。如果連可能發生的結果都尚未被整理成一個清楚的集合，那麼後面的機率、公理、條件機率、獨立性與隨機變數都會失去共同語言。

這篇文章的目標很小，但非常關鍵：區分樣本點、樣本空間與事件。這三個概念會一路陪我們走到隨機變數、分配理論與極限分配。

從現象開始

在日常生活與自然界中，我們所能觀察到的現象 (phenomenon) 通常可先粗略分成兩類。

Definition 1.1

確定現象 (deterministic phenomenon) 是指在一定條件之下進行，就一定會發生，或者一定不會發生的現象。例如：在一大氣壓之下，將水加熱至 $100^\circ\mathrm{C}$ 便會沸騰。

Definition 1.2

隨機現象 (random phenomenon) 是指不能事先知道結果的現象。此種現象具有不確定性 (uncertainty)，因此不能被事前預知其結果；但它往往仍伴隨一定程度的規律，使研究者可以度量其發生的可能性，也就是機率 (probability)。

確定現象的核心是「在同樣條件下，結果可以被事前肯定」。隨機現象的核心則是「單次結果無法事前肯定，但大量重複時可能呈現規律」。機率論研究的正是後者。

隨機實驗

要把隨機現象變成數學對象，我們先將觀察過程稱為實驗 (experiment)。如果這個實驗在相同條件下重複操作時仍無法事先預知結果，但其所有可能結果可在實驗開始前描述，則稱為隨機實驗。

Definition 1.3

一個隨機實驗 (random experiment) 是指同時具有下列三個性質的實驗：

實驗所有可能的結果 (outcomes) 在實驗開始前即已知。
實驗在未執行前，該實驗會產生何種結果無法事先預知。
在相同的條件之下，該實驗可以被重複執行。

例如「投擲一顆骰子並觀察其出現的點數」是一個隨機實驗。投擲前我們知道結果必然是 $1,2,3,4,5,6$ 其中之一，但在真正投擲前，無法知道這一次會出現幾點；而且這個實驗可以在相同條件下反覆執行。

Note

「結果不確定」不代表「什麼都不知道」。隨機實驗要求所有可能結果在事前可被描述，這正是機率論能開始工作的原因。

樣本空間與樣本點

一旦隨機實驗被指定，下一步就是把所有可能結果收成一個集合。

Definition 1.4

隨機實驗之所有可能的結果所形成的集合稱作樣本空間 (sample space)，通常以英文字母 $S$ 或希臘字母 $\Omega$ 表示。樣本空間中的元素被稱作樣本點 (sample point)，通常以希臘字母 $\omega$ 表示。

在符號上，若 $\omega$ 是某個可能結果，而 $S$ 是所有可能結果構成的集合，則我們寫成

\[\omega \in S\]

這裡要特別注意 $\in$ 與 $\subset$ 的差別：$\omega \in S$ 表示「元素屬於集合」，而 $A \subset S$ 表示「集合包含於集合」。這個差異稍後在事件的定義中會立刻出現。

Example 1.1

考慮下列三個隨機實驗。

隨機實驗	樣本空間
投擲一硬幣一次，觀察其正反面	$S=\lbrace\mathrm{H},\mathrm{T}\rbrace$
每期購買一張樂透彩券，直到中頭獎為止，觀察槓龜次數	$S=\lbrace0,1,2,3,\ldots\rbrace$
觀察某一電腦零件之壽命	$S=\lbrace\,t\mid t\geq 0\,\rbrace$

這三個例子分別代表有限、可數無限與不可數無限的樣本空間。從這裡開始，機率論已經不只是算骰子或硬幣；它需要一套能同時處理離散與連續情形的語言。

離散樣本空間與連續樣本空間

樣本空間可以依照其中元素個數的型態做分類。

Definition 1.5

離散樣本空間 (discrete sample space) 是指樣本空間中之元素個數為有限 (finite) 或可數無限 (countably infinite) 者。

連續樣本空間 (continuous sample space) 是指樣本空間中之元素個數為不可數無限 (uncountably infinite) 者。

可以把分類想成下面這張表。

樣本空間型態	元素個數	典型例子
有限	finite	擲一顆骰子，$S=\lbrace1,2,3,4,5,6\rbrace$
可數無限	countably infinite	槓龜次數，$S=\lbrace0,1,2,\ldots\rbrace$
不可數無限	uncountably infinite	壽命時間，$S=[0,\infty)$

前兩者通常合稱為離散樣本空間；第三者則是連續樣本空間。連續樣本空間的出現，會讓我們開始認真面對一個細緻的問題：在不可數多個可能結果之中，單一樣本點究竟扮演什麼角色？

思想實驗 1.1

想像你在酒吧丟飛鏢，且假設飛鏢的針尖沒有面積。第一次丟擲後，針尖落在靶上的某一個點，將這個點記作樣本點 $\omega_0$ 所在的位置。我將飛鏢拔起交還給你，請你第二次再丟到完全相同的點位。

直觀上，你也許會說：「這不可能。」但這句話需要更精細地理解。第一次丟擲已經證明 $\omega_0$ 是樣本空間中的一個可能結果；否則它不可能在第一次成為實際觀察到的樣本點。真正困難的是：在連續樣本空間中，若針尖可以落在靶上的不可數多個位置，則「第二次恰好落在指定點 $\omega_0$」這件事，直觀上應該分到多大的機率？

之後我們會正式看到，這類單點事件常常具有

\[\mathbb{P}(\lbrace\omega_0\rbrace)=0\]

因此，機率為 $0$ 與不可能發生不是同一句話。前者是機率模型給出的數值；後者則是說該結果根本不在樣本空間之中。

事件與事件的發生

樣本空間收納所有可能結果，但我們真正關心的通常不是單一樣本點，而是某一群結果。例如擲骰子時，我們可能不只關心是否出現 $5$，也可能關心是否出現大於等於 $4$ 的點數。

Definition 1.6

事件 (event) 是隨機實驗之某些可能的結果所構成之集合，亦為樣本空間之子集合 (subset)。若某次實驗之結果屬於某一事件，則稱此事件發生 (occur)。

通常而言，我們以

\[A\subset S\]

表達 $A$ 為一事件，並以

\[\omega\in A\]

表示 $A$ 發生。

這裡出現了機率論最基本的三層結構：

物件	符號	意義
樣本點	$\omega$	一次實驗真正出現的結果
樣本空間	$S$ 或 $\Omega$	所有可能結果所形成的集合
事件	$A\subset S$	我們關心的一群可能結果

Example 1.2

若投擲一顆骰子一次，令

\[S=\lbrace1,2,3,4,5,6\rbrace\]

令 $A$ 表示點數大於等於 $4$ 之事件，$B$ 表示點數小於等於 $3$ 之事件，$C$ 表示點數恰巧為 $5$ 之事件，則

\[A=\lbrace4,5,6\rbrace,\qquad B=\lbrace1,2,3\rbrace,\qquad C=\lbrace5\rbrace\]

若某次投擲出 $3$ 點，則

\[3\notin A,\qquad 3\in B,\qquad 3\notin C\]

因此 $B$ 事件發生，而 $A$ 與 $C$ 事件不發生。

有限樣本空間中的事件數量

若樣本空間只有有限個樣本點，則所有事件都可以直接列舉。這個事實雖然簡單，但它揭示了事件其實是「集合的選擇」。

Proposition 1.1

若樣本空間 $S$ 具有 $n$ 個樣本點，則其可能事件共有 $2^n$ 個。

Proof. 對於 $S$ 中的每一個樣本點，形成事件時都有兩種選擇：將它放入該事件，或不將它放入該事件。因為共有 $n$ 個樣本點，所以所有可能選擇共有

\[2\times 2\times \cdots \times 2 = 2^n\]

種。這些選擇正好對應到 $S$ 的所有子集合，因此事件共有 $2^n$ 個。 $\square$

在這 $2^n$ 個事件中，有兩個特殊事件一定存在。第一個是確定事件 (certain event)，也就是整個樣本空間 $S$ 本身。第二個是虛無事件 (null event)，也就是空集合 $\varnothing$ 這個事件。空集合 (empty set) 是一個沒有任何元素的集合。

測度觀點的第一個伏筆

在有限或可數樣本空間中，我們通常可以把所有子集合都視為事件。但在連續樣本空間中，這個想法會遇到困難：並不是每一個任意構造出的子集合都適合被賦予機率。

因此，更完整的機率模型由三個物件構成：樣本空間、事件集合族，以及機率函數。若分別以 $S$、$\mathcal{F}$ 與 $\mathbb{P}$ 記之，這三個物件合在一起，便逐步導向機率空間

\[(S,\mathcal{F},\mathbb{P})\]

Note

這篇文章先把事件理解為樣本空間的子集合，這對建立直覺非常重要。之後若進入測度較完整的版本，我們會把「事件」修正為「屬於某個 $\sigma$-域 ($\sigma$-field) 的集合」。換句話說，事件仍然是集合，但不是所有集合都必然能成為事件。下一篇將更仔細說明事件集合族與 $\sigma$-域的角色。

本篇小結

這篇文章建立的是機率論的第一層語言：

問題	對應物件
我們做的是什麼觀察？	隨機實驗
所有可能結果有哪些？	樣本空間
單次實驗真正出現什麼？	樣本點
我們關心哪一群結果？	事件
某事件是否發生？	檢查實際結果是否屬於該事件

等到這些物件都被定義清楚，下一步才是問：如何把一個介於 $0$ 與 $1$ 之間的數值合理地指定給事件？這正是機率公理化的起點。