Wei-Ann Lin · 林蔚安
機率概論 · Chapter I · Topic 1

機率論的起點:隨機實驗、樣本空間與事件

Random Experiments, Sample Spaces, and Events


Abstract. 機率論不是從公式開始,而是從一個可重複、結果不確定、但所有可能結果可先描述的隨機實驗開始。樣本空間負責收納所有可能結果,事件則是我們真正想詢問的那些結果集合。

機率論 (probability theory) 的第一步不是計算機率,而是先說清楚「我們正在觀察什麼」。如果連可能發生的結果都尚未被整理成一個清楚的集合,那麼後面的機率、公理、條件機率、獨立性與隨機變數都會失去共同語言。

這篇文章的目標很小,但非常關鍵:區分樣本點樣本空間事件。這三個概念會一路陪我們走到隨機變數、分配理論與極限分配。

從現象開始

在日常生活與自然界中,我們所能觀察到的現象 (phenomenon) 通常可先粗略分成兩類。

Definition 1.1

確定現象 (deterministic phenomenon) 是指在一定條件之下進行,就一定會發生,或者一定不會發生的現象。例如:在一大氣壓之下,將水加熱至 $100^\circ\mathrm{C}$ 便會沸騰。

Definition 1.2

隨機現象 (random phenomenon) 是指不能事先知道結果的現象。此種現象具有不確定性 (uncertainty),因此不能被事前預知其結果;但它往往仍伴隨一定程度的規律,使研究者可以度量其發生的可能性,也就是機率 (probability)

確定現象的核心是「在同樣條件下,結果可以被事前肯定」。隨機現象的核心則是「單次結果無法事前肯定,但大量重複時可能呈現規律」。機率論研究的正是後者。

隨機實驗

要把隨機現象變成數學對象,我們先將觀察過程稱為實驗 (experiment)。如果這個實驗在相同條件下重複操作時仍無法事先預知結果,但其所有可能結果可在實驗開始前描述,則稱為隨機實驗。

Definition 1.3

一個隨機實驗 (random experiment) 是指同時具有下列三個性質的實驗:

  1. 實驗所有可能的結果 (outcomes) 在實驗開始前即已知。
  2. 實驗在未執行前,該實驗會產生何種結果無法事先預知。
  3. 在相同的條件之下,該實驗可以被重複執行。

例如「投擲一顆骰子並觀察其出現的點數」是一個隨機實驗。投擲前我們知道結果必然是 $1,2,3,4,5,6$ 其中之一,但在真正投擲前,無法知道這一次會出現幾點;而且這個實驗可以在相同條件下反覆執行。

Note

「結果不確定」不代表「什麼都不知道」。隨機實驗要求所有可能結果在事前可被描述,這正是機率論能開始工作的原因。

樣本空間與樣本點

一旦隨機實驗被指定,下一步就是把所有可能結果收成一個集合。

Definition 1.4

隨機實驗之所有可能的結果所形成的集合稱作樣本空間 (sample space),通常以英文字母 $S$ 或希臘字母 $\Omega$ 表示。樣本空間中的元素被稱作樣本點 (sample point),通常以希臘字母 $\omega$ 表示。

在符號上,若 $\omega$ 是某個可能結果,而 $S$ 是所有可能結果構成的集合,則我們寫成

\[\omega \in S\]

這裡要特別注意 $\in$ 與 $\subset$ 的差別:$\omega \in S$ 表示「元素屬於集合」,而 $A \subset S$ 表示「集合包含於集合」。這個差異稍後在事件的定義中會立刻出現。

Example 1.1

考慮下列三個隨機實驗。

隨機實驗樣本空間
投擲一硬幣一次,觀察其正反面$S=\lbrace\mathrm{H},\mathrm{T}\rbrace$
每期購買一張樂透彩券,直到中頭獎為止,觀察槓龜次數$S=\lbrace0,1,2,3,\ldots\rbrace$
觀察某一電腦零件之壽命$S=\lbrace\,t\mid t\geq 0\,\rbrace$

這三個例子分別代表有限、可數無限與不可數無限的樣本空間。從這裡開始,機率論已經不只是算骰子或硬幣;它需要一套能同時處理離散與連續情形的語言。

離散樣本空間與連續樣本空間

樣本空間可以依照其中元素個數的型態做分類。

Definition 1.5

離散樣本空間 (discrete sample space) 是指樣本空間中之元素個數為有限 (finite)可數無限 (countably infinite) 者。

連續樣本空間 (continuous sample space) 是指樣本空間中之元素個數為不可數無限 (uncountably infinite) 者。

可以把分類想成下面這張表。

樣本空間型態元素個數典型例子
有限finite擲一顆骰子,$S=\lbrace1,2,3,4,5,6\rbrace$
可數無限countably infinite槓龜次數,$S=\lbrace0,1,2,\ldots\rbrace$
不可數無限uncountably infinite壽命時間,$S=[0,\infty)$

前兩者通常合稱為離散樣本空間;第三者則是連續樣本空間。連續樣本空間的出現,會讓我們開始認真面對一個細緻的問題:在不可數多個可能結果之中,單一樣本點究竟扮演什麼角色?

思想實驗 1.1

想像你在酒吧丟飛鏢,且假設飛鏢的針尖沒有面積。第一次丟擲後,針尖落在靶上的某一個點,將這個點記作樣本點 $\omega_0$ 所在的位置。我將飛鏢拔起交還給你,請你第二次再丟到完全相同的點位。

直觀上,你也許會說:「這不可能。」但這句話需要更精細地理解。第一次丟擲已經證明 $\omega_0$ 是樣本空間中的一個可能結果;否則它不可能在第一次成為實際觀察到的樣本點。真正困難的是:在連續樣本空間中,若針尖可以落在靶上的不可數多個位置,則「第二次恰好落在指定點 $\omega_0$」這件事,直觀上應該分到多大的機率?

之後我們會正式看到,這類單點事件常常具有

\[\mathbb{P}(\lbrace\omega_0\rbrace)=0\]

因此,機率為 $0$不可能發生不是同一句話。前者是機率模型給出的數值;後者則是說該結果根本不在樣本空間之中。

事件與事件的發生

樣本空間收納所有可能結果,但我們真正關心的通常不是單一樣本點,而是某一群結果。例如擲骰子時,我們可能不只關心是否出現 $5$,也可能關心是否出現大於等於 $4$ 的點數。

Definition 1.6

事件 (event) 是隨機實驗之某些可能的結果所構成之集合,亦為樣本空間之子集合 (subset)。若某次實驗之結果屬於某一事件,則稱此事件發生 (occur)

通常而言,我們以

\[A\subset S\]

表達 $A$ 為一事件,並以

\[\omega\in A\]

表示 $A$ 發生。

這裡出現了機率論最基本的三層結構:

物件符號意義
樣本點$\omega$一次實驗真正出現的結果
樣本空間$S$ 或 $\Omega$所有可能結果所形成的集合
事件$A\subset S$我們關心的一群可能結果
Example 1.2

若投擲一顆骰子一次,令

\[S=\lbrace1,2,3,4,5,6\rbrace\]

令 $A$ 表示點數大於等於 $4$ 之事件,$B$ 表示點數小於等於 $3$ 之事件,$C$ 表示點數恰巧為 $5$ 之事件,則

\[A=\lbrace4,5,6\rbrace,\qquad B=\lbrace1,2,3\rbrace,\qquad C=\lbrace5\rbrace\]

若某次投擲出 $3$ 點,則

\[3\notin A,\qquad 3\in B,\qquad 3\notin C\]

因此 $B$ 事件發生,而 $A$ 與 $C$ 事件不發生。

有限樣本空間中的事件數量

若樣本空間只有有限個樣本點,則所有事件都可以直接列舉。這個事實雖然簡單,但它揭示了事件其實是「集合的選擇」。

Proposition 1.1

若樣本空間 $S$ 具有 $n$ 個樣本點,則其可能事件共有 $2^n$ 個。

Proof. 對於 $S$ 中的每一個樣本點,形成事件時都有兩種選擇:將它放入該事件,或不將它放入該事件。因為共有 $n$ 個樣本點,所以所有可能選擇共有

\[2\times 2\times \cdots \times 2 = 2^n\]

種。這些選擇正好對應到 $S$ 的所有子集合,因此事件共有 $2^n$ 個。 $\square$

在這 $2^n$ 個事件中,有兩個特殊事件一定存在。第一個是確定事件 (certain event),也就是整個樣本空間 $S$ 本身。第二個是虛無事件 (null event),也就是空集合 $\varnothing$ 這個事件。空集合 (empty set) 是一個沒有任何元素的集合。

測度觀點的第一個伏筆

在有限或可數樣本空間中,我們通常可以把所有子集合都視為事件。但在連續樣本空間中,這個想法會遇到困難:並不是每一個任意構造出的子集合都適合被賦予機率。

因此,更完整的機率模型由三個物件構成:樣本空間、事件集合族,以及機率函數。若分別以 $S$、$\mathcal{F}$ 與 $\mathbb{P}$ 記之,這三個物件合在一起,便逐步導向機率空間

\[(S,\mathcal{F},\mathbb{P})\]
Note

這篇文章先把事件理解為樣本空間的子集合,這對建立直覺非常重要。之後若進入測度較完整的版本,我們會把「事件」修正為「屬於某個 $\sigma$-域 ($\sigma$-field) 的集合」。換句話說,事件仍然是集合,但不是所有集合都必然能成為事件。下一篇將更仔細說明事件集合族與 $\sigma$-域的角色。

本篇小結

這篇文章建立的是機率論的第一層語言:

問題對應物件
我們做的是什麼觀察?隨機實驗
所有可能結果有哪些?樣本空間
單次實驗真正出現什麼?樣本點
我們關心哪一群結果?事件
某事件是否發生?檢查實際結果是否屬於該事件

等到這些物件都被定義清楚,下一步才是問:如何把一個介於 $0$ 與 $1$ 之間的數值合理地指定給事件?這正是機率公理化的起點。