Wei-Ann Lin · 林蔚安
機率概論 · Chapter II · Topic 2

累積分配函數如何累積機率

How Distribution Functions Accumulate Probability


Abstract. CDF 描述隨機變數不超過門檻 x 的事件機率;離散型靠單點機率加總,連續型靠密度面積積分。

上一篇文章把隨機變數定義為從樣本空間到實數線的函數。一旦有了這個對應,便可固定一個門檻 $x$,計算映射過去的數字落在 $x$ 以下的總機率。

這個累積量稱為累積分配函數 (cumulative distribution function, CDF),也簡稱為分配函數 (distribution function, DF)。

\[F_X(x)=\mathbb{P}(X\leq x)\]

以下各節都以此定義為準。離散型與連續型的差別,不在於 CDF 的定義改變,而在於事件 $\lbrace X\leq x\rbrace$ 的機率如何被計算與表示。

累積分配函數的基本性質

先從函數觀點看 $F_X$。輸入是實數 $x$,輸出是事件 $\lbrace X\leq x\rbrace$ 的機率。下圖以兩條平行數線表示此關係。每個點的位置代表 $X(\omega_i)$ 的數值;當門檻由 $x_1$ 移到 $x_2$,紅色區段變長,原本已被收入的樣本點仍然保留,只會額外納入新的樣本點。

兩條平行數線展示 x1 小於等於 x2 時,事件 X 小於等於 x1 被包含於事件 X 小於等於 x2。
Fig. 2.2. 若 $x_1\leq x_2$,則所有滿足 $X(\omega)\leq x_1$ 的樣本點,也必定滿足 $X(\omega)\leq x_2$。大小關係發生在 $X(\omega)$ 的數值上,事件之間因此形成包含關係。

由事件的包含關係可知,若 $x_1\leq x_2$,則

\[\lbrace X\leq x_1\rbrace\subset \lbrace X\leq x_2\rbrace\]

故 $F_X$ 不會隨 $x$ 增大而下降。

Proposition 2.1 (Basic Properties of a CDF)

令 $X$ 為一個隨機變數,$F_X(x)=\mathbb{P}(X\leq x)$。則 $F_X$ 滿足下列性質。

(1) $F_X$ 為單調不減函數。

(2) 對任意 $x\in\mathbb{R}$,皆有

\[0\leq F_X(x)\leq 1\]

(3) $F_X$ 滿足

\[\lim_{x\to -\infty}F_X(x)=0,\qquad \lim_{x\to \infty}F_X(x)=1\]

(4) $F_X$ 右連續。

前三點由機率性質直接得到。第四點是 CDF 的標準正則性條件,也是後續用 CDF 描述分佈時不可缺少的性質。

離散型,靠單點機率加總

若 $X$ 的可能取值至多可數,且所有機率都集中在這些取值上,則稱 $X$ 為離散型隨機變數 (discrete random variable)。此時定義

\[p_X(t)=\mathbb{P}(X=t)\]

並稱 $p_X$ 為機率質量函數,英文全名為 probability mass function,常簡記為 PMF。

對離散型隨機變數而言,事件 $\lbrace X\leq x\rbrace$ 是由所有不超過 $x$ 的單點事件合併而成。因此

\[F_X(x) = \mathbb{P}(X\leq x) = \sum_{t\leq x}p_X(t)\]

此加總只取 $X$ 可能取到且不超過 $x$ 的那些 $t$。離散型 CDF 因而是門檻左側單點機率的累積。

Example 2.1 (A Die Roll)

投擲一顆公正骰子一次,令 $X$ 表示點數。則

\[\mathbb{P}(X=t)=\frac{1}{6},\qquad t=1,\ldots,6\]

若 $x=3$,則 $\lbrace X\leq 3\rbrace=\lbrace 1,2,3\rbrace$,故

\[F_X(3) = \mathbb{P}(X\leq 3) = \frac{1}{6}+\frac{1}{6}+\frac{1}{6} = \frac{1}{2}\]

若 $3<x<4$,門檻雖然變大,但沒有新增任何可能點數,因此 $F_X(x)$ 仍等於 $1/2$。這也是離散型 CDF 呈現階梯狀的原因。

直覺校準 2.2

在 Example 2.1 中,$X$ 只能取 $1,2,\ldots,6$。這個集合是 $X$ 的值域 (range)。但 CDF 的輸入 $x$ 是數線上的門檻,可以是任意實數,而不必剛好等於骰子點數。

例如 $F_X(3.4)$ 仍然有意義。此時

\[\lbrace X\leq 3.4\rbrace=\lbrace 1,2,3\rbrace\]

所以

\[F_X(3.4)=\mathbb{P}(X\leq 3.4)=\frac{1}{2}\]

只有當門檻跨過下一個可能取值,例如從 $3.9$ 移到 $4$,CDF 才會往上跳。

公正骰子的 PMF 棒棒糖圖。點數 1, 2, 3 的機率質量被標成紅色,門檻 x=3.4 位於 3 與 4 之間。
Fig. 2.3. 即使門檻 $x=3.4$ 不是骰子點數,它仍然只收入點數 $1,2,3$ 的機率質量,因此 $F_X(3.4)=1/2$。

離散型 CDF 的跳躍高度正是該點的機率質量。以公正骰子為例,每個點數的機率質量都是 $1/6$,所以 CDF 每次跨過一個整數點,便往上跳 $1/6$。

公正骰子的 CDF 階梯圖。每個整數點都有高度 1/6 的跳躍。
Fig. 2.4. 公正骰子的 CDF 在每個可能取值處都跳躍 $1/6$。在 $x=3.4$ 時,CDF 讀到的高度是 $3/6$。

若想親手改變單點機率並觀察階梯如何累積,可以參考互動展示 From PMF to CDF

連續型,靠密度積分

另一種常見情形中,單點本身不具有正機率,機率沿著區間連續累積。若存在非負函數 $f_X$,使得對任意 $x\in\mathbb{R}$ 皆有

\[F_X(x)=\int_{-\infty}^{x} f_X(t)\,dt\]

則稱 $X$ 為連續型隨機變數 (continuous random variable)。此時 $f_X$ 稱為機率密度函數,英文全名為 probability density function,常簡記為 PDF。

此時事件 $\lbrace X\leq x\rbrace$ 的機率改由密度函數在 $(-\infty,x]$ 上的面積累積,而不採單點相加。

連續型隨機變數的 CDF 可由密度曲線左側面積表示。
Fig. 2.5. 對連續型隨機變數而言,$F_X(x)$ 是密度函數在 $(-\infty,x]$ 上的面積。

若 $a<b$,則區間機率可由兩個累積面積相減得到。

\[\mathbb{P}(a<X\leq b) = F_X(b)-F_X(a) = \int_a^b f_X(t)\,dt\]
連續型隨機變數落在 a 到 b 之間的機率由密度曲線下方區間面積表示。
Fig. 2.6. 區間機率 $\mathbb{P}(a<X\leq b)$ 是 $a$ 到 $b$ 之間的密度面積,也就是 $F_X(b)-F_X(a)$。

密度 $f_X(t)$ 不是單點機率。它描述機率在數線附近累積的速率,因此 $f_X(t)$ 可以大於 $1$。實際的機率來自面積,而不是某一點的函數值。

Note

嚴格地說,CDF 連續不必然代表可由一般密度函數積分表示。測度論中還有更細的分解,例如奇異連續分配。本章先採統計課程中最常用的版本,也就是可由 PDF 描述的連續型隨機變數。

此外,連續型隨機變數在單點上的機率為零。對任意實數 $a$,

\[\mathbb{P}(X=a)=\int_a^a f_X(t)\,dt=0\]
連續型隨機變數在單點 a 上沒有面積,因此單點機率為零。
Fig. 2.7. 單點 $a$ 沒有寬度,故密度曲線在 $a$ 到 $a$ 之間沒有面積。

這不表示 $a$ 不可能成為觀測值,而是說單點在連續模型中沒有面積,故不具有正機率。這一點延續了第一章中飛鏢落點的直覺校準。也因此,對連續型隨機變數而言,端點是否包含通常不會改變區間機率。

若想調整密度圖形並觀察面積如何變成 CDF,可以參考互動展示 From PDF to CDF

有些分配同時具有單點機率與連續密度。這類情形需要同時使用加總與積分,較適合在熟悉 PMF、PDF 與期望值、變異數等計算後再討論。

本篇小結

無論 $X$ 是離散型或連續型,$F_X(x)$ 都來自同一個事件。

\[F_X(x)=\mathbb{P}(X\leq x)\]

差別只在計算方式。

型態$\lbrace X\leq x\rbrace$ 的機率如何計算CDF 的形狀
離散型加總不超過 $x$ 的單點機率階梯狀,有跳躍
連續型積分 $(-\infty,x]$ 上的密度通常平滑累積

PMF 與 PDF 分別記錄離散型與連續型的計算方式。前者記錄單點機率,後者記錄累積機率的變化率;二者最後都回到同一個累積分配函數。

CDF 仍以事件機率為本,並把隨機變數的討論帶到實數線上的函數討論之中。離散型把門檻左側的單點機率相加;連續型把門檻左側的密度面積積分。

因此,隨機變數不只是樣本點的重新命名;函數、極限、微分、積分與分佈形狀都能納入討論,後續的常見分配、期望值與極限定理也由此展開。下一篇離散型隨機變數與機率質量函數會先細講離散型情形,說明 PMF 如何記錄單點機率,以及它如何與 CDF 的跳躍相互對應。

參考文獻與延伸閱讀

  • Patrick Billingsley, Probability and Measure, 3rd ed., Wiley, 1995, chapters on distribution functions and probability measures.
  • William Feller, An Introduction to Probability Theory and Its Applications, Volume I, 3rd ed., Wiley, 1968, chapters on distribution functions.
  • George Casella and Roger L. Berger, Statistical Inference, 2nd ed., Duxbury, 2002, sections on random variables and distribution functions.
  • Sheldon M. Ross, A First Course in Probability, 10th ed., Pearson, 2019, chapters on discrete and continuous random variables.
  • Joseph K. Blitzstein and Jessica Hwang, Introduction to Probability, 2nd ed., CRC Press, 2019, chapters on CDFs, PMFs, and PDFs.
  • Lawrence M. Leemis, “Relationships among Common Univariate Distributions”, The American Statistician, 40(2), 143–146, 1986. DOI 10.1080/00031305.1986.10475379.