LionKing数据科学专栏

购买普通会员高级会员可以解锁网站精华内容且享受VIP服务的优惠

想要查看更多数据科学相关的内容请关注我们的微信公众号知乎专栏

第一步分析(first step analysis)

第一步分析是随机过程(stochastic process)中的一种常用分析手段。在很多概率论问题中,使用第一步分析会将看似困难的问题引刃而解。

第一步分析的理论较为抽象,但是用起来非常自然,因此本文直接通过例子来演示这一分析手段。

硬币例子

Q:不断地抛一枚均匀硬币,当出现连续两个正面时停止。问期望的总次数是多少?

用H表示正面, T表示反面。希望求出现HH时的投掷次数的期望。

我们用$E_{\emptyset}$表示从最开始到出现HH的次数的期望,$E_{H}$表示最开始投掷了H,接下来到出现HH的次数的期望(例如接下来出现H则次数为1),$E_{T}$表示最开始投掷了T,接下来到出现HH的次数的期望。

我们希望找出这几个量之间的关系,从而进行计算。

对于$E_{\emptyset}$,以$\frac{1}{2}$的概率第一次投掷为H,此时的条件期望为$E_H + 1$,其中1对应第一次投掷;以$\frac{1}{2}$的概率第一次投掷为T,此时的条件期望为$E_T + 1$。

因此,$$E_{\emptyset} = \frac{1}{2}(E_H + 1) + \frac{1}{2}(E_T + 1)$$

对于$E_H$,以$\frac{1}{2}$的概率下一次投掷为H,此时的条件期望为1,因为从H出发再投掷了一次就出现了HH;以$\frac{1}{2}$的概率下一次投掷为T,此时的条件期望为$E_T + 1$。因此,$$E_H = \frac{1}{2} + \frac{1}{2}(E_T + 1)$$

从T开始投掷和从无开始没有任何区别,因此$E_T = E_{\emptyset}$

联立三个方程即可求解:

$$\begin{align*} E_{\emptyset} &= 1 + \frac{1}{2}E_H + \frac{1}{2}E_T\\ \Rightarrow E_{\emptyset} &= 1 + \frac{1}{2}[\frac{1}{2} + \frac{1}{2}(E_T + 1)] + \frac{1}{2}E_T\\ \Rightarrow E_{\emptyset} &= \frac{3}{2} + \frac{3}{4}E_T\\ &= \frac{3}{2} + \frac{3}{4}E_{\emptyset}\\ \Rightarrow \frac{1}{4}E_{\emptyset} &= \frac{3}{2}\\ \Rightarrow E_{\emptyset} &= 6 \end{align*}$$

 

赌徒破产问题

再来看一个经典的赌徒破产(gambler's ruin)问题

Q:一个赌徒手中持有a美元,他和庄家进行抛均匀硬币的赌博,如果硬币为正面,赌徒获得1美元,否则赌徒失去1美元。当赌徒持有0美元时,以赌徒失败结束游戏;当赌徒持有a + b美元时,以庄家破产结束游戏。问赌徒的获胜概率。

我们用$p_i$表示赌徒手中持有$i$美元时,最终的获胜概率。

那么$p_0 = 0, p_{a + b} = 1$。

我们接下来分析$p_i$之间的关系。当赌徒手中持有$i$美元时,以$\frac{1}{2}$的概率获得1美元,条件获胜概率为$p_{i + 1}$;以$\frac{1}{2}$的概率失去1美元,条件获胜概率为$p_{i - 1}$。

因此,$$p_i = \frac{1}{2}p_{i + 1} + \frac{1}{2}p_{i - 1}$$

$p_0, p_1, p_2, \ldots, p_{a + b}$构成等差数列,不难解得$p_i = \frac{i}{a + b}$。因此赌徒最初得获胜概率为$p_a = \frac{a}{a + b}$。

使用同样的方法也可以对于非均匀硬币求得获胜概率,只是数学略微困难一些。

   

概率论教程

更多练习题请见概率论练习题

更多概率论相关问题见本网站论坛概率论版面

更多面试真题见面试真题汇总

更多面试问题见面试真题汇总

想要查看更多数据科学相关的内容请关注我们的微信公众号知乎专栏