四概率贝叶斯问题的解答流程

丹尼尔·卡尼曼是著名的心理和经济学家,曾于2002年获诺贝尔经济学奖。他在著作 《思考,快与慢》 中出了这样一道题:

一辆出租车在夜晚肇事之后逃逸,一位目击证人辨认出肇事车辆是蓝色的。已知这座城市 85% 的出租车是绿色的,15% 是蓝色的。警察经过测试,认为目击者在当时可以正确辨认出这两种颜色的概率是 80%, 辨别错误的概率是 20%. 请问,肇事出租车是蓝色的概率是多少?

如果你已经学过了贝叶斯定理,可以花上 5 分钟的时间尝试解答这个问题。


在公布答案之前,我们先来分析这个题目。

阅读之后,我的第一感觉是,提问的方式有一定的迷惑性。当晚肇事出租车是蓝色的概率,似乎并不容易找到与其他概率的对应关系。这时,我们要记住,贝叶斯问题求解的一定是后验概率。现在这个概率长着一副先验概率的模样,并没有“在 XX 条件下”这样的限定,但只要稍加思考,就可以看出它的本质。所谓肇事出租车是蓝色的概率,在没有目击证人之前是 15%, 这是先验概率。目击证人辨认出车是蓝色的之后,这个概率发生了变化,因此我们所求的正是这个后验概率。

众所周知,贝叶斯公式是

\[
P(A|B) = \frac{P(B|A) * P(A)}{P(B)}
\]

对于本问题而言,A 事件是肇事出租车为蓝色,B 事件是目击证人辨认出一辆出租车为蓝色。现在我们来计算\(P(A), P(B), P(B|A)\)的概率。

首先,根据之前的分析,先验概率\(P(A)\)可以直接看出是 15%.

其次,我们来考虑\(P(B|A)\)的实际意义。在肇事出租车为蓝色的条件下,目击证人辨认它为蓝色的概率,其实就是目击证人正确辨认这两种颜色的概率。按照题目当中的说法,这个概率是 80%.

最后,计算\(P(B)\)是一个较为麻烦的过程。目击证人看到一辆车为蓝色,实际上有两种可能:一种是车本身为蓝色,辨认也是正确的;另一种是车本身为绿色,但被错看成是蓝色。将这两种情况相加,才是\(P(B)\)的真实值。

将上述三个概率带入公式中,可以得到\(P(A|B) = 0.41\).


上面的习题是一个经典的四概率贝叶斯问题。这种问题虽然有一定的迷惑性,但也具有简单易行的解答流程。

  1. 将待求解的概率通过一个后验概率的形式表达出来。
  2. 将这个后验概率的条件与结论拆开,写出 A 事件和 B 事件。
  3. 列写贝叶斯公式。
  4. 明确分子上的两个概率的意义,他们可以从题目中直接找到。
  5. 求解分母的概率。注意它一定包含了分子中的事件。
  6. 求解贝叶斯概率,检查答案。