关于星期二男孩问题的进一步思考
之前写了一篇关于星期二男孩问题的帖子,最近被一位前辈指出了一处问题,虽然这个问题我也隐约注意到了,但直到被指出时才突然顿悟。
星期二问题的描述是这样的:一个人有两个小孩,其中有一个是生于星期二的男孩儿,问另一个是男孩儿的概率是多少?
乍一看之下,另一个小孩的性别与第一个小孩没有关系(事实上也的确是独立的),所以另一个小孩是男孩的概率应该是 50%。但上次我经过计算之后得到的結果是 13/27 。这个结果也并没有错,但需要某个隐藏条件,而对这个隐藏条件的认识正是理解这道题的关键所在。
让我们先看一个简化的版本:一个人有两个小孩,已知其中一个是男孩,问另一个是男孩的概率是多少?
没错,我们先把星期二这个条件去掉了,并且我们假设男孩女孩的出生概率是相等的。这个简化版本的答案是什么?50%?还是可能是其它值?
显然,一个符合我们直觉的事实是:如果这个人现在有一个孩子(无论是男孩还是女孩),他再生一个孩子是男孩的概率是 50%,是女孩的概率也是 50%。但这和上面的说他已经有两个小孩的情况有什么不同吗?
我们来看一个表格:
编号 | 第一个孩子 | 第二个孩子 |
---|---|---|
1 | 男 | 男 |
2 | 男 | 女 |
3 | 女 | 男 |
4 | 女 | 女 |
在这个表格中,他有两个孩子,其中一个孩子是男孩的情况一共有 3 种(当然,对应地,他其中一个孩子是女孩的情况也有 3 种),分别是情况 1、2、3。而这三种情况中,只有在情况 1 下,另一个孩子也是男孩,即:
另一个孩子也是男孩的概率是 1/3 ,而不是直觉所认为的 1/2 !
“只有一个孩子,是男孩,问再生一个孩子也是男孩的概率”和“有两个孩子,其中一个是男孩,问另一个孩子也是男孩的概率”究竟有什么不同?前一种描述,对应的其实是上面表格中编号为 1 和 2 的情况,显然,另一个孩子也是男孩的概率是 50% ;而后一种描述,对应的是上表中编号为 1、2、3 的三种情况,其中另一个孩子也是男孩的概率只有 1/3 。理解了这两者的区别,星期二男孩的问题也就迎刃而解了。
换一种说法,上面两种描述所携带的信息是不同的,第一种描述,只携带了第一个孩子的性别信息,另一个孩子的性别完全是未知的;而第二种描述,已经包含了第二个孩子的性别信息了,做这个描述的观察者知道所有两个孩子的性别,——事实上,这个观察者已经帮你删除了表格中编号为 4 的情况(即两个孩子都是女孩的情况),所以最终的概率受到了影响。也即,最终答案取决于问你这个问题的人告诉你“其中有一个是生于星期二的男孩儿”这个信息的人掌握了多少信息,他只知道一个孩子的性别并且刚好这个孩子是男孩,还是他知道所有两个孩子的性别然后告诉你其中一个是男孩。(关于这一部分,实际上是语义的问题,或说理解上可能出现歧义。见后续文章:《星期二男孩问题的一个等价描述》。)
让我们再来看原题的一个复杂一点的简化。
假设男孩女孩出生的概率相同,并且这个人的孩子有一半的概率是单眼皮,一半的概率是双眼皮,我们可以得到下面的表格:
编号 | 第一个孩子 | 第二个孩子 | 编号 | 第一个孩子 | 第二个孩子 |
---|---|---|---|---|---|
1 | 男单 | 男单 | 9 | 女单 | 男单 |
2 | 男单 | 男双 | 10 | 女单 | 男双 |
3 | 男单 | 女单 | 11 | 女单 | 女单 |
4 | 男单 | 女双 | 12 | 女单 | 女双 |
5 | 男双 | 男单 | 13 | 女双 | 男单 |
6 | 男双 | 男双 | 14 | 女双 | 男双 |
7 | 男双 | 女单 | 15 | 女双 | 女单 |
8 | 男双 | 女双 | 16 | 女双 | 女双 |
上表中,“单”表示单眼皮,“双”表示双眼皮。题目是:这个人有两个小孩,已知其中一个孩子是单眼皮男孩,求另一个孩子也是男孩的概率。
和上面第一个简化类似,我们可以数一下表格中一个孩子是单眼皮男孩的情况,可以看到,编号 1、2、3、4、5、9、13 的情况中一个孩子是单眼皮男孩,共 7 种情况,其中另一个孩子也是男孩的情况有编号 1、2、5 三种,即另一个孩子也是男孩的概率是 3/7 。这儿概率也不是直觉的 50%。
如果把上面的单眼皮、双眼皮换成可能性再多一点的星期几,就回到原题了,如果像上面一样把所有可能性画成表格,我们将得到一个包含 196 种可能的表格。原题之中,其实也隐藏了一个前提,即做出“有两个小孩,其中有一个是生于星期二的男孩儿”这个描述的人,他已经观察了所有两个孩子的性别以及出生在星期几,和上面两个简化版一样,他在作出这个描述的时候,事实上已经删除了一些可能性(两个孩子都是女孩或没有一个孩子出生在星期二的情况),所以此时,我们面对的已经不是所有可能性,而只是所有可能性中的一个部分,所以概率不是 50%,而是 13/27(关于这个数字的计算过程请看上一篇帖子)。当然,如果这个观察者只知道这个人有两个孩子,并且只知道其中一个是星期二出生的男孩,而另一个孩子出生在星期几以及性别他完全不知道,那答案就是 50% 了。
所以,问题的关键点就在这里:观察者掌握了多少信息。他是只知道一个孩子的信息,还是已经观察了所有孩子、掌握了所有孩子的信息,这将决定他在做出描述时是否会在事实上删除掉一些情况,并最终影响到问题的概率。
这真是奇妙啊,做观察的人掌握的信息会影响到最终的结果,这似乎与量子力学中的波函数在被观察时会坍塌似乎有些类似,不过那是另一个深刻而又复杂的问题了。
倒是有另一个有趣的问题与这个问题非常类似,即“蒙特门难题”。
蒙特门难题是这样的:
一位美国电视游戏节目的主持人蒙特,曾在多年之前主持一档档名为成交的节目。 在其中的一个游戏中,蒙特向竞猜者展示了三扇门。有一扇门之后是一辆小轿车。 另两扇门之后是空房间。 蒙特事先知道门后是什么,但您并不知道。
游戏分为三步:
- 您选择一扇门。
- 蒙特将会打开剩余的两扇门中的一扇,展示一个空的房间。 (他从未打开那扇后面藏有汽车的。)
- 然后您可以选择是仍然选择在步骤 1 中选择的那扇门,还是选择去打开另一扇仍然关闭的门。
假定您选择了 A 门。然后蒙特打开了另两扇门中的一扇,假定为 B 门。现在您可以选择改选 C 门或者仍然坚持最初的选择,即 A 门。如果没有改变选择,那么可能会猜对,也可能会猜错。另一方面,如果您改选 C 门,则还是既可能猜对也可能猜错。您会做出什么选择呢?在蒙特打开一扇门之后,是坚持最初的选择,还是改变前面已做的选择呢?为什么呢?
与星期二男孩问题类似,这题的关键点也在于主持人蒙特是否知道小轿车在哪扇门后,如果他知道,那他在步骤 2 中时,事实上就是帮你排除了一个错误的选项,所以这时你应该改变选择,因为这时你改变选择相当于在剩下的两扇门中二选一,猜中的概率是 1/2 。假如蒙特也不知道小轿车在哪扇门后,他随机在另两扇门中打开了一扇,只是刚好打开的是空的房间,那么你换还是不换都一样,猜中的概率仍然是 1/3 。事实上,我们可以把题目步骤改一下,改成:
- 您选择两扇门,比如 A 门、B 门。
- 蒙特将会打开你选择的两扇门中的一扇,展示一个空的房间。 (他从未打开那扇后面藏有汽车的。)
问小轿车在你选择的两扇门中没被打开的那一扇的概率。
改造过后的题目与原题是等价的,但这种步骤应该清晰了很多。你一开始选择了两扇门,小轿车在这两扇门后的概率是 2/3 ,如果蒙特知道小轿车在哪扇门后,明确地帮你排除了一个选项(打开了一扇空门),这时,小轿车在这扇空门后的概率为 0 ,在你选择的另一扇门后的概率为 2/3 ;如果蒙特不知道小轿车在哪扇门后,小轿车在你选中的两扇门后的概率仍然为 2/3 ,但是蒙特有 1/2 的概率打开 A 门,1/2 的概率打开 B 门,如果打开的门后面有小轿车,游戏就结束了,如果刚好打开的是空门,则游戏继续,小轿车在你选中的剩下的那扇门后的概率为 2/3 * 1/2 = 1/3。
当然,根据题意,蒙特是知道小轿车在哪扇门后的,所以你应该改变选择。假如你不确定蒙特知不知道,那你也应该换,因为如果他知道,你换了之后猜对的概率就上升了,假如他不知道,你换了也没什么损失,而根据题意,他事实上已经打开了一扇空门,此时无论他知不知道小轿车在哪扇门后,你改变选择后猜对的概率都是 2/3,所以无论如何,你应该改变选择。
最后简单总结一下,观察者所掌握的信息的多少有时会影响到最终的概率,我们把现实问题抽象为数学问题尤其是概率相关的问题之时,一定要万分小心,因为这一步有时并没有想象的那么简单。
评论:
"观察者所掌握的信息的多少有时会影响到最终的概率", 这个说法似乎欠妥13/27的计算过程, 不自觉使用的是条件概率的经典公式
看来俺该去复习一下概率论了。:-)
路过大哥,你的眼神有问题?你仔细看第一张表格,左列是“第一个孩子”,右列是“第二个孩子”你的问题有一个条件是:第一个孩子是男孩那么为何把第二个孩子给搞混进去?况且这两个条件本身就是“互相独立”的,不可能影响到互相的概率你真的该去复习一下概率论了
不好意思你的推理是正确的,我在此道歉但是蒙特门难题不能这么推理选择后的成功概率是2/3
我的表述的确不够专业(脸红),或许不久的将来能再写一篇稍微专业一些的关于这个主题的帖子。:-)
你说的“选择后的成功概率是2/3”是指选择打开另一扇门成功的概率是2/3吗?是如何推导的呢?
呵呵儿子的问题一开始我也有些武断不过后来我也才恍然大悟这不是个序贯模型(意思就是与顺序无关)关于那个门的问题:如果你的选择完全靠掷骰子,那么选择成功的几率是1/2但是现在你一定选择了去更换门那么一开始你有1/3的几率选择到汽车,2/3选择到空门但是如果你更换了门,那么这个几率自然就反过来了你推理错误的地方在于第一次选择是随机的,而第二次选择是确定的其实想要想通很简单:假设有一亿扇门,只有一扇门后面有大奖你选择了一扇,然后主持人打开剩下门中的99999998扇,只留一扇请问你会怎么选择呢?:P
我写程序模拟了一下,的确,改变选择之后猜中的概率为 2/3 ,而不是我一开始想的 1/2 。:-)
也许你会对这个感兴趣:http://zhiqiang.org/blog/science/three-doors-related-problems.html
有意思,谢谢!:-)
概率不但依赖于你掌握多少信息,而且依赖于你如何获取信息的。
我觉得你是不是走进误区了: 在这个表格中,他有两个孩子,其中一个孩子是男孩的情况一共有 3 种(当然,对应地,他其中一个孩子是女孩的情况也有 3 种),分别是情况 1、2、3。而这三种情况中,只有在情况 1 下,另一个孩子也是男孩,即:你计算概率的基数取的是:“其中一个孩子是男孩的情况”,这个就是误区点。既然你认为"另一个小孩的性别与第一个小孩没有关系(事实上也的确是独立的)"那么计算概率的基数应该取的是“第二个孩子中,再生一个男孩的情况”,那就是全部4种情况中的第1和第3,也就是2/4 = 50%。而即使是要加上已知的限定条件“第一个孩子是男孩”,那概率基数应该取的范围是就是“第一个孩子是男孩时,第二孩子是男孩的概率”,那么结果应该是第1和第2种情况中的第1,那也还是1/2 = 50%
嗯,应该用组合解但是用了排列
第一个还是是男孩和第二个还是的性别没有关系,那么,我们把第一个条件换下,假设某天(星期二吧)下雨和晴天的概率是50%/50%(和男女孩的概率一样),第二个条件不变,依然是生男孩子的概率,毫无疑问,生孩子的性别跟下部下雨是没关系的
陷阱就在“第一个”、“第二个”这个描述这里,题目中说的其实是“有一个”是男孩,有可能是“第一个”是男孩,也有可能是“第二个”是男孩,所以,条件不能那样换,因为不存在所谓的“第一个条件”。:-)
可以看我后来写的一个等价描述。
"此时无论他知不知道小轿车在哪扇门后,你改变选择后猜对的概率都是 2/3" 这是不对的,如果主持人不知道,你的概率其实是1/2,那样换不换都是1/2的。
简单的说,这两种叙述是不同的,所以答案也不同:有两个孩子,其中第一个是男孩,那么第二个是男孩的概率?有两个孩子,其中有一个是男孩,那么另一个是男孩的概率?
是的,理解这一点非常关键。
星期二问题的描述是这样的:一个人有两个小孩,其中有一个是生于星期二的男孩儿,问另一个是男孩儿的概率是多少?1/2老王有两个孩子,已知至少有一个孩子是在星期二出生的男孩。问:两个孩子都是男孩的概率是多大?【假设生男生女的概率相等】13/27有两个孩子,其中第一个是男孩,那么第二个是男孩的概率?有两个孩子,其中有一个是男孩,那么另一个是男孩的概率?兩種表述是一樣的。