一、问题介绍
1.1 背景
蒙提霍尔问题,亦称为蒙特霍问题或三门问题(英文:Monty Hall problem),是一个源自博弈论的数学游戏问题,大致出自美国的电视游戏节目Let’s Make a Deal。问题的名字来自该节目的主持人蒙蒂•霍尔。 详情参见:维基百科
1.2 玩法
1.2.1 原描述方式
背景:参赛者会看见三扇关闭的门,其中一扇门后面有奖品,选中后面有奖品的那扇门就可以赢得该奖品,而另外两扇门后面则没有任何东西。
当参赛者选定了一扇门,但未去开启它的时候,知道门后情形的节目主持人,会在剩下的两扇门中开启没有任何东西的一扇。主持人此时会问参赛者要不要换另一扇仍然关上的门。
问题:换另一扇门会否增加参赛者赢得汽车的机会率?
1.2.2 更明确的描述方式
背景:
参赛者在三扇门中挑选一扇。他并不知道内里有什么。
主持人知道每扇门后面有什么。
主持人必须开启剩下的其中一扇门,并且必须提供换门的机会。
主持人永远都会挑一扇有山羊的门。
如果参赛者挑了一扇有山羊的门,主持人必须挑另一扇有山羊的门。
如果参赛者挑了一扇有汽车的门,主持人随机(概率均匀分布)在另外两扇门中挑一扇有山羊的门。
参赛者会被问是否保持他的原来选择,还是转而选择剩下的那一道门。
问题:转换选择可以增加参赛者的机会吗?
对于上面这种描述方式,如果你有概率统计方面的知识,应该能够比较容易地对此问题做出正确判断。有时候,出题者还会故意隐去主持人所知道的信息,此时问题变得较为复杂,就需要分情况讨论了。
二、解答
将3扇门扩展到 \(n\) 扇门,更具一般性,也容易描述。因此,下面皆以 \(n\) 扇门为背景作答。
2.1 情况1:主持人不知道哪扇门后面有奖品,并随机选择一扇门打开
描述:假定有 \(n\) 扇门,只有一扇门后面有奖品,并且主持人(Host)不知道奖品在哪扇门后面。 当参赛者(Contestant),随机选择一扇门后,主持人也会在剩下的 \(n-1\)扇门中随机选择一扇门打开,如果打开的门内无奖品,主持人会给参赛者重新选择的机会。 问题:此时,参赛者有两种方案可选:①保持原选择不变,②在剩下的 \(n-2\) 扇门中随机选择一扇门,问哪一种方案中奖的机会更大。
根据题意,容易得到以下结论:
主持人中奖的概率:\(\mathbf{P}(H)=\frac{1}{n}\),则主持人未中奖的概率:\(\mathbf{P}(\overline{H})=\frac{n-1}{n}\),此处与1.2节不同
参赛者中奖的概率:\(\mathbf{P}(C)=\frac{1}{n}\)
参赛者中奖时,主持人不中奖的概率:\(\mathbf{P}(\overline{H} | \mbox{C})=1\)
根据条件概率公式和乘法公式,方案①的中奖的概率为:
\[\mathbf{P}_1=\mathbf{P}(C | \overline{H})=\frac{\mathbf{P}(C \overline{H})}{\mathbf{P}(\overline{H})}=\frac{\mathbf{P}(\overline{H} | C) \mathbf{P}(C)}{\mathbf{P}(\overline{H})}=\frac{1 \cdot \frac{1}{n}}{\frac{n-1}{n}}=\frac{1}{n-1}\]
方案②的中奖的概率很容易计算:
\[\mathbf{P}_2=\frac{\text{方案①不中奖的概率}}{\text{剩余可选门的数量}}=\frac{1-\frac{1}{n-1}}{n-2}=\frac{1}{n-1}\]
可见,两种方案①②中奖的概率是相同的。
验证
1 | (*编程语言:Mathematica*) |
2.2 情况2:主持人知道哪扇门后面有奖品,并选择无奖品的门打开
描述:假定有 \(n\) 扇门,只有一扇门后面有奖品,并且主持人(Host)知道奖品在哪扇门后面。 当参赛者(Contestant),随机选择一扇门后,主持人会在剩下的 \(n-1\)扇门中选择一扇无奖品的门打开,然后给参赛者重新选择的机会。 问题:此时,参赛者有两种方案可选:①保持原选择不变,②在剩下的 \(n-2\) 扇门中随机选择一扇门,问哪一种方案中奖的机会更大。
根据题意,容易得到以下结论:
主持人中奖的概率:\(\mathbf{P}(H)=0\),则主持人未选中有奖品的门的概率:\(\mathbf{P}(\overline{H})=1\),此处与1.1节不同
参赛者中奖的概率:\(\mathbf{P}(C)=\frac{1}{n}\)
参赛者中奖时,主持人不中奖的概率:\(\mathbf{P}(\overline{H} | \mbox{C})=1\)
根据条件概率公式和乘法公式,方案①的中奖的概率为:
\[\mathbf{P}_1 = \mathbf{P}(C | \overline{H}) = \frac{\mathbf{P}(C \overline{H})}{\mathbf{P}(\overline{H})} = \frac{\mathbf{P}(\overline{H} | C) \mathbf{P}(C)}{\mathbf{P}(\overline{H})} = \frac{1 \cdot \frac{1}{n}}{1} = \frac{1}{n}\]
方案②的中奖的概率很容易计算:
\[\mathbf{P}_2=\frac{\text{方案①不中奖的概率}}{\text{剩余可选门的数量}}=\frac{1-\frac{1}{n}}{n-2}=\frac{n-1}{n \cdot (n-2)}\]
可见,两种方案①②中奖的概率不同,②更高。
验证
1 | (*编程语言:Mathematica*) |
三、总结
如果主持人不知道哪扇门后面有奖品,并随机选择一扇门打开,那么参赛是否重新选择,其中奖概率都是\(\frac{1}{3}\)。
如果主持人知道哪扇门后面有奖品,并选择无奖品的门打开,给参赛者重新选择的机会。那么参赛者应该在剩下的门中重新选择,中奖概率由\(\frac{1}{3}\)上升到\(\frac{2}{3}\)。
乍看蒙提霍尔问题,很容易作出错误的判断,但通过公式推导或编程模拟很容易发现问题的关键所在——主持人是否知道奖品在哪扇门后面以及其行为是否随机,这直接导致了不同的结果。