在最佳约会策略里,我们提到,如果有 100 个女孩可以顺序挑选,那么最好的方法是先看前 37 个,然后在剩下的女孩里选择当时最好的那个女孩,这样有接近 40%的概率挑选到最好的那个女孩。同时,不可能有更好的策略。
American Scientist 于 2009 年出版的一篇文章How to gamble if you must—the mathematics of optimal stopping,里面讨论了一个简单的情景,而且有一个非常违反直觉的答案。在这个简单场景里,你只有两个女孩可以挑选。当你见了第一个女孩后,你只有两种选择,选第一个女孩,或者放弃第一个女孩,这时候你只能选第二个女孩。你能有多大概率选中两个女孩中较好的那一个呢?
直觉上好像没有比总是挑第一个,总是挑第二个,或者随机挑更好的方法,这几个方法成功的概率都是二分之一。但如果好坏的标准可用用分数来体现(即使评分方法和评分范围等一切东西都未知),同时这两个女孩的排序是随机的,那么有一种方法,无论这两个女孩的分值是何种分布,你都有超过一半的概率选中较好的女孩。
方法很简单:生成一个随机数x ,符合标准正态分布。将x 与第一个女孩的分值p 比较。如果p 大于x ,则选择第一个女孩,否则放弃第一个女孩,选择第二个女孩。
这时候,如果两个女孩之间的排序是随机的,那么无论女孩的分值是何种分布,都有超过一半的概率选中较好的那位女孩。
证明:
假设两个女孩的分值分别为p 和q ,满足p<q ,N 为正态分布的累计分布函数。那么第一个女孩较好时,成功选中第一位女孩的概率为P(x<q)=N(q) ;如果第二位女孩较好时,成功选中第二位女孩的概率为P(x>p)=1−N(p) 。所以你选中较好的女孩的平均概率为 (N(q)+1−N(p))/2 ,由于p<q ,所以N(p)<N(q) ,所以平均概率大于12 。
有趣的是,这种方法可以保证成功的概率高于 1/2 ,但无法保证高于任何一个大于 1/2 的数。
Q. E. D.