在 slashdot 上看到一篇科技新闻,两个数学家(其中一个来自于 MIT )和一个计算机学家,在 arXiv 上发表了一篇论文《HOW TO GAMBLE IF YOU』RE IN A HURRY》(PDF 版链接),是最近几天很热门的一条新闻。
其实论文的内容很简单,基本上就是我以前一篇博客赌博的最优策略里的内容:
假设有数量为$ n$ 的本钱,赌博规则为每次可以压任意多的钱,赌博结果为以$ p$ 的概率赢回同样多的钱(输了的话压出去的钱就没了)。如果赌博的目标是本钱增长到$ N$ 或者破产(输光所有的钱为止)。问什么样的方式可以最大化成功(赢到$ N$ 走人)的概率呢?
然后这篇文章里只考虑离散的情况,即$ n$ 和$ N$ 都是整数,并且每次只能下整数的赌注。在这种情况下问题更简单了。如果不考虑结束的时间的话,赌博的策略如下:
如果$ p<0.5$ ,那么每次下注$ \min(n, N-n)$ 。
如果$ p>0.5$ ,每次下注 1。
但当$ p>0.5$ 时,每次下注 1 ,游戏结束的时间太长了。更优的方法是Kelly 判据,即每次押上$ 2p-1$ 倍的本金。在初始本金 n 为 100 , N 为 200 , p 为 3/5 时, Kelly 策略的成功概率为 99.988%,期望结束时间只有 45 轮,而每次下注 1 的期望结束时间是 500 轮。
那上面新闻里的论文做了什么工作呢?事实上,它给出了一个程序,用来计算用什么方式可以最大化在给定期限$ T$ 内赢到$ N$ 走人的概率(还有一些其它乱七八糟但也差不多的东西),即计算以下函数:
好吧,我也没明白这篇文章为何会这么热门,我认为这个程序是一个本科生甚至一个高中生就可以完成的工作,这篇文章也不是严肃的学术性结果。新闻里提到作者之一 Evangelos Georgiadis 是来自 MIT 的数学家。但我在 MIT 上找不到该人的详细信息,深表怀疑他只是 MIT 的一个学生。
Q. E. D.