赌博的最优策略(II)

作者:, 发表于

生活中的数学

查看该系列所有文章

在slashdot上看到一篇科技新闻,两个数学家(其中一个来自于MIT)和一个计算机学家,在arXiv上发表了一篇论文《HOW TO GAMBLE IF YOU’RE IN A HURRY》(PDF版链接),是最近几天很热门的一条新闻。

其实论文的内容很简单,基本上就是我以前一篇博客赌博的最优策略里的内容:

假设有数量为 \(n\) 的本钱,赌博规则为每次可以压任意多的钱,赌博结果为以 \(p\) 的概率赢回同样多的钱(输了的话压出去的钱就没了)。如果赌博的目标是本钱增长到 \(N\) 或者破产(输光所有的钱为止)。问什么样的方式可以最大化成功(赢到 \(N\) 走人)的概率呢?

然后这篇文章里只考虑离散的情况,即 \(n\)\(N\) 都是整数,并且每次只能下整数的赌注。在这种情况下问题更简单了。如果不考虑结束的时间的话,赌博的策略如下:

如果 \(p<0.5\) ,那么每次下注 \(\min(n, N-n)\)

如果 \(p>0.5\) ,每次下注1。

但当 \(p>0.5\) 时,每次下注1,游戏结束的时间太长了。更优的方法是Kelly判据,即每次押上 \(2p-1\) 倍的本金。在初始本金n为100,N为200,p为3/5时,Kelly策略的成功概率为99.988%,期望结束时间只有45轮,而每次下注1的期望结束时间是500轮。

那上面新闻里的论文做了什么工作呢?事实上,它给出了一个程序,用来计算用什么方式可以最大化在给定期限 \(T\) 内赢到 \(N\) 走人的概率(还有一些其它乱七八糟但也差不多的东西),即计算以下函数:

\[f(n, T) = \max_{1\leq x \leq \min(n, N-n) } \left((1-p)f(n-x, T-1) + pf(n+x,T-1)\right)\]

好吧,我也没明白这篇文章为何会这么热门,我认为这个程序是一个本科生甚至一个高中生就可以完成的工作,这篇文章也不是严肃的学术性结果新闻里提到作者之一Evangelos Georgiadis是来自MIT的数学家。但我在MIT上找不到该人的详细信息,深表怀疑他只是MIT的一个学生。

Q.E.D.


上一篇:北京摇中号有多难2011年5月14日
今天一个朋友向我提起他参与北京买车摇号,他自己和周围十来人都没有摇中的事情,我关注了一下摇号的一些数据。 目前为止已经有四期摇号,第

下一篇:如何匿名统计平均收入2012年1月14日
网络的力量太大,这两次把问题放到网上不到半天,这些问题不但被解答,而且连出处都被翻出来了。这让我自己少了很多思考的乐趣。以后不能把问


  • 支持使用微薄、微信和QQ的账户登陆进行评论。由各自网站直接认证,不会泄露你的密码。
  • 登陆后可选择分享评论到所绑定的社交网络,如微薄、人人和QQ空间。
  • 评论提交后无法修改。如需修改,请删除原评论再重新提交。
  • 评论支持LaTeX代码,行内公式请用\(a+b=c\),行间公式请用\[a+b=c\]。公式只支持英文字符。