TCS: Game Theory & 纳什均衡的计算
Game Theory即博弈论,目前在经济学中运用得最多(纳什更因为他在这上面的工作拿到了诺贝尔经济学奖)。但在最近几年,理论计算机界对它的研究也很热。
Game Theory主要是研究在两人甚至多人的系统中,各方如何选择自己的策略使自己的效益最大化。这里每个人的收益不光决定于自己的决策,还决定于其它人的决策。主要有两种不同的游戏,一种是两人零和游戏,只一个人赢的就是另一个人亏损的。一个典型的例子是下面这个,前两天有人在水木社区数学版问的:
某个村庄上只有一名警察,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。
因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在某家看守财产,而小偷也选择了去该富户家,就会被警察抓住;若警察没有看守财产的富户家而小偷去了,则小偷偷盗成功。
小偷将会去偷哪家?警察又应该守哪家?
还有一种是非零和博弈,经典的囚徒困境就是这一类。在这类博弈中,有可能产生合作实现双赢或者互相欺骗最后双输。
但无论哪种游戏(零和博弈可以看作非零和博弈的一种特殊情况,而n人非零和游戏又可视为n+1人的零和游戏),都存在均衡策略(指各方在知道对方的策略后不会主动改变自己现在的策略)。这就是纳什获得诺贝尔奖的主要结果,后世称此种均衡态为纳什均衡。
理论计算机里的Game Theory主要是研究计算纳什均衡的算法和复杂度。对于两人零和游戏,均衡点的计算即为一个线性规划的问题,目前已经有有效的算法。对于两人(和多人)非零和游戏,均衡点的计算已经被证明为PPAD-complete,一个在P和NP之间的复杂类。
tcs是啥的缩写啊?
零和博弈可以看作非零和博弈的一种特殊情况,而n人非零和游戏又可视为n+1人的零和游戏
这个给解释下,不是特别清楚?
另外,博弈论的直观意义能给解释下否?
记得不是很清楚了,在《美丽心灵》中,纳什当时发现博弈论好像是因为看到鸽子争食和多个男生去追一个女生而受到的启发,对吗?给考古一下啦。
tcs是theoretical computer science的缩写,这些文章应该是我以前写的理论计算机初步系列文章的一篇,只不过懒得带一个那么长的标题前缀了。
上世纪50年代Nash就证明了纳什均衡的存在性。但有意思的是,这个存在性是数学意义上的,它甚至没有给出一个怎么找到它的确定性方法。直到最近几年,在怎么找到均衡点才有一些突破,不过也是负面的复杂性的结果。这个结果是我师兄做出来的,文章已被J. ACM接收。
在博弈论的模型中,每个人都有一个收益矩阵,是否零和游戏决定于这些收益矩阵的和是否为0(所以两人零和游戏可看作只有一个收益矩阵,另一个人为它的负矩阵)。
博弈论的直观意义?它主要是研究一种互动模型。博弈论在现实生活中运用特别广泛,你可以看我给的那个例子。因为A钱多,小偷肯定更想去A家,但警察也知道这一点,他也有可能去A家守株待兔,这时候小偷理智一点就更应该去那个B家了。博弈论就在于定量的分析这些决策行为。其实大到军备竞赛,小到菜市场,都有博弈论的影子。
拜一下你的师兄!
想问问你师兄是谁阿?他的文章名字是什么?3x。
主要结果是这一篇Xi Chen and Xiaotie Deng, Settling the Complexity of 2-Player Nash-Equilibrium
J. ACM那篇应该几篇论文合起来的,现在还没有发出来,没得看。
能不能给出对策论中关于海盗船问题的解法 ??急需 谢谢各位大侠 !!1