中人网

标题: 博弈论经典案例—囚徒困境转 [打印本页]

作者: 案例.简单 时间: 2008-8-23 00:49
标题: 博弈论经典案例—囚徒困境转
[color=black][size=3][size=4][b]博弈论经典案例—囚徒困境[/b][/size] [/size] [img=602,219]http://1832.img.pp.sohu.com.cn/images/blog/2008/7/1/10/21/11b81eb7f3f.jpg[/img] [size=3]　　[/size][size=3][b][font=宋体]博弈论[/font](Game Theory)[/b][font=宋体]，有时也称为对策论，或者赛局理论，是研究具有斗争或竞争性质现象的理论和方法。[/font][/size] [size=3]　　具有竞争或对抗性质的行为成为博弈行为，在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。为了达到各自的目标和利益，各方必须考虑对手的各种可能的行动方案，并力图选取对自己最为有利或最为合理的方案。比如日常生活中的下棋，打牌等。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。 [/size] [size=3]　　博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。 [/size] [size=3]　　对于博弈论的研究，开始于策墨洛(Zermelo,1913)、波雷尔(Borel,1921)及冯·诺伊曼(von Neumann, 1928)，后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern，1944，1947)首次对其系统化和形式化（参照Myerson,1991）。随后约翰·福布斯·纳什(John Forbes Nash Jr.,1950, 1951)利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 [/size] [size=3]　　[b]当代博弈论的“三大家”和“四君子”[/b] [/size] [size=3][color=#00ff][/color][/size][size=3]　　"三大家" 包括[url=http://wiki.mbalib.com/wiki/%E7%BA%A6%E7%BF%B0%C2%B7%E7%A6%8F%E5%B8%83%E6%96%AF%C2%B7%E7%BA%B3%E4%BB%80][size=2]约翰·福布斯·纳什[/size][/url]、[url=http://wiki.mbalib.com/wiki/%E7%BA%A6%E7%BF%B0%C2%B7C%C2%B7%E6%B5%B7%E8%90%A8%E5%B0%BC][size=2]约翰·C·海萨尼[/size][/url]以及[url=http://wiki.mbalib.com/wiki/%E8%8E%B1%E5%9B%A0%E5%93%88%E5%BE%B7%C2%B7%E6%B3%BD%E5%B0%94%E8%85%BE][size=2]莱因哈德·泽尔腾[/size][/url]。这三人同时因为他们对博弈论的突出贡献而获得1994年的[url=http://wiki.mbalib.com/wiki/%E7%91%9E%E5%85%B8%E9%93%B6%E8%A1%8C%E7%BB%8F%E6%B5%8E%E5%AD%A6%E5%A5%96][size=2]瑞典银行经济学奖[/size][/url]（也称[url=http://wiki.mbalib.com/wiki/%E8%AF%BA%E8%B4%9D%E5%B0%94%E7%BB%8F%E6%B5%8E%E5%AD%A6%E5%A5%96][size=2]诺贝尔经济学奖[/size][/url]）。 [/size] [size=3]　　 [/size][size=3][color=#000]"[/color][/size][size=3][color=#000]四君子" 包括[url=http://wiki.mbalib.com/wiki/%E7%BD%97%E4%BC%AF%E7%89%B9%C2%B7J%C2%B7%E5%A5%A5%E6%9B%BC][size=2]罗伯特·J·奥曼[/size][/url]、[url=http://wiki.mbalib.com/w/index.php?title=%E8%82%AF%C2%B7%E5%AE%BE%E6%91%A9%E5%B0%94&action=edit][size=2]肯·宾摩尔[/size][/url]、[url=http://wiki.mbalib.com/w/index.php?title=%E6%88%B4%E7%BB%B4%C2%B7%E5%85%8B%E7%91%9E%E6%99%AE%E6%96%AF&action=edit][size=2]戴维·克瑞普斯[/size][/url]以及[url=http://wiki.mbalib.com/w/index.php?title=%E9%98%BF%E9%87%8C%E5%B0%94%C2%B7%E9%B2%81%E5%AE%BE%E6%96%AF%E5%9D%A6&action=edit][size=2]阿里尔·鲁宾斯坦[/size][/url]。[/color][/size] [size=3]　　 [/size][size=3]囚徒困境悖论[url=http://wiki.mbalib.com/wiki/%E5%9B%9A%E5%BE%92%E5%9B%B0%E5%A2%83%E6%82%96%E8%AE%BA] [/url](Prisoner's dilemma)[/size] [img]http://1802.img.pp.sohu.com.cn/images/blog/2008/7/1/10/9/11b81ccf66f.jpg[/img] [size=3]博弈论中一个有名有趣的应用例子是囚徒困境悖论[url=http://wiki.mbalib.com/wiki/%E5%9B%9A%E5%BE%92%E5%9B%B0%E5%A2%83%E6%82%96%E8%AE%BA] [/url](Prisoner's dilemma)。 [/size] [size=3]　　囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。 [/size] [size=3] [/size] [align=left][size=3][font=宋体][size=12pt]1950[/size][/font][font=宋体][size=12pt]年，由就职于兰德公司的梅里尔·弗拉德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问阿尔伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。 [/size][/font][/size][/align][align=left][size=3][font=宋体][size=12pt]经典的囚徒困境如下： [/size][/font][/size][/align][align=left][size=3][font=宋体][size=12pt]　　警方逮捕A、B两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择： [/size][/font][/size][/align][list][size=3][font=宋体][size=12pt][color=#3f3f3f]若一人认罪并作证检举对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监20年。 [/color][/size][/font][/size][size=3][font=宋体][size=12pt][color=#3f3f3f]若二人都保持沉默（相关术语称互相“合作”），则二人同样判监一年。 [/color][/size][/font][/size][*][size=3][font=宋体][size=12pt][color=#3f3f3f]若二人都互相检举（互相“背叛”），则二人同样判监5年。 [/color][/size][/font][/size][/list][align=left][size=3][font=宋体][size=12pt]用图表概述如下：[/size][/font][/size][/align][img]http://1822.img.pp.sohu.com.cn/images/blog/2008/7/1/10/26/11b81d92f12.jpg[/img] [align=left][size=3][font=宋体][size=12pt]　　如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。 [/size][/font][/size][/align][align=left][size=3][font=宋体][size=12pt]　　囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择： [/size][/font][/size][/align][list][size=3][font=宋体][size=12pt][color=#3f3f3f]若对方沉默、背叛会让我获释，所以会选择背叛。 [/color][/size][/font][/size][*][size=3][font=宋体][size=12pt][color=#3f3f3f]若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。 [/color][/size][/font][/size][/list][align=left][size=3][font=宋体][size=12pt]　　二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。 [/size][/font][/size][/align][align=left][size=3][font=宋体][size=12pt]　　这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。 [/size][/font][/size][/align][size=3][color=#00ff]（帕累托最优是指在不减少一方福利的情况下，就不可能增加另外一方的福利[url=http://wiki.mbalib.com/wiki/%E7%A6%8F%E5%88%A9] [/url]；而帕累托改进是指在不减少一方的福利时，通过改变现有的资源配置[url=http://wiki.mbalib.com/wiki/%E8%B5%84%E6%BA%90%E9%85%8D%E7%BD%AE] [/url]而提高另一方的福利。）[/color] [/size] [/color]

作者: moonduke 时间: 2010-9-18 14:53

有点看不懂

作者: MichlleMe 时间: 2010-9-28 16:27
穷途困境简单化总结就是：把与自己利益关系的人聚集在一起共同抵抗困难。

作者: 画人体的小和尚 时间: 2010-10-3 09:01
本站发表读者评论，并不代表我们赞同或者支持读者的观点。我们的立场仅限于传播更多读者感兴趣的信息。

作者: 求道者 时间: 2011-1-21 17:02
优点乱

欢迎光临中人网 (http://bbs.chinahrd.net/)