曲谱自学网>知识库>正文

囚徒困境博弈_论述囚徒困境中两个囚徒之间的博弈过程（西方经济

时间:2020-02-22 05:08:00编辑:刘牛来源:曲谱自学网

论述囚徒困境中两个囚徒之间的博弈过程（西方经济学）

囚徒困境可以简单的用图上的表格表示出来，

针对甲而言，如果乙选择了沉默，则对于甲而言，选择沉默是判罪一年，如果坦白，是立即获释；

如果已选择了认罪，则对于甲而言，选择沉默是判罪十年，选择坦白，是判罪一年。

因此，无论乙做何种选择，甲的最优策略只有选择坦白。

同理，无论甲做何种选择，乙的最优策略也只有选择坦白。

所以，囚徒困境的纳什均衡就是甲乙都选择坦白。

这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。该例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

囚徒困境的来历和博弈的关系

“囚徒困境”是1950年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年；若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。

来源：

囚徒困境的故事讲的是，两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。于是，每个囚徒都面临两种选择：坦白或抵赖。然而，不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，不坦白的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，不坦白的话判十年，坦白还是比不坦白好。结果，两个嫌疑犯都选择坦白，各判刑八年。如果两人都抵赖，各判一年，显然这个结果好。但这个帕累托改进办不到，因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是，人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。

单次多重
单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。
在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。
主旨
囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。

解说
如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。
囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：
若对方沉默时，背叛会让我获释，所以会选择背叛。
若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。
二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。
这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。

举例：

军备竞赛
在政治学中，两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两种选择：增加军备（背叛）、或是达成削减武器协议（合作）。两国都无法肯定对方会遵守协议，因此两国最终会倾向增加军备。似乎自相矛盾的是，虽然增加军备会是两国的“理性”行为，但结果却显得“非理性”（例如会对经济造成损坏等）。这可视作遏制理论的推论，就是以强大的军事力量来遏制对方的进攻，以达到和平。
关税战
两个国家，在关税上可以有以两个选择:
提高关税，以保护自己的商品。（背叛）
与对方达成关税协定，降低关税以利各自商品流通。（合作）
当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）
广告战
商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。
两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。
此二公司可以有二选择：
互相达成协议，减少广告的开支。（合作）
增加广告开支，设法提升广告的质量，压倒对方。（背叛）
若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。
自行车赛
自行车赛事的比赛策略也是一种博弈，而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况：选手们在到终点前的路程常以大队伍（英文:Peloton）方式前进，他们采取这策略是为了令自己不至于太落后，又出力适中。而最前方的选手在迎风时是最费力的，所以选择在前方是最差的策略。通常会发生这样的情况，大家起先都不愿意向前（共同背叛），这使得全体速度很慢，而后通常会有二或多位选手骑到前面，然后一段时间内互相交换最前方位置，以分担风的阻力（共同合作），使得全体的速度有所提升，而这时如果前方的其中一人试图一直保持前方位置（背叛），其他选手以及大队伍就会赶上（共同背叛）。而通常的情况是，在最前面次数最多的选手（合作）通常会到最后被落后的选手赶上（背叛），因为后面的选手骑在前面选手的冲流之中，比较不费力。

囚徒困境博弈对经济学的意义

个人感觉囚徒困境的博弈分析是给大家展示了一个纳什均衡与直观的最优相背的现象，当大家都考虑自己利益最大化的时候，双方利益都受损，这与微观经济学中大家都将自己利益最大化时总体利益也最大是相背的。这种现象提供给经济学更多的解释与思考空间，比如怎样避免囚徒困境啊，合作啊，遵守协议啊等等。不过我觉得出了经济学，这个意义更大，毕竟经济人假设只是人的一面，不是全部，不该由完全的经济视角来解读人性。

囚徒困境里如果2个囚徒学过博弈论，他们会不会选择合作？也就是选择不坦白？

不会，因为这是人性。他们不知道对方会不会。即使知道对方会，也不敢保证对方会不会合作，会不会在背后捅自己一刀。越是聪明的人越不会轻易相信别人。

能给几个比较新的囚徒博弈例子吗

　　囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。
　　单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。
　　在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。
　　囚徒困境的主旨为，囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。

囚徒困境的博弈问题

因为环境诱因导致双方对利益需求互不退让，因而无数次得博弈后仍不得其解，恋人们的海誓山盟是基于当下的感官升华，我觉得和博弈不是很搭界……

关于囚徒困境，高手来！经典囚徒困境是2个选择，3个结果。有没有3种选择结果多至6个的囚徒困境博弈例

囚徒困境的关注点有两个。
1.存在强势策略。两人囚徒困境中，背叛属于强势策略，合作属于弱势策略。
2.都选择强势策略的收益低于都选择弱势策略的收益。
以上两点导致囚徒博弈的纳什均衡倒向都选择强势策略的结果。如果增加选择，整个博弈情况并没有太大改变，最强势的策略会被选择，而在这种情况下，总收益却小于都选择弱势策略。这就是囚徒所处的博弈困境。

嘿孩子电视剧_嘿孩子电视剧大结局是什么嘿孩子大结局剧情剧透

四喜丸子的做法大全_四喜丸子的简单做法？

热门曲谱

个税计算方法
概括：这道题是文缘卣同学的课后练习题，主要是关于个税计算方法，指导老师为惠老师。负所得税制度的意义财税部门出台了给予弱势群...[详情]分类：知识库时间：14:51

李光洁宣布结婚彭于晏带违规水果过海关被罚据台湾媒体报道，彭于晏7月1日返回台北在松山机场过海关的时候，因为不小心带了水果，被海关查获并罚款3000元台币。有台湾媒体询问机场工作人...[详情]分类：知识库时间：12:37

什么可以美白牙齿
概括：这道题是贡泼俊同学的课后练习题，主要是关于什么可以美白牙齿，指导老师为井老师。冷光美白牙齿顾名思义就是用冷光来美白牙...[详情]分类：知识库时间：14:58

什么是连带责任
概括：这道题是满澄檬同学的课后政治练习题，主要是关于什么是连带责任，指导老师为宦老师。
题目：什么是连带责任
...[详情]分类：知识库时间：14:58

趣头条与江苏卫视达成战略合作彭于晏带违规水果过海关被罚据台湾媒体报道，彭于晏7月1日返回台北在松山机场过海关的时候，因为不小心带了水果，被海关查获并罚款3000元台币。有台湾媒体询问机场工作人...[详情]分类：知识库时间：12:37

利率怎么算
概括：这道题是从纲凑同学的课后练习题，主要是关于利率怎么算，指导老师为殳老师。银行利率表示一定时期内利息量与本金的比率，通...[详情]分类：知识库时间：14:58

名贵树种
概括：这道题是山翁灿同学的课后练习题，主要是关于名贵树种，指导老师为谈老师。
题目：名贵树种
解： ...[详情]分类：知识库时间：14:56

埃利斯
概括：这道题是苏似涡同学的课后政治练习题，主要是关于埃利斯，指导老师为裴老师。
题目：埃利斯
解： ...[详情]分类：知识库时间：14:54

差异
概括：这道题是巫唐抖同学的课后练习题，主要是关于差异，指导老师为左老师。暂时性差异是由税收法规与会计准则确认时间或计税基础...[详情]分类：知识库时间：14:53

平衡梁
概括：这道题是浦晓淖同学的课后练习题，主要是关于平衡梁，指导老师为赵老师。平衡梁为吊装机具的重要组成部分，可用于保持被吊设...[详情]分类：知识库时间：14:54

建筑图集
概括：这道题是蓟侠位同学的课后政治练习题，主要是关于建筑图集，指导老师为焦老师。《新疆传统建筑图集》是2009年新疆科学技术出...[详情]分类：知识库时间：14:54

成分分析
概括：这道题是颜仑徽同学的课后练习题，主要是关于成分分析，指导老师为戈老师。
题目：成分分析
解： ...[详情]分类：知识库时间：14:56

无坚不摧之力
概括：这道题是路婆掖同学的课后政治练习题，主要是关于无坚不摧之力，指导老师为祁老师。
题目：无坚不摧之力
解：<...[详情]分类：知识库时间：14:54

气垫船原理
概括：这道题是席洞朴同学的课后练习题，主要是关于气垫船原理，指导老师为毛老师。通风工程是送风、排风、除尘、气力输送以及防、...[详情]分类：知识库时间：14:54

海狸
概括：这道题是项筛卦同学的课后练习题，主要是关于海狸，指导老师为钱老师。
题目：海狸
解： ...[详情]分类：知识库时间：14:56

38译码器
知识点：《38译码器》 收集：瞿收霉 编辑：桂花
本知识点包括：1、38译码器在单片机系统中的作用是什么? 2、求vh...[详情]分类：知识库时间：10:57

aidma
知识点：《aidma》 收集：蒯超峦 编辑：栀子花女孩
本知识点包括：1、SOV/SOM是什么？AIDMA和AIDAS理论代表什么...[详情]分类：知识库时间：12:08

最新曲谱

天涯明月刀手游心剑战境琴魔攻略天刀手游 OPPO Find X3系列即将首销，诸多优惠福利等 UP主的创作利器，联想ThinkVision 思匠27深淘宝全网征集首席鉴雕官歌手周深成功当选钢铁战舰秒变萌系舰娘？舰长们爱了，一起冲真撼于新三星电视2021全系列新品国内首发 万国觉醒初始将领怎么样初始将领强度分析 《战双帕弥什》仰光技能装备攻略《战双帕弥什》最强阵容组合推荐搭配攻略荒野大镖客2 河狸岩洞主线血仇血债血偿 vivo进入欧洲六大国家加速全球化进程武汉进口洗发水报关专业报关行对话《剑网3缘起》制作团队：回味当初的热广积科技推出一款最新的含有Intel? 酷睿2双鸿图之下：顶级公司出二流产品？ 5力王炸华硕500系主板释放11代酷睿强大苏宁为一加手机“加油”：专属9折保值服务 水果连连看3手机版下载 王国保卫战破解版全英雄2021 【挖财报】电商“三国杀”进高潮：拼多多8 黎明觉醒火种测试什么时候上线黎明觉醒火客如云发布烘焙2.0版本直击行业痛点深入垂 AWE 2021来了，看夏普将如何秀硬核实力！海信激光电视成主流，只为保护下一代的眼睛海信激光电视L9F首次搭载智能摄像头为社交 三国志10威力加强版免安装版下载[百度网盘 三国志战略版马超青州兵阵容马超关银屏张炉石传说钻石卡怎么获得钻石卡获取方法犯罪大师生日红包谜题答案是什么侦探委托犯罪大师生日红包答案是什么侦探委托生日皇室战争卡组大全最强卡组搭配推荐做一个有味道的女人，让男人对你充满期待比心与王者荣耀世冠冠军WB战队合作签约,多元气骑士植物种子大全种子效果介绍犯罪大师生日谜题答案是什么生日谜题正确 8GB运存+256GB储存+10000mAh，仅1699元，开犯罪大师协会谜题答案是什么协会谜题最终保卫萝卜3电脑版客户端官方免费下载[官方PC 《大富翁 10》计划登陆 NS 平台:系列的单坦克世界免费下载[战争游戏] 三国英杰传下载中文硬盘版三国志曹操传中文版电脑版官方免费下载V中奥拉星2月5日活动预告王者荣耀凤求凰2021年什么时候返场 2021五 OPPO这次的新旗舰，开始“搞颜色”了，当然 OPPO Find X3系列发布十年理想之作带来全穿越火线王者轮回价格表2021 手游cf王者轮 《变形金刚6》预告发布！神秘黑武士惊艳亮 《战双帕弥什》七实友人隐藏间章攻略犯罪大师特殊快递答案是什么 3.12侦探委托合金弹头全集中文版下载合金弹头6免费下载[经典街机] 《一梦江湖》：论如何与师傅相处？玩家：凭排兵布阵，魔宠远征《新神魔大陆》开启新春碧蓝航线3月12日更新内容汇总九城改行挖矿，还记得大明湖畔的魔兽世界、天谕手游春日盛典怎么玩春日盛典主题活动崩坏3 4.6测试服v3速报哥伦布圣痕实装使命召唤手游s3赛季手册奖励大全 E for Sale in Philadelphia''s ''LOVE Par 犯罪大师眼熟的文字答案是什么眼熟的文字3 守望先锋2激活码跑跑卡丁车英文名字_Bombasti mood 和平精英二周年开启时间预测和平精英二周塔防三国志2 创出《九阳真经》的斗酒僧是谁？专家：可能如梦奇谭之八行书攻略：请你排兵布阵！海信电视海量”黑科技“,带你领略前所未有《荒野大镖客2》指南（八）最强套装——东三星/小米/华为/联想/酷派/中兴通用线刷刷《仁王2》全木灵收集攻略木灵位置及获取方 犯罪大师16张牌的游戏答案是什么极速破译1 王者荣耀细节考验最全答案汇总王者荣耀这是哪种口红颜色呢峡谷女神的细王者荣耀细节考验3月8日答案大全，细节考验和平精英与Bilibili心动大作战怎么玩心动九阴真经明日维护丨喜迎元宵，福利开启~ 华硕500系主板 11代酷睿理想之选为演《神雕侠侣》整容，结果被黄晓明挤走，犯罪大师3月6日疑案追凶答案是什么犯罪大犯罪大师魔方密云答案是什么魔方密云答案玩的就是心跳游戏王国《攻城掠地》精彩内容犯罪大师魔方密云答案是什么犯罪大师侦探《战双帕弥什》露西亚黎明意识武器推荐这个黄金周，湖北有多火？犯罪大师黑白翻转答案是什么黑白翻转答案使命召唤手游绝密行动怎么玩使命召唤手游犯罪大师3.3汉堡汪推理测试题答案是什么 3. 奶茶原料全面涨价！奶茶会跟着涨吗？厂商回朱元璋指着猪蹄问沈万三，这道菜叫啥？沈万苹果手机APP软件你哪个用的最久? 一款游戏! 孟晚舟做出重大决定后，一条重磅消息传回国谁给的权力？美国务卿要求中方无条件放人，还想对“中国芯”卡脖子？美国口号喊得震天全面开战，互撕开始！助手称梅根欺负人，梅日媒：中国已开始开发反击美国的工具！白宫 199亿“捡漏”万达77家酒店，现在却后悔不那些有2套房的40%家庭，未来会面临什么？“ 2021年，开发商降价促销，买房人要求赔偿，神秘的“天地煎”！两味药，横扫春天干燥症睡觉时，突然出现脚踩空，身体还抖一下，到你知道吗？身体的问题是由于心理造成的，身这3种伤肝的甜食，建议少吃，通过这3种方法尿酸偏高，身体多半会有这3种情况，想稳定夫妻“办事”一定要选在晚上？这些“黄金时摄影最佳快门速度的五个技巧，轻松拍摄各类教你6个拍花构图技巧，和1个花朵摄影技巧，人像摄影的最佳光圈是多少？蛋白质检测和定量方法霍金的担心又被印证，研究发现：未来地球人科学家们提出了物理上可行的曲速引擎的第一喜讯！天问一号传回高清火星影像，全面整理人类已经彻底改变了地球上水的储存方式来自火星上的6个引发“火星文明阴谋论”的不是我嫌贫爱富，而是条件越优越的男人，反刚结婚与婚后几年的差别，你中招了吗？婆婆病重住院媳妇给10万，老公知道后，竟抬失去双亲后，姑姑宁愿离婚也要供她上大学，生下女孩婆婆竟让俺吃冷饭，亲妈来后拿出一 “吃绝户”悄悄兴起，成为养儿家庭的新目标

囚徒困境博弈_论述囚徒困境中两个囚徒之间的博弈过程（西方经济

论述囚徒困境中两个囚徒之间的博弈过程（西方经济学）

囚徒困境的来历和博弈的关系

囚徒困境博弈对经济学的意义

囚徒困境里如果2个囚徒学过博弈论，他们会不会选择合作？也就是选择不坦白？

能给几个比较新的囚徒博弈例子吗

囚徒困境的博弈问题

关于囚徒困境，高手来！经典囚徒困境是2个选择，3个结果。有没有3种选择结果多至6个的囚徒困境博弈例

热门曲谱

题目：个人所得税税率

题目：什么是连带责任

题目：名贵树种

题目：埃利斯

题目：成分分析

题目：无坚不摧之力

题目：海狸