前沿的年轻人

前沿的年轻人
菜单
核心概念 数学 发表:2017年12月18日

博弈论与合作:把别人放在第一位可以帮助每个人

文摘

利奥Durocher,从1930年代著名的棒球运动员,曾经说过,“好人有好报。“这可能是真的在棒球比赛中,但它不是真正的在生活中更普遍。在本文中,我们使用数学分支的想法被称为“游戏理论”研究的情况称为“囚犯困境(PD)”,揭示了为什么人们常常不能很好地协同工作。博弈理论表明,人善良和值得信赖的战略优势,因为他们可以“改变游戏”逃避PD,让每个人都更好,包括自己。所以,真正的“好人有好报”。

简介:游戏,游戏无处不在

没有人是一座孤岛,整个的本身。(17世纪英国诗人约翰·多恩)

当人们说的“游戏”,他们通常谈论娱乐,像跳棋和垄断,或者运动,像足球或篮球。但在数学分支称为“游戏理论”,我们的游戏在更广泛的意义。

定义:游戏

情况是一个“游戏”时(我)不止一个人做决定和(2)人们的决策影响。

几乎我们所做的一切在博弈论的感觉。生活是一场游戏在家里,在学校,无论我们去哪里,我们所做的一切,我们玩游戏。不相信我吗?回想一开始你的一天,当你醒来。多快你下了床影响服装店多早他们叫醒你影响你,这是一个游戏!想到接下来发生的事情,其余的一整天。从浴室到早餐桌上,在教室里,在操场上,你做出选择,影响他人和自己。你玩游戏!了解博弈论可以帮助你提高你的经验在这些situations-not只是为了“赢”但改善你的人际关系,有一个幸福的生活。

博弈论是用来研究人们如何可能表现在战略的情况下,应用经济学,政治科学,商业策略,法律,企业家精神,和军事科学,等等。正如物理学描述行星围绕太阳,博弈理论试图描述人们如何在游戏中做出决定。数学是有用的在博弈论工具来分析球员的动机和预测结果。有时,作为预测,在下一个示例中,博弈论可以相当意外。

例如:和朋友外出吃饭

八个朋友决定在汉堡餐厅一起出去吃午饭。他们将平分账单一视同仁。有两个菜单上:(i)一个普通汉堡售价4美元,(ii)成本8美元的豪华汉堡。各位朋友觉得吃普通汉堡价值5美元,而吃豪华汉堡值得6美元。注意,普通的汉堡是价值超过成本(5 > 4美元),而一个豪华汉堡价值低于成本($ 6 < 8美元)。豪华汉堡显然是一个糟糕的协议必须支付8美元的东西只值6美元-但是游戏理论预言,在一起吃饭时,所有八个朋友会大肆购买豪华汉堡。为什么?

理解这个意想不到的结果,它有助于思考游戏从数学的角度。让D是豪华,让朋友的数量订单R人数秩序正常。(DR是整数,从0到8日R+D= 8,因为总共有八个朋友。)因为豪华汉堡花费8美元和定期的成本4美元,比尔是8D+ 4R。自R= 8−D,我们可以写为8D+ 4 (8−D)。相乘,得到8D+ 32−4D这可以简化

总费用 = 32 + 4 D

每个朋友的个人法案相当于总账单。由于总费用是32 + 4D,每个朋友支付32/8 + 4D/ 8,可以简化

个人账单 = 4 + D / 2

当有人升级他们的订单从“常规”到“豪华”,他们得到一个额外的美元价值的汉堡(现在价值6美元而不是5美元)。然而,他们只支付额外的50美分,因为额外的4美元成本豪华汉堡分裂为八种方法。因此,每一个有秩序的动机豪华汉堡虽然,当每个人都这样做,他们都付8美元的东西只值6美元。(如果一个人在集团决定点普通的汉堡吗?总费用将从64美元下降到60美元,导致每个人的个人比尔从8美元,至7.50美元。所以,下令普通汉堡的人必须支付7.50美元的东西只值5美元,甚至比付8美元的东西只值6美元)。

这看上去很奇怪,但事实上,这是一个最著名的游戏理论和最佳的战略局势称为“囚徒困境”(PD)。

囚徒困境

普林斯顿数学家和早期游戏理论家1阿尔伯特·塔克在1950年提出了PD的故事,来展示一个意想不到的教训的游戏理论,有时做什么最适合自己单独可以使每个人变得更糟。

PD的故事

警方已经逮捕了两名罪犯——“囚犯# 1 (P1)”和“囚犯# 2 (P2)”——指控有期徒刑5年。但警方强烈怀疑罪犯也犯了严重犯罪,持械抢劫,长达20年的徒刑。警察审问者把囚犯在单独的细胞,告诉每个囚犯,“是时候你承认抢劫。你在监狱里呆多久取决于谁坦白。只要你承认,我今天会让你自由行走。否则,你将花费5年如果没有你坦白,10年如果承认,或20年如果你是唯一的一个认罪。“我们希望囚犯们应该做些什么?

图1显示P1将花费多长时间在监狱,取决于谁选择坦白。注意,无论什么P2, P1承认自己是更好。(如果P2坦白,承认允许P1花10年而不是20年的监禁。如果P2不承认,承认允许P1自由而不是花5年的监禁。无论哪种方式,P1承认个体动机。)当然,这个逻辑也适用于P2。因此,博弈论预测,囚犯都承认,花10年jail-a“双输的结果”,因为他们可能都只花了5年的牢狱之灾,如果他们都保持安静。

图1——监狱囚犯# 1时间的囚徒困境。
  • 图1——监狱囚犯# 1时间的囚徒困境。
  • 这个“支付矩阵”显示囚犯# 1将花多少时间在监狱,这取决于谁坦白。有四个箱子,对应的四个可能的结果的游戏。(囚犯# 1的选择行和囚犯# 2所示列所示。)注意,囚犯# 1有一个个人动机confess-illustrated红色arrows-whether囚犯# 2承认与否。

在现实生活中PD

你可能永远不会被警察审问,但很多情况下,我们面临生活中本质上是一样的PD,从博弈论的观点。尽可能明确,这一点是很有帮助的定义我所说的“囚徒困境”更准确。这样,我们可以更容易地确定当一个真实的情况是一个PD,即使没有囚犯。为此,我首先需要定义另一个重要的博弈论的概念:“占主导地位的战略。”

定义:优势策略

“占优战略”的球员是一个动作,让玩家尽可能高的回报,不管别人选择什么行动。

定义:囚徒困境

游戏是一个“囚徒困境”每当(i)所有的玩家都有一个占主导地位的战略和(2)所有球员更好,如果他们选择发挥自己的主导战略。

这个定义的PD没有说任何关于有多少玩家在游戏中。在经典的故事中,只有两个囚犯,但这并不重要。相同的基本游戏可以玩任何数量的囚犯。例如,“与朋友外出吃饭”的游戏我们认为早期PD有八位球员,与占主导地位的战略“秩序豪华汉堡”(而不是“承认”)和集体坏结果”每个人都溢价购买餐”(而不是“每个人花更多的时间在监狱里”)。这里,是另外两个many-player PDs的例子,我们在日常生活中遇到。

例如:乱扔垃圾

每一个周末,在当地的公园郊游决定扔掉垃圾。个人来说,每个人最好还是把他们的垃圾在地面扔,但麻烦,如果每个人都这样做,公园将会一团糟。在这个PD在郊游,每个玩家的主要策略是把垃圾在地上,导致集体的坏结果公园是一片混乱。

例如:站起来欺负

上有一个恶霸,选择所有的孩子在您的类。选择在别人欺负时,你会站在防御的其他孩子或你会袖手旁观,什么都不做吗?单独来说,你和其他孩子在课堂上不愿意站起来bully-he可能开始追求你,但,如果每个人都这样做,欺负永远不会停止。在这PD打孩子,每个球员的优势策略不是站起来欺负,导致集体欺负的坏结果是从未停止过。

逃离PD:帮助他人的力量

己对你你想让他们做什么。(黄金法则)

在PD,每个人都会有一个糟糕的结果,当他们为自己做什么是最好的比如果他们每个人都做一个单独的个人牺牲去帮助别人。逃避PD的一个方法是,因此,改变球员的动机,所以他们想要帮助别人。例如,在乱扔垃圾的例子中,一个社区协会可以把海报敦促郊游”是一个好邻居:扔掉你的垃圾。“通过强调“好邻居”扔掉垃圾,这样的海报后可能导致人们开始清理自己因为他们想感觉“好邻居”——因为他们想避免被认为是“坏邻居。“只要这些新感觉是强大到足以说服每个人清理,每个人都将比以前更好,因为公园会干净,人们会自我感觉良好和他们的邻居的行为。

逃离PD:承诺的力量

你帮我,我会帮你的。(老说,认为音乐起源于英国水兵在17世纪)

早在17世纪,英国水兵被醉酒值班面临严厉的惩罚。他们被绑在船的桅杆和殴打用鞭子(称为“九尾”)由另一个船员。为了避免严重受伤,水手们达成协议互相鞭子轻轻(仅仅是“抓”彼此的支持)。只要每个人都同意这笔交易,每一个人都可以确定接收光鞭打惩罚当他们的时间来了。

“你帮我,我就帮你”的一个例子承诺——承诺做一些帮助另一个人,如果对方第一次做些事来帮助你。还可以帮助玩家逃跑PD的承诺。

囚犯的承诺

如果你不承认,我承诺,我也不会承认。然而,如果你承认,我也会。

假设P2使这一承诺,相信它。P1的选择然后10年监禁(如果两个承认)或5年监禁(如果不承认),他将选择不承认。PD解决!看到图2。但是如果P1不相信P2呢?如果P1觉得P2将打破诺言,P1将承认并且都进监狱了10年。还是陷入了困境!

图2
  • 图2
  • 囚犯的承诺允许玩家“逃脱”PD。这图显示了“博弈树”的PD当一名球员(囚犯# 1)移动,闪耀(囚犯# 2)明星能够致力于囚犯的承诺。红色是囚犯# 1中所示的一切,一切都在黑人囚犯# 2。游戏收益从左到右。每个玩家的选择在每个“决策节点”与粗箭头显示,虽然他们不做出的选择是用细线所示。预测的结果既不承认,服务5年监狱是用红线圈起的部分。

你怎么能确保其他人认为你当你做出承诺吗?最简单、最强大的方法是成为一个诚实的可敬的的人。如果其他人知道“你的话是你的债券”,你关心你的个人声誉,你说他们会信任你。你可以充分利用承诺的力量,逃避PD在自己的生活中,让你自己和周围的人更好。

建议进一步阅读

本文讨论了两种方法来逃避PD-by改变激励球员或承诺的承诺。然而,事实上从PD不同的“逃生路线”。更多关于这些和其他博弈论主题,请看我的书改变另建议阅读下面列出。

博弈论提供易读的书籍介绍:

  • “改变:博弈论和转型战略情况”的艺术由大卫·麦克亚当斯,2014

  • “思考战略:竞争优势在商业、政治、和日常生活“老k·迪克西特和巴里·j·纳尔1991

书,深入挖掘重要应用博弈论的思想:

  • “是的:谈判协议没有屈服”,罗杰·费舍尔和威廉·尤里1981

  • “谁什么,为什么”,阿尔文·e·罗斯(诺贝尔经济学奖得主),2015年

我最喜欢的博弈论课本:

  • “游戏战略,第四版”Avinash Dixit苏珊•Skeath和大卫·h·赖利,Jr .) 2015

利益冲突声明

作者说,这项研究是在没有进行任何商业或金融关系可能被视为一个潜在的利益冲突。


脚注

[1]塔克的一个博士生,约翰•纳什获得诺贝尔经济学奖对博弈理论的贡献。奥斯卡获奖电影《美丽心灵》讲述了纳什的生活在塔克普林斯顿大学的学生时,与罗素·克劳主演的纳什。

Baidu
map