第2章 博弈是生活的一种基本形态
- 博弈论(2024版)
- 王力哲编著
- 14073字
- 2024-07-09 11:13:16
博弈实际上是为了让人们更加精细地活着,是为了让人们更加精细地梳理生活,梳理人际关系,而这也是本书的一个宗旨,即博弈不是钩心斗角的工具,不是尔虞我诈的方法,而是打造美好生活所需要的一个新概念。
为什么我们常常做出了最好的选择,却产生了最坏的结果?
《国富论》的作者亚当·斯密曾经说过这样一段话:“我们的晚餐并不是来自屠夫、啤酒酿造者或点心师傅的善心,而是源于他们对自身利益的考虑……只关心他自己的安全、他自己的得益。他由一只看不见的手引导着,去提升他原本没有想过的另一目标。他通过追求自己的利益,结果也提升了社会的利益,比他一心要提升社会利益还要有效。”
按照亚当·斯密的说法,个人在追求个人利益的过程中会对整个社会产生积极影响,会提升整体的利益。但事实并非如此,阿维纳什·K.在《策略思维》中这样说道:
“‘看不见的手’至多也就适用于一切都能标出价格的情况。但在经济学以外的许多情况,甚至经济学内部的许多情况中,人们并不会由于损害社会其他人的利益而被征收罚金,也不会由于造福其他人而得到奖励。”
比如在日常生活中,人与人之间常常会存在利益上的纠纷,而这种纠纷和对决就需要人们在采取行动时,选择最有利于自己的一种策略。但是恰恰是因为每个人都在争取自身利益的最大化,使得很多时候彼此之间所做出的选择会产生各种各样的干扰。
通常在有关合作与竞争的体系中,彼此之间的选择可能会产生很大的影响。比如两个人一起合作,双方都希望自己可以获得更多的利益,但是在合作中本身就需要双方做出协调和让步,这样才能达到步调一致以及实现整体利益的最大化,一旦有人过于看重个人的利益,那么另一方也会采取同样的策略,这样一来双方就可能会互相干扰。最常见的现象是,一方希望以最小的成本投入获得最大的利益,或者说自己可以少做点,而对方自然会多做一点;而另一方可能也会这么去想。这样双方可能都会在投入方面越来越吝啬,愿意付出的精力也越来越少,从而影响到整体的利润。
如果双方是竞争对手的关系,那么在制定策略的时候,必定会以增加自身利益而消耗对方利益为主要目的。当一方想尽办法从对方那儿获取利益的时候,另一方也会拥有同样的想法,也会采取同样的策略。因此最终的结局是每一方都采取最消耗对方利益的方式,并直接导致两败俱伤的局面。
有时候人与人之间的关系并不是单纯的合作或者竞争关系,双方就某件事情或者某个问题进行沟通也会产生策略上的交锋。比如一个高中生想让父亲给自己购买一台iPad,所以他会努力学习,并且在期中考试的时候拿到了第一名,现在他可以以此作为与父亲谈判的资本,央求父亲给他购买iPad,而且他认为父亲一定会点头同意的。从情感上来说,父亲应该给予孩子一定的奖赏,但问题在于购买iPad虽然是孩子的愿望,但并不是父亲的第一选择,在父亲看来,儿子的表现非常棒,当然最重要的是继续将这种表现延续下去,而贸然奖励iPad给儿子可能会影响到其正常的学习。
在这里,儿子和父亲之间的想法出现了分歧,儿子认为自己应该获得奖励,但在父亲看来,奖励的时机和物品都不太合适,或许他更期待着儿子考上好大学之后再购买iPad。正因为如此,对这个高中生来说,通过提升学习成绩来达到个人目的的方法并没有起到作用。
儿子和父亲在这里并不是一种竞争关系,但是双方之间的确出现了意见上的冲突,而类似的冲突经常存在于上下级之间,因为双方位置不同、看待问题的角度也不同,所以很容易会在各自的选择上产生一些冲突。比如下级为了做出更大的业绩,可能会铤而走险,违背规则并做出一些冒险的举动。站在领导的角度来说,更大的业绩也是他们希望看到的,但是他们却绝对不希望下属脱离自己的控制或者违背指令来取得这些业绩。在这种情况下,下级执行人员可能会通过一些非常规的手段获得巨大的成功,但是仍旧遭到了惩罚。
有时候,下级又会做出一些相反的决策,比如他们固守上级领导的指示,觉得自己只要不违背规则,不超出行使职权的界限,那么就是最好的选择,但他们可能因为不懂得变通而导致工作不能完成。而这个时候,上级领导可能更加看重执行的结果,至于执行的过程和方法,他们或许并不那么看重,这样一来下级的选择就要出错。
如果对以上几种现象进行分析,就会发现一个重要的问题,那就是人们在做出选择或者某个决定的时候,通常都认为这样的选择对自己非常有利,会满足自己的需求,但最后常常产生一些不那么合理的结果。从心理学的角度来说,一个人的期望值越高,失落的机会也就越大。或者正如墨菲定律所指出的那样,只要某件事存在变坏或者导致灾难的可能,那么无论这种可能性多小,最终都会发生。当人们做出选择的时候,通常也会导致一些意外的发生,但是多数人可能会忽略这一点,并且认为自己的决策会是最好的,但恰恰是这种最好的选择会产生一些负面影响。
事实上,对于多数人而言,他们自认为的“好选择”往往只是针对个人利益满足来说的。换句话说,人们只是按照自己的需求和立场来思考问题,来制定行动的策略和方法,但是任何人都不是孤立存在的,每个人都与身边的其他人或多或少地产生联系,这些联系通常都是相互作用的结果。简单来说,就是当某个人从自身的需求和立场出发制定某个策略时,或许并没有考虑到这个策略可能会引发他人的反应,或者说当人们设想某一种理想的状况时,没有想过对方可能未必会采取完全迎合的态度,反言之,人们可以控制自己的想法和行动,但是别人始终是这些想法和行动中的不确定性因子。
如果人们能够认识到这一点,就会意识到人生在很多时候都不会按照自己编写的剧本去发展,一些自认为很不错的选择往往会成为束缚和限制自己的不良方案,尤其是当个人决策与他人的决策产生关联并相互牵制时,人们在选择时容易产生差错,而这些差错又会反过来影响人们的决策,使得他们常常陷入选择上的困境。
囚徒困境:这不是一个人的游戏
上一节的最后谈到了一个重要内容,当个人决策与他人的决策相互牵制时,人生总是不可避免地要面临一些选择上的困难,或者陷入选择困境,而心理学家多年来一直都在积极研究这些困境的某些原理。1950年,美国兰德公司的梅里尔·弗勒德和梅尔文·德雷希尔在研究之后拟定出了相关困境的理论,然后顾问艾伯特·塔克觉得有必要对这个理论进行更加简单直白的阐述,所以举了一个囚徒的例子,并命名为囚徒困境。
按照艾伯特·塔克的说法,囚徒困境的主要内容是两个共谋的犯人被抓进监狱,并且分别关押在不同的房间里,这个时候他们无法进行有效沟通。而警察也没有找到足够的犯罪证据,所以分别对两个犯人说:如果两人都对自己的犯罪事实抵赖,那么将会各判刑1年;如果两人都坦白自己的犯罪事实,每个人都会被判8年;如果两人中一个坦白而另一个始终抵赖,那么坦白的会被直接放出去,而抵赖的被判10年。
当这个信息传到犯人耳中时,两个人都面临着两种选择:坦白或者抵赖,与此同时,他们彼此之间都不清楚对方会采取什么样的态度,因此双方之间存在四种可能性的结果:第一,如果犯人A和犯人B都选择坦白,那么双方会被判8年;第二,如果犯人A选择坦白,犯人B选择抵赖,那么犯人A将会被释放,而犯人B会加重罪名而被判10年;第三,犯人A选择抵赖,而犯人B选择坦白,此时犯人A要坐10年牢,而犯人B将会被立即释放;第四,犯人A与犯人B都选择抵赖,法院由于证据不足,只能判处两人各1年刑期。
通过分析,两个人实际上都意识到了一点,坦白才是更好的选择,因为谁也不知道对方是否会采取认罪的态度。首先,如果同伙选择抵赖,而自己坦白的话,那么自己会被直接放出去,而自己也抵赖的话会判1年,因此坦白比不坦白好;其次,如果同伙选择坦白,而自己也坦白的话虽然被判8年,但是比起自己因为抵赖而被判10年,选择坦白无疑更加合理。
经济学家亚当·斯密就提出了“理性经济人”的概念,在他看来,每一个人都是从自身利益最大化的角度来做出判断和选择,按照他的说法,两个犯人虽然拥有各种各样的策略,但是为了尽量保障自己的利益,他们在做某个决策时会尽量确保这个决策比其他决策带来更高的收益,即保证自己的刑期最短。这是理性思考的一部分,而这种理性思考就会让犯人采取主动坦白的姿态。
既然双方都倾向于坦白,那么最终的结果有很大的可能就是双方各被判刑8年。这个结果对于双方来说是最好的结果吗?显然不是,因为如果双方能够选择一起抵赖,那么两个人实际上只需要坐1年牢,这才是对双方更有利的结果,这个结果可以称为帕累托最优。
帕累托最优是资源分配的一种理想状态,通常人们对它的定义是这样的:假定固有的一群人和可分配的资源,从一种分配状态到另一种状态的变化中,在没有使任何人境况变坏的前提下,使得至少一个人变得更好。简单来说,就是资源优化配置,以最小的成本和代价来获得最大的收益,最初作为一个经济学概念,这个最大的收益是指团队的,而非个人的。或者也可以换一种更为明确的说法:一个人的决策在没有使他人境况变坏的同时使自己的情况变得更好,那么这种状态就达到了资源配置的最优化。
从囚徒困境这个案例来看,帕累托最优方案的实现往往很困难,由于双方无法沟通,且担心对方对自己做出不利的选择,为保险起见,只好选择坦白。从某种意义上来说,这种坦白意味着对对方的背叛而非合作,因为人们更希望另一方能够采取抵赖的姿态,但另一方通常会坚定地选择坦白。
囚徒困境中的“困境”主要来源于信息不明确可能会带来的决策性失误,如果双方在进入监狱之前就约定都要矢口抵赖,那么最终的结果可能对彼此都有利,达到帕累托最优(有时候双方即便有了口头约定,一方也担心另一方为了私利而背叛自己,这个时候,困境仍旧无法得到解除。因此一方必须在做出决策前准确了解对方的想法和决策,比如有人暗中传递信号)。而在信息被隔绝的情况下,每个人往往只会做出对自己更有利的那个选择,因此双方都会做出理性的判断和选择,而这种理性的选择往往会产生坏结果,这就是第一节所谈到的问题。将这个问题进行转化,就是囚徒困境往往会影响帕累托最优的实现。
选择合作还是背叛,永远是生活的一个重要课题,如何将这个课题更好地解决往往很困难。有人提出多次重复囚徒困境,这样一来,参与决策的人就有机会去“惩罚”和“报复”前一回合不采取合作姿态的同伴,从而逼迫双方不断采取合作的姿态,最终有效保证双方的决策逐渐趋于帕累托最优。
不过,若是约定好重复的次数,那么情况可能会有所不同。这里可以以十局为例,按照正常的推论,犯人A第一次被犯人B背叛后,第二次他也会背叛自己的同伴作为回应。如果犯人B第一次就保持沉默,坚决不承认自己的罪行,那么双方可能会建立起互信关系,接下来犯人A也会对同伴的“合作”态度表示迎合,这样双方就会因为共同合作而达到帕累托最优。在这里,保持沉默的态度是为了让对方在下一局也能做出同样的回应。
接下来的第三局、第四局可能都是如此,那么双方会一直都采取这种合作态度吗?情况可能并非如此,由于约定了重复的囚徒困境为十局,那么在第十局其中一方可能会采取背叛的姿态,因为这是他最后的机会来逃脱坐牢的命运了(假设对方采取抵赖的策略,而自己采取坦白的策略,那么自己就可以免于坐牢)。
对于犯人A和犯人B来说,他们都会猜测对方可能背叛自己,因此根据第十局的结果往前推,第九局时保持沉默与合作的态度已经毫无意义,因为在第九局的沉默原本就是为对方第十局做出沉默的策略作铺垫的,既然双方在第十局会采取背叛策略,那么两人在第九局就没有必要保持沉默。以此类推,第八局双方也会背叛对方,第七局同样会背叛对方,这样一来,直到第一局,双方都会采取相互背叛的策略。也就是说,在重复十局的囚徒困境中,每一局双方都会以相互背叛的方式继续下去。
可以说,想要通过重复囚徒困境的方式来打破相互背叛的僵局,实现帕累托最优,那么有一个前提条件就是不要给出具体的重复次数,因为一旦出现了次数上的限制,那就意味着每一个人都有机会通过背叛的方式来实现“不用坐牢”的目的。
纳什均衡:利己主义者的优先策略
在囚徒困境中,“理性的犯人”为了确保自身的利益得到保障,会优先选择坦白策略,而一旦双方都选择坦白策略,那么这个策略组合会成为一个相对稳定的状态。原因很简单,无论是犯人A还是犯人B都缺乏勇气进行调整,此时任何一方如果改变策略(改口选择抵赖),那就意味着自己将会置身于更加不利的局面(从8年牢狱之灾变成10年),因为没有人敢打包票说对方也会跟着自己选择抵赖,对双方来说,目前这种状态是非常稳定的,并没有改变和调整的必要。
而在囚徒困境的其他几个策略组合中就不存在这个问题,比如当两个犯人都采取抵赖的策略时,这个策略组合其实是不稳定的,因为其中一方完全可以通过坦白的方式让自己获得更多的好处。而当一个犯人抵赖,一个犯人坦白时,整个局面本身就是失衡的,其中一方必定会希望做出调整,这种调整会让局面变得更好。
无论如何,当双方都选择背叛对方的时候,这种状态对双方似乎都是有利的,而这种相对均衡的状态就是纳什均衡。所谓纳什均衡是指参与者形成了一种策略组合,在这个策略组合当中,任何参与者如果试图单独改变自己的策略都不会得到好处。换句话说,在制定某个策略后,双方都不愿意做出调整。如果在一个策略组合上,一旦所有其他人都决定不改变自己的策略时,就没有人会改变自己的策略,此时,这个策略组合就是一个纳什均衡。纳什均衡是约翰·福布斯·纳什提出来的,他于1950年发表了《非合作博弈》的论文,之后又在《N人博弈中的均衡点》(1950)和《非合作博弈》(1951)这两篇博士论文中进一步阐述了非合作博弈的论点,并渐渐形成了明确的理论。
听起来或许非常复杂,但是纳什均衡可以用一些非常生活化的例子来进行解释。比如一对兄弟一起外出打猎,他们可以有多种打猎的方式,首先两个人可以选择打300斤的野猪,只不过需要双方进行合作。其次,他们可以选择抓兔子,兔子的总重量为200斤,双方合作的话可以获得200斤的兔子肉,即便分开行动,每个人也能获得100斤的兔子肉。
在这个时候,双方可能会存在这样的组合策略:
第一种,兄弟二人选择合作猎杀野猪,每人获得150斤肉。
第二种,兄长更倾向于猎杀野猪,他觉得自己有能力单独完成猎杀任务。而弟弟觉得猎杀野猪太冒险,还是抓兔子比较安全,因此选择抓兔子,此时兄长的收获为0,而弟弟会获得100斤兔肉。
第三种,弟弟更倾向于猎杀野猪,他觉得自己有能力单独完成猎杀任务。而兄长觉得猎杀野猪太冒险,还是抓兔子比较安全,因此选择抓兔子,此时兄长的收获为100斤兔肉,而弟弟的收获为0。
第四种,兄弟二人都准备抓兔子,这个时候双方分别可以获得100斤兔肉。
在这些策略组合中,就存在两个纳什均衡,即第一种策略组合和第四种策略组合,在这两个策略组合中,如果一方突然做出改变,那么就会失去原有的好处。比如在第一种策略组合中,如果弟弟选择放弃猎杀野猪,而去捕捉兔子,那么收益就会从原先的150斤肉(野猪肉)变成100斤肉(兔肉)。在第四种策略组合中也是一样,如果兄长突然决定猎杀野猪,那么他的收益将会从原先的100斤兔肉,直接降为0。
前面提到了亚当·斯密的“理性经济人”概念和理论,按照这一理论,在市场经济条件下,人们都会从利己的角度出发,并最终在整体上形成利他的效果(如果每个人都保持理性,整体就会达到一个相对满意的状态,即整体福利的提升),而纳什均衡虽然是由个人的理性行为引起的,但是它却指出了理性经济人理论的悖论,那就是当人们试图从利己的角度出发时,结果可能是损人不利己,这样对双方都没有任何好处。或者可以说“纳什均衡”本身可能就不是一个“理性”的状态。
这一点在“囚徒困境”中表现得非常明显,在囚徒困境中,纳什均衡只有一个,那就是双方都选择背叛对方而积极坦白罪行,这是唯一稳定的策略。但是这个纳什均衡并不是最优的结果,因为只有当双方都采取抵赖措施时,才会达到帕累托最优。
某种意义上来说,纳什均衡并非最优或者最理性的,但却是在面对不可控的状况时(信息不明确),自己所能获得的最好选择,可以说,纳什均衡寻求的是个人的最优解,对个人而言,这是一种稳定的均衡。
纳什均衡理论的出现直接促进了博弈理论的产生,可以说它奠定了现代主流博弈理论和经济理论的根本基础,经济学家克雷普斯在《博弈论和经济建模》一书的引言中这样说道:“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”
事实上,在学术界,人们认为博弈论萌芽于20世纪20年代,而创立的标志则是冯·诺依曼和奥·摩根斯坦在1944年出版的《博弈论与经济行为》这部著作,这两个人大致提出了博弈论的基本概念、二人零和博弈以及合作博弈等内容。
不过由于纳什均衡是一种非合作博弈状态,而这种非合作博弈理论是目前博弈理论中应用最广泛的理论,因此许多人认为纳什均衡理论的提出才为博弈论的发展开辟了更为广阔的道路,其中的均衡理念成为了博弈论的基本概念。可以说,在整个博弈论的发展历程中,纳什均衡都是一个重要的组成部分,它对博弈论的完善和发展起到了非常重要的作用。
经典博弈论和行为博弈论
博弈论在发展过程中,经历了一些重要的变化,最常见的就是从经典博弈论发展成为行为博弈论,这种发展表明了博弈论的不断完善,不断贴近现实生活。
经典博弈论假设参与人是理性且完全关注自身利益的,因此他们的行为模式更多地停留在个人利益的基础上。它与信息经济学一样,都是以“理性人”为理论基础的,通过一个个精美的数学模型搭建起公理化的完美自洽的理论体系。在他们看来,理性人拥有一些典型的行为特征:会追求个人利益的最大化,不会信任其他人。
但心理学和行为科学的研究发现,人们常常会表现出很多与此假设相悖的奇特行为。比如在一个团队内部,领导者会依据每个人的工作能力、贡献以及与自己的亲疏关系来进行利益分配,按照经典博弈论的说法,团队内部的每个人都是理性人,都会为自己的利益而努力,但是一些人会有公平心理,认为团队内部应该进行更平等的分配,因此会主动为那些利益受损的弱势者积极发声。
心理学和行为经济学的研究结果表明,人们在做出经济决策时会受到思考成本(人类认知能力有着心理的临界极限)、激动和经验等心理因素的影响,从而存在系统的推理误差,这些误差会影响人们的判断。行为博弈学家认为现行的社会、制度、经济和生活环境都会影响人与人之间的信任,因此个人的社会偏好应该纳入到博弈论之中。
为了验证这一点,心理学家和行为经济学家特意做了一个实验。
他们招募了一批博弈者,然后将他们安置在计算机实验室中,参与实验的人每人可以获得10元的出场费,每两个人分成一组,彼此都不认识也不会见面,只是通过计算机建立联系。小组中的成员A可以将任意数额的钱(0~10元)借给成员B,而不管A付出多少,B都会收到3倍的金额。比如说A愿意借出5元,那么B将会获得5×3+10=25元的支付。接下来B需要决定是否还钱给A以及应该还多少。
反过来说,B愿意借钱给A的话,A也同样会收到3倍的金额。按照传统博弈论,如果双方进行一次性的博弈,那么A和B都不会借钱给对方,因此双方的收益只有10元。但是经过实验,行为学家发现一半的博弈者会借给对方钱,而其中四分之三的人会顺利收到对方的还款。其中,如果一个人从另外一个人手中借到的钱越多,那么还钱也会越多。
这个实验佐证了心理学家和行为学家的理论,即人们并非都是自私自利的,作为一种高度社会化的动物,人们更加懂得如何维持好人际关系,因此会关注和分析对方的情绪和反应,并以此作为制定策略的重要依据。有时候这种自动的社会化反应机制产生作用时,人们甚至都无法意识到,但它还是会发生作用。
行为博弈论的观点更加符合“社会人”的设定,即每个人都是社会中的一分子,而整个社会是一个大群体,社会中的每一个人无论是合作还是竞争都是相互联系、相互影响的,这种联系就决定了每个人都不可能安全按照自己的意志行事,不能够自私自利地活在自己的主张中。有时候在做出决定或者表现出某种行为时,需要看一看他人的反应,需要适当为别人着想,并根据他人的反应或者他人有可能出现的反应修改自己的行为。可以说,在行为博弈过程中,参与者不仅受制于自身主观预期和行为,也容易受制于其他类型参与者行为的影响。这种博弈模式实际上就类似于一个动态的相互反射且不断发展的过程,一方的行为会对其他人产生影响,而其他人的行为也会对个人行为产生影响,整个过程充满了各种不确定性因素。
实际上,行为博弈论是行为经济学的一个重要分支,而行为经济学是经济学方法中的一种,它提出并引用了弱化理性假设的理论。这种弱化理性的假设通常源于社会法则和道德约束,就像前面提到的借钱一样,将钱借给别人的人需要承担很大的风险,因为对方不一定会还(考虑到如今出现的民间非法融资和民间借贷风险),而坚持借钱的做法无疑是出于一种信任,即借出钱的人坚信对方会还钱给自己,而且会对自己的善举充满感激。或者说借出钱的人坚信对方会保留做人最基本的道德准则,会受到良心的约束而还钱。
行为博弈论和公平、对公平的偏好有关,那么有关公平的偏好从何而来?行为学家提出了一种比较流行的观点:人类的祖先在进化过程中,大脑机制中形成了一种适应,使得人们受到外力摆布时产生愤怒的情绪,这一点在认知和情绪系统的互动中也可能会出现。在当时小范围的生活环境中,人们意识到愤怒具有一定的生存价值,可以带来公平。另一种说法是人们会根据血缘关系的亲疏或者和陌生人进行交易时的亲和程度,产生不同标准的公平,而且不同文化也会产生不同的标准,并将这些标准沿袭下来。
无论如何,人们对于公平的偏好决定了博弈策略的改变,也使得人们免于在追求个人利益最大化的同时陷入集体利益最小化的尴尬局面,而这正是博弈达到均衡状态的最大障碍。
了解博弈的类型,才能更好地了解博弈的结构
作为一种心理战术,博弈的形式多种多样,而不同形式的博弈往往会产生不同的博弈效果,也会对个人的生活产生不同的影响。那么博弈通常是怎样进行划分的呢?
博弈从结果上来说可以分为负和博弈、零和博弈、正和博弈三种基本类型,这也是人们最常接触的划分方式,或者说是一种最常规的划分方式。
负和博弈是指双方在博弈中由于存在不可协调的冲突和矛盾,或者双方没有达成统一,以至于彼此互不相让,这个时候双方的策略只会给自己带来损失,这种损失比各自的策略带来的利益更多,从而造成两败俱伤的局面。简单来说,这一博弈策略就是“损人不利己”。
零和博弈指参与博弈的各方,在严格的竞争条件下,一方获得收益的同时必然意味着另一方遭受损失,博弈各方的收益和损失相加总和永远为零,并且双方不存在合作的可能。零和博弈可以看成是个人的收益建立在他人的损失基础上,个人的幸福建立在他人的不幸基础上,它的策略就是“利己损人”。
正和博弈(合作博弈)是指博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害,但利益从整体上来说得到了增加。这是一个“利人利己”的双赢局面或者至少是“利己不损人”的策略。
想要了解这三种博弈的概念以及彼此之间的区别,可以以夫妻一同看电视为例子:一对夫妻在看电视,可是丈夫喜欢看体育频道,妻子却喜欢看肥皂剧,在电视只有一个的情况下,丈夫看体育频道就意味着妻子的喜好无法得到满足,反过来说,一旦妻子看上了肥皂剧,丈夫就不得不做出牺牲。假设当丈夫当晚如愿看到体育频道时,获得的满足为1,如果当晚不能看到自己喜欢的体育频道,得分为-1;妻子当晚如愿收看肥皂剧时获得的满足为1,反之为-1。
如果丈夫和妻子约定当晚只有一人可以观看电视,另一方要么陪着看电视,要么看书。双方可以剪刀石头布的方式决定谁看电视,无论结果出来怎么样,有一个人必然会得到满足,分数为1,另一个人则感到失落,得分为-1,这时候双方的满足感之和为0,而双方的博弈就是零和博弈。
如果丈夫和妻子当晚因为争夺遥控器而发生了争吵,以至于两个人互不相让,丈夫夺走了遥控器,而妻子干脆将电视上的电线插头拔掉,这个时候两个人谁也看不成电视,双方通过电视获得的满足为-2。或者两个人因为斗气将电视切换到动物世界频道上,由于它和体育频道、肥皂剧都无关,因此两个人的满足也为-2。这种两败俱伤的局面就是负和博弈。
如果丈夫和妻子都是非常包容的人,他们都表示当天晚上会将观看电视的机会让给对方,由于都不忍心冷落对方,双方约定轮流观看电视,丈夫先看30分钟的体育频道,然后电视频道切换到肥皂剧上,妻子观看30分钟,之后再次切换。这样一来,双方都可以观看到自己喜欢的电视节目,那么双方当晚都可以获得满足。这个时候,双方的博弈就属于正和博弈。
企业与企业之间做生意的时候也常常会出现这样三种博弈方式,当企业之间因为竞争关系和利益分配问题产生纠纷,如果双方都不打算妥协和让步,那么关系可能越闹越僵,最后双方决定扩大竞争,完全变成相互攻击的对手,这样就可能会导致双方在竞争中两败俱伤。这时候,双方的博弈是负和博弈。
当企业之间保持正常的交往策略,双方约定了一些公平的竞争方法,可是为了获得私利,其中一方使用计谋给对方设置了陷阱,结果导致对方损失了一大笔钱,这个时候挣钱的一方所挣的钱,刚好是另一方损失的钱,双方的博弈关系就是零和博弈。
如果两家企业都具备战略目光,意识到双方继续保持竞争的态势,或者继续保持单独作战的理念,恐怕会在市场上失去竞争力,最好的方法就是双方进行合作,通过合作来提升各自的竞争力,这样一来,双方的策略就促成了正和博弈。
除了划分为负和博弈、零和博弈、正和博弈之外,还可以将其划分为静态博弈和动态博弈,完全信息博弈和不完全信息博弈。静态博弈一般是指同时决策或者同时行动的博弈,有时候博弈双方会采取先后行动,但是彼此都不了解对方的决策,这也是静态博弈。而决策或行动有先后顺序之分,且后者可以观察前者的行动并做出相应的选择,这种博弈模式称为动态博弈。
完全信息博弈是指每一位参与者都拥有所有其他参与者的特征、策略及得益函数等方面的准确信息的博弈。不完全信息博弈是指参与者对对手的了解不够精确,也没有掌握确切的信息。
这些不同的博弈可以形成四种常见的博弈类型,即不完全信息静态博弈、不完全信息动态博弈、完全信息静态博弈、完全信息动态博弈。
不完全信息静态博弈是指至少某一个局中人不完全了解另一个局中人的特征,即不知道某一参与者的真实类型,但是知道每一种类型出现的概率。
不完全信息动态博弈是指在动态博弈中,行动有先后次序,在不完全信息条件下,参与者知道其他参与者有哪几种类型以及各种类型出现的概率,但是并不知道其他参与者具体属于哪一种类型。不过,后行动者可以通过观察先行动者的行为来获得有关先行动者的信息,以便证实或修正自己采取的行动。
完全信息静态博弈是指参与者同时选择行动,或行动有先后但后行者并不知道先行者采取了什么具体行动;与此同时,每个参与者对其他所有参与者的特征、策略空间及支付函数有准确的认识。
完全信息动态博弈参与者的行动有先后顺序,后行者能够观察到先行者所选择的行动;且每个参与者对其他所有参与者的特征、策略空间及支付函数有准确的认识。
这四种博弈中谈到了一个很重要的因素,那就是信息,无论是哪一种博弈,决定其最终结果的可能就是信息,信息量的多少往往会对博弈双方产生重要的影响。
内容延伸 博弈有时是一场控制与反控制的游戏
许多人对博弈并不了解,甚至会出现诸多的误解,认为博弈就是一种利益获取的工具,它具有自私的特性,但真正的博弈具有更高维度的思想和境界。事实上,获取利益的方式可以有很多种,人们也可以表现得更加直接、更加粗鲁、更加自私自利,可是这些方法都不像博弈一样具有更深的内涵,尽管博弈过程中也存在争斗,存在利益的划分,也存在压制他人的欲望,但总体上来说,博弈不过是一场和谐的游戏。
而想要了解博弈的本质,完全可以从生活中的一些小例子进行分析:
罗小姐希望闺密可以在明天(周末)早上6点开车送她去车站,她可以直接向闺密提出这个请求:“明天早上5点,你可以送我去车站吗?我要去那儿办点事。”
闺密在听到这个请求后,会有什么样的反应呢?也许她会感到为难,毕竟从罗小姐家中到车站要花费1个多小时,而从自己家到罗小姐家中还要30分钟,这样差不多要花费2个小时,往返一趟将要花费4个小时,这样的苦差事的确很折磨人。面对这样一道难题,闺密或许会直接找一个借口拒绝:“对不起,明天早上我要早点去老家,所以不能送你去车站了。”
罗小姐如果是一个聪明人,那么从一开始就不能表现得太过于理所当然,为了说服闺密,她需要表现得更加委婉一些,态度应该更加诚恳一些,需要将自己的难处表现出来。正因为如此,她或许可以这样说:“明天早上5点,你有空的话,可以送我去车站吗?我知道这很为难,天那么早还那么冷,但除了找你我实在想不到更好的办法了,如果不能准时到达,老板估计又会找我麻烦了。”
这是一出比较出色的苦肉计,低姿态加上示弱,往往更容易引起对方的同情,闺密面对这样的请求很难无动于衷,尽管她还是会觉得为难,可是罗小姐的攻心战术已经在慢慢起作用了。
罗小姐同样也可以运用其他的方法来提出请求,如果她愿意表现得更隐蔽一些,那么一开始就不要试图去要求对方替自己做什么,而应当设法引导对方做出积极的回应。因此,罗小姐完全可以这样开始自己的谈话:“明天就是周末,你有什么安排吗?”
“没有啊,我这样的闲人还能有什么安排。”
“那你能不能送我去车站?我有点事要出差。”
“这个啊,嗯,好吧,我想自己应该也没什么事,你什么时候去车站。”
“早上7点,这有点早,而且天气还那么冷,我真的是不好意思向你开口。”
“7点的确有点早,但也没什么,我会准时送你过去的。”
“哦,不是,我希望你早上5点就送我过去。”
“5点?你不是说7点出门吗?怎么还要那么早呢?”
“原本是7点出门也没事,但问题在于我还要在前往车站的中途给一位客户送一份文件,这个客户准备坐6点的飞机离开这儿,因此我必须在他上飞机之前将东西送过去。”
“是这样啊,那……那……那么好吧,既然都已经答应你了,我会早点赶过来接你。”
在这里,罗小姐两次都改变了策略,第一次,她没有直接说明自己要做什么,她的问题并不具备“进攻性”(希望对方怎么样,或者要求对方怎么样),闺密无法感知到罗小姐想要干什么,因此也就实话实说,这样就为罗小姐的请求奠定了基础。第二次改变策略是,罗小姐根本没有明说要5点钟起床,而是说自己7点要去车站,这使得她轻易赢得了闺密的承诺,而正是因为这个承诺才让一件为难的事情顺利得到解决。
在这三种对话模式中,第一种最为直白,但是效果可能最差;第二种比较内敛,容易引发对方的同情,说服的效果往往不错;第三种模式最为聪明,罗小姐变成了一位非常出色的操纵者,她提出了一个封闭式的问题“明天有什么安排”,而不是开放式的问题“明天有空送我去车站吗”,而且她在提出问题之前就已经设定好了对方的回答以及自己应该做出的回应,因此可以轻松掌控对方的思维与心理。
在生活中,利用这一类心理战术,人们通常可以轻松控制他人的大脑,而这种控制正是博弈的一个精髓。它和心机、腹黑等并不一样,心机和腹黑的人往往利益倾向性非常明显,习惯了通过牺牲他人的利益来满足自己,而信息限制带来的大脑控制更多时候只是一种温和的策略,尽管被控制的人可能会陷入一个尴尬的处境,并且容易产生一些不愉快的体验,操纵者刻意隐藏和混乱了信息,导致被控制的人产生了错误的判断,有时候甚至连他们也不清楚自己是如何被绕进去的,但博弈最终的目的是尽可能达到一种均衡。
罗小姐虽然赢得了闺密的承诺,但是她不能像没事发生一样,为了确保自己的行为不会影响到彼此的感情,她需要给予闺密一些回报:“真是不好意思了,这样吧,下次我请你吃饭。”无论对方接受与否,这样的“回馈”或多或少都会缓和略显尴尬的关系。
不过,事情有时候也会发展到另一面,那就是闺密对罗小姐的反控制,反控制通常源于对压迫性的反抗,比如闺密对罗小姐弯弯绕绕的请求不太舒服,或者她确实觉得在早上5点起床(而且还是大冷天)不太方便,她更希望推掉这个麻烦,但是为了不伤害感情(这也是达到平衡的需求),她需要尽快了解对方的动机,并做出反制措施。
第一种模式:
罗小姐:“明天就是周末,你有什么安排吗?”
闺密:“你不会又想着出去旅游了吧?你可真是舒坦,我就没有这样的好命。”
罗小姐:“怎么了?你还要加班?或者还有什么重要的事情要做?”
闺密:“是啊,整个周末都要泡汤了。”
罗小姐:“这样啊,我原本还想着让你明天早上开车送我去车站,我有点事。”
闺密:“哦,那我恐怕是爱莫能助了。”
在这个模式中,当罗小姐提出问题后,闺密开始保持警觉,意识到对方可能有求于自己,或者双方会有什么活动,在不清楚对方的动机时,她先卖一个关子让自己占据主动位置,这样就可以从容应对对方的出招了。
第二种模式:
罗小姐:“明天就是周末,你有什么安排吗?”
闺密:“没有啊,我这样的人,现在还能有什么安排。”
罗小姐:“那你能不能送我去车站,我有点事要出差。”
闺密:“这个啊,嗯,没问题,你什么时候去车站?我看看能不能安排好时间。”
罗小姐:“怎么了,你还有其他事吗?”
闺密:“也没什么大事,明天是周末,我让水管修理工来家里帮忙修管道,因为下周我要出差,那时候就没时间处理这些事了。”
罗小姐:“那个修理工什么时候来,他可不可以晚点过去?”
闺密:“这个不好说,没准很早。”
罗小姐:“这样啊,我是早上5点的车,路上来回要几个小时,不知道时间上来不来得及。”
闺密:“这个就不好说了,你晚点去要紧吗?要不然我晚点送你去?”
罗小姐:“哦,那我还是再问问别人吧!”
在第二个模式中,闺密虽然没有在第一时间意识到罗小姐的想法,但是却在答应对方的时候留了余地,并直接打乱了罗小姐原有的计划,这样在双方交流的过程中,闺密始终没有被罗小姐带入她的节奏中,并最终巧妙地拒绝了对方的请求。在这个反制措施中,双方依然没有产生任何摩擦,彼此之间保持了一个相对和谐的、平衡的局面,因此可以说让整个博弈非常成功和精彩。
生活中常常会出现这一类让人感到为难,不好意思提出请求而且又不好意思拒绝的事情。在面对这一类事情时,请求者担心对方会拒绝,而被请求的一方又担心自己会增加不必要的麻烦,因此彼此都会小心翼翼地试探对方,避免弄巧成拙。
本书所谈论的话题非常广泛,但是将所有的内容归结起来,本质上就是“控制”与“反控制”,无论是爱情、婚姻、职场、商界竞争、军事,还是日常的人际交往,都体现出了这两种元素。也就是说,人们在日常生活中,只要与人发生联系,与人进行接触,或多或少都存在大脑被入侵以及抵抗入侵的情况,而无论是入侵下的控制还是反控制,都是为了创造一种平衡的状态。从这一角度来看,博弈实际上是为了让人们更加精细地活着,是为了让人们更加精细地梳理生活,梳理人际关系,而这也是本书的一个宗旨,即博弈不是钩心斗角的工具,不是尔虞我诈的方法,而是打造美好生活所需要的一个新概念。