手机浏览器扫描二维码访问
令人感到困扰的是,这一理论同样适用于其他玩家。其他玩家也要思考自己之外的玩家会采取什么样的行为。这样一来,各位玩家之间就会交织产生“相互依赖”的复杂关系。因此,在这种环境下,想要明确每位玩家应该采取的行为绝非一件易事。博弈论的难度可想而知。
零和博弈[6]的机制
由冯·诺依曼和奥斯卡·摩根斯特恩最先提出的博弈,本质上是指两个人的零和博弈。顾名思义,在这一理论中,两个玩家展开博弈时,无论哪一方取胜,他们的收益总和始终都是零。也就是说,如果一位玩家的收益是x,那么另一位玩家的收益必定是-x。可以说,这是博弈当中最为简单也是最为典型的基本机制。一般来说,两支球队的体育比赛大都是典型的零和博弈。
为了更好地理解零和博弈,下面将举一个具体实例进行说明。
假设有两支队伍参加比赛,分别是队伍1和队伍2。我们将这两支队伍的比赛视为博弈。每支队伍只能从三种策略(上场队员、阵形、防守和进攻战术等综合在一起形成的方案)中选择一种。队伍1从a、b、c中选择一种,队伍2从d、e、f中选择一种,并运用所选策略进行实际比赛。这样一来,共有九种策略与得分组合。把这九种组合以表格的形式列出来,我们可以了解队伍1在各种策略组合下能够得到的分数(或得失分差),如表3-1所示。
比如当队伍1选择策略a、队伍2选择策略d时,如表3-1所示,队伍1可以得到4分,根据零和博弈理论,队伍2的得分自然是-4分。
此外,当队伍1选择策略b、队伍2选择策略d时,如表3-1所示,队伍1的得分是-3分,与之相应,队伍2的得分就是3分。
那么,在上述机制下,两支队伍究竟应该采取怎样的策略呢?下面,我们将根据博弈论理论,分析参赛队伍的心理,并进行论述。
如果静下心来思考一下,就会切实地感受到这是一个非常棘手的问题。如表3-1所示,队伍1肯定希望获得尽可能多的分数,因此拼命想扩大这一数字。与之相对,队伍2则希望这一数字越小越好。然而,由于彼此是竞争对手,要想同时满足双方的愿望,不另辟蹊径,采取特殊的解决方式是根本办不到的。
也就是说,假如队伍1单纯想拿到表中所列举的最大得分4分,那么队伍1应该选择策略a。但是,这种想法的目的性太过明显,很容易被队伍2猜透。如果队伍2提前判断到队伍1会选择策略a,那么队伍2肯定会有针对性地选择策略f。这是因为在队伍1选择策略a的前提下,队伍2选择策略f时可以得到2分(根据表3-1,当队伍1选择策略a而队伍2选择策略f时,队伍1的得分为-2分)。
但是,对于队伍2的这种想法,队伍1肯定也能猜到。如果队伍1提前预测到队伍2可能会做出这样的判断选择策略f,那么队伍1可能就会将计就计选择策略b,拿到3分。虽然这一得分比队伍1能够得到的最高得分4分少1分,但是在这种局面下,也属于上上之选了。
然而,队伍2也可能会猜到队伍1这种“以退为进”的策略,从而有针对性地选择策略d。就这样双方不停地斗智斗勇,最终会陷入无休止博弈的死循环。那么,冯·诺依曼和奥斯卡·摩根斯特恩是如何摆脱这个陷阱束缚的呢?
冯·诺依曼和奥斯卡·摩根斯特恩是这样认为的
为了避免出现上文中提到的陷阱,陷入无休止博弈的死循环,冯·诺依曼和奥斯卡·摩根斯特恩提出了下述思维方式。
由于博弈双方无法确切地掌握对方最终会采用哪种策略,因此应该放弃去猜测对方的选择。在这一前提的基础上,博弈双方决定所选策略的关键在于保底值,即选择某一行为时,最低能保证多少收益。
也就是说,两支队伍应该使用最大最小准则作为选择策略的标准。
下面,我将结合前文中提到的两支队伍的比赛进行具体说明,如表3-2所示。
首先,我们试着从队伍1的立场出发思考问题,探讨队伍1是否应该选择策略a。在这种情况下,队伍1的分数自然会受到队伍2所选策略的影响。队伍2选择策略d、e、f时,队伍1选择策略a的得分分别为4分、-1分和2分,其中最低得分是-2分。因此,-2分就是队伍1选择策略a时的保底值,也就是保底分数。同样,当队伍1选择策略b时,保底值是-3分;选择策略c时,保底值是1分。在三个保底值中,最大的是1分。因此,对于队伍1而言,“选择策略c时,最差也能得1分”。换言之,队伍1“如果想达到1分的保底值,就应该选择策略c”。
其次,我们试着从队伍2的立场出发思考问题。对于队伍2而言,将表中数字的正负号颠倒过来,就是队伍2所得到的分数。因此,队伍2希望表中的数字越小越好。如果队伍2选择了策略d,那么队伍1选择策略a、b、c时,队伍2的得分就分别是4分、-3分和3分的相反值,即-4分、3分和-3分,其中最大失分就是4分。也就是说,不会有比-4分更少的分数。有鉴于此,4分就是队伍2选择策略d时的保底值。同样,在选择策略e、f时,队伍2的保底值分别是1分和3分。
因此,希望从表中选出的数字越小越好的队伍2,肯定会选择策略e。换言之,队伍2将不得不选择1分的失分(也就是-1分的得分)作为保底值,从而选择策略e。
在这种情况下,队伍1的目标是拿到保底值1分,队伍2的目标是拿到最少失分,也就是得-1分。可以说,双方的想法达成了一致。因此,当队伍1选择策略c、队伍2选择策略e时,双方都拿到了自己想要的1分和-1分,这种状况就是冯·诺依曼和奥斯卡·摩根斯特恩所提倡的博弈的结果,也就是所谓的均衡状态。
在这一分析过程中,作为比赛对手的两支队伍并没有只选择对于自己而言最有利的策略,而是将对方的利益得失纳入计算范围,并在此基础上做出了决策。另一方面,如果太在意对方的行为,自己的选择总是随着对方而改变,就会陷入无限循环的陷阱,影响最终的决策。如果两支队伍都能秉承“设想最差局面,并在这一条件下谋求最大利益”的理念,就可以避免出现无限博弈的死循环。
在这种情况下,我们将队伍1的保底值的最大值1称为最大最小值,将队伍2的失分保底值的最小值1称为最小最大值。冯·诺依曼和奥斯卡·摩根斯特恩提倡的博弈结果(均衡)就是这种最大最小值与最小最大值一致的行为组合。
按照混合概率选择行为
如上文所述,在冯·诺依曼和奥斯卡·摩根斯特恩提出的零和博弈的均衡状态下,博弈双方所选行为实现了各自的最大保底值。
但是,这里存在着一个不容忽视的问题——这种均衡并不是一种常态。
比如在“石头剪刀布”的游戏中,假设获胜方得1分,失利方得-1分,不分胜负(打平)时双方各得0分。在这种情况下,玩家A无论出剪刀、布、石头中的哪一个,其保底值都是-1分。因此,保底水平的最大值就是-1分。与之相对,玩家B的保底值就是1分。由此可见,双方的保底值是无法达成一致的(最大最小值=最小最大值)。这是因为一方失利,就意味着另一方取胜。
针对这种情况,冯·诺依曼和奥斯卡·摩根斯特恩提出了“按照混合概率选择行为”的理念。也就是说,玩家在选择时,并不仅限于单纯选择“石头”“剪刀”“布”,而是可以按照不同的概率组合选择出招的策略。比如采用“按照各0.5的概率选择出剪刀和石头”或者“按照0.6、0.3和0.1的概率组合,选择出石头、剪刀和布”等策略出招。在使用这种混合概率出招时,玩家的得分自然也就不同了。
比如玩家A和B都选择“不出布,分别按照0.5的概率出剪刀和石头”的策略时,玩家A得1分、玩家B得-1分的概率为0.25(A出石头的概率×B出剪刀的概率),与之相反,玩家A得-1分、玩家B得1分的概率也是0.25。双方各得0分的概率是0.5(A出石头的概率×B出石头的概率+A出剪刀的概率×B出剪刀的概率)。
在这种情况下,如果不明确规定如何计算玩家的得分,就无法实施具体分析。因此,冯·诺依曼和奥斯卡·摩根斯特恩就决定运用第二章中提到的期望值(概率的平均值)来解决实际问题。比如针对前面的例子,经过计算后,每位玩家的得分都是1×0.25+(-1)×0.25+0×0.5=0。
顺便提一下,在实际运用“不出布,分别按照0.5的概率出剪刀和石头”的策略组合时,其本身是不均衡的。这是因为当玩家A使用这一策略时,如果玩家B选择“只出石头”的策略,那么玩家A面对的结果“除了输就是平”,其得分的期望值就是负数。这样一来,A的保底值就变成了负数,而不是0。
在猜拳游戏中按照固定套路出招是非常不利的
冯·诺依曼和奥斯卡·摩根斯特恩提出这一概率组合行为的理论,证明了无论哪种形式的两人零和博弈,最终都存在一个均衡状态。比如在猜拳游戏中,如果两位玩家都采用“按照各13的概率,选择出石头、剪刀、布”的策略,那么双方就处于均衡状态了。这是因为玩家A选择这种策略后,不管玩家B选择怎样的概率组合,A的期望值始终是0。也就是说,A的保底值是0。此外,在使用其他概率组合的情况下,必然会出现选择“石头”“剪刀”和“布”中某一个选项的概率高于其他选项的情况。比如,如果一方出“石头”的频率较高,那么另一方出“布”的概率就会相应增大,这样一来,其期望值就会变为负数。由此可见,除了“按照各13的概率,选择出石头、剪刀、布”的策略以外,其他概率组合的保底值均为负数。因此,玩家A的最大保底值就是“按照各13的概率,选择出石头、剪刀、布”时的数值。同理,玩家B的情况也是如此。
这一结果与我们日常生活中的直观感受是一致的。众所周知,在玩猜拳游戏时,出拳带有一定倾向性的一方,往往会输掉比赛。这是因为如果出拳的习惯容易被对方猜透,就会陷入不利的局面。有鉴于此,无论是从现实来看还是从理论来看,“按照各13的概率,选择出石头、剪刀、布”的策略都是猜拳游戏中依据最大最小准则制定的策略。这一结果非常有趣,值得大家玩味。
星兽入侵,地球文明崩塌。掌控神器月光宝盒的少年,抽取三千武道世界神功传承,护人族,拥美人,斩星兽,镇万族,君临星河,威御诸天。茫茫星空,有我无敌!...
非爽文,非女强,甜宠可爱风穿成众多文中的白月光后,姜吱努力躲避和男主的强行红线剧情,坚决不做男女主感情的绊脚石。现代文里,姜吱将喝醉的男主一脚踹开,手腕却突然被人攥住。穿着白衣白裤的少年神色迷蒙...
关于农家小富婆剪个汉子冲门面作为现在的一个大龄剩女宋小柒,一睁眼,便成了与外男私通的下堂妻!What?谁能来说明一下,到底发生了些什么?私通外男,被休下堂,还怀着个包子!!宋小柒表示,遇到事情不要慌,先去深山转一转。金手指顺便开一开,从此人生开了挂!极品亲戚斗一斗,生活乐趣不用愁...
豪强并起世家林立的都市,备受欺凌的社会底层吊丝林平强势崛起。世家欺辱,那便抹平世家豪强镇压,那便屠灭豪强举世皆敌,那就踏平这世界!当他手握黄金月河的那一刻起,他便不再问敌人有多少,只问他的敌人在哪里!!!...
神秘的笔记云端的世界,是科幻是魔幻是玄幻,还是奇幻梦幻的世界。一本神秘的笔记,一段神奇的代码,一则神异的算法什么是宇宙,什么是时空,何为物质与能量守恒,何为梦幻中的云端世界...
火葬场文学太子柳湛微服南巡,众目睽睽下,突被一陌生小娘子拦腰抱住。察觉到小娘子未私藏兵刃,柳湛眼神示意随行按兵不动,自己则默默按上袖剑。她在他怀中仰面哭泣,泪水打湿柳湛衣襟你终于来找我了,官人阿湛一声赛过一声的过分,柳湛戒备愠恼,对上那双柔情脉脉,毫不掩饰爱意的眸子,却也短暂恍惚。他覆住少女的手要扒开,她却死死攥紧不放,声称再也不能和自家官人阿湛分开。大胆民妇!随侍正欲呵斥,柳湛却摆手先把她带回去。原本打算严加盘审这位来路不明,疑点重重的小娘子,可日复一日,竟审到鸳鸯帐中。一夜过后,柳湛真成了她的官人。巡行结束,东宫多了名叫银照的宫婢。之后三年,太子虽常临幸银照,却始终未给予位份。银照无半分怨言,全心全意侍奉,病榻前衣不解带,又在太子废立数月间冷宫相伴。某日,银照躲在柳树后,偷听到七大王询问太子哥哥,你当真要立太子妃?那银娘子怎么办?她定会伤心的。柳湛漠然冷声伤心又如何?她当初用龌龊手段攀上孤,便该算到今日。王师凯旋,半途中军帐内,太子兼统帅柳湛扫了眼纳彩礼单便放到一旁,反倒拿起银照的名册,出神良久。他提笔在她的名字后册封奉仪,少顷改作良娣,又改成太子妃,最后却朱笔匆匆划去。一封密报送至帐中。太子神魂皆失,单骑驰出军营,提前回京,自踏入东宫便心悸不止,胸脯起伏,遍处寻不见银照,她真的走的,只留下一张字条认错了人。原来,是阿占不是阿湛。不是她攀了柳,她是高悬空中,他攀不到的月亮。202306151v1sc元气小太阳女主vs疏离微厌世男主男女主身心彼此唯一(涉及剧透,不赘述)。2书名出自唐代望江南莫攀我,攀我太心偏。我是曲江临池柳,这人折了那人攀,恩爱一时间。3,古早土狗文学,放飞自我之作预收阴暗爬行文学强扭瓜文学妹妹说她喜欢我失去双亲的云窈被姨妈接到齐府寄居。天生娇花弱柳,勾得人心痒痒,才来月余,齐家二公子和三公子就在宴席上公然为她争风吃醋。偏还有好事者困住云窈,起哄逼问你是想和二公子好,还是和三公子好?窈娘喜欢哪个呀?晶莹的泪珠在云窈眶中不受控打转,羽睫微颤我不堪其扰,却又躲不掉,婆娑中瞥见从佛堂出来的齐拂己,清冷矜贵,总觉得他身上烟火俱灭。云窕常听下人称赞这位在家修行的大公子,疏离却不失温文,和善能容,那让他担个虚名应该没关系吧?云窈心一横,咬唇薄肩轻耸我觉着大公子好。深夜殿内,幽深阴冷,龙帐轻摆,角落里的长明灯寂寂自燃。登基不久的新帝齐拂已俯望阶下被抓回来的美人,良久,他起身笑着走下,原本瘫坐地上的云窕下意识后退转身,却才记起这座禁宫所有窗户都被钉死,铜门此刻也已反锁。怎么又逃?齐拂已凑近云窈,鼻尖几乎抵上她的鼻尖,眸色癫狂夹杂不解,言语笑意阴恻恻却也饱含委屈妹妹说过喜欢我的。寡妇文学男女互换身体文学再惊春永兴侯府的小侯爷龙章凤姿,文武卓绝,眼高于顶,于婚事上颇为挑剔。一觉醒来,却成了高兴镇牛家村村东头的寡妇牛卫氏。家乡闹饥荒,寡妇卫杨柳不得不拖着三岁女儿上京,投靠嫁到京师的姐姐。一觉醒来,她怎么拜将封侯啦?杨柳再惊春。魔蝎小说...