中华MOD网

 找回密码
 立即加入

QQ登录

只需一步,快速开始

查看: 2145|回复: 1

理论与实践的结合 三国杀的经济学分析【2】

[复制链接]
发表于 2011-8-28 14:35:09 | 显示全部楼层 |阅读模式
 上篇文章中,我们主要讨论了三国杀牌堆与手牌的选择性问题,这次的主要话题是玩家与玩家的互动,用经济学语言说,这叫博弈论。

  既然三国杀是不完全信息动态博弈,抽象成模型后其核心无外乎“不完全信息”与“动态”,不完全信息体现在对方手牌只有对方知道,动态则体现在双方的行动是贯序的,如A先考虑向不向B出杀,然后B再考虑出不出闪。根据由浅入深的原则,我们将首先讨论存在占优策略的情况和存在纯策略均衡的情况,然后讨论需要混合策略的情况,并简单提及所谓的贯序均衡。为方便大家阅读,我与三国杀直接相关的部分加了下划线(上一篇也加了),对博弈论不感兴趣的童鞋可以直接跳过其他部分。

  一、存在占优策略

  所谓占优策略,即无论对方采用何种策略,对于自己而言有某个策略一直是最优的。如果我们自己有某个占优策略,那么没啥好讨论的,执行就是了。但这里必须指出的是,在任何情况下都占优的策略实际并不多见,即使我们平时一些习以为常的、当做锁定技一直发动的技能也有不占优的时候,虽然很少见。比如当对方有张角时,甄姬洛神、判八卦都会给对方额外的机会;陆逊不小心穿藤甲,发现对方有小诸葛,适当的时候可以放弃连营;我方有2人以上,且均无手牌,对方有张辽时,郭嘉掉血甚至可以考虑不摸牌;有鲁肃在场,张辽即使有2人可突也可以考虑只突1人,以控制手牌数量。

  但是,如果是对方有占优策略呢?那么我们就要引入一个重要概念,逆向反推(backwardinduction)。也就是说,当对方最后一个阶段存在占优策略时,我们应该预见下一步他一定会这么做,那么,当我们自己处于倒数第二期决策时,就应该考虑到这点。举个例子,很多人常犯的一个错误是,对方有张辽,自己1血被乐,弃牌留桃。错在哪?无论你手上是什么牌,哪怕故意留了张烂牌,在大多数情况下,张辽的占优策略就是把那张牌突走,那么在留牌时就应该考虑到这一点,有桃也是一定弃掉的。

  关于backwardinduction,这里提两个有意思的实战案例。

  第一个案例是我们六人组的“张飞三杀”。对于目前大多数有一定经验的三国杀玩家,面对对方装连弩或是张飞,我们一般都会留最后一张闪防酒杀,然后看看我们lby同学如何利用这一点(这里必须申明,这个策略本身是非常正确的)。反贼夏侯与另一反贼相连,忠张飞土杀夏侯,夏侯掉血刚烈,张飞第二张雷杀,夏侯闪,然后第三张酒雷杀,夏侯懵了…

  第二个案例是我online上与人单挑,我孙尚香满装备,对方许褚2血,有一些装备,够强中。许褚上一回合没动,我猜测他有杀,等下一回合裸衣,我开五谷,一借刀一贯石,自然我拿了贯石。这时我手上有一张杀,我推想,如果我装贯石斧,直接弃牌过,对方要是认为我水平不行的话,会判断我手上没杀,那么他的策略就是裸衣借刀强中,而且根据之前的交手,对方水平还行,可以做出一阶段的逆推。于是我直接弃闪过,不出所料,下一回合,裸衣!借刀!杀…许褚懵了…

  二、存在纯策略均衡

  相比于存在占优均衡的情况,稍微复杂的一点的是,尽管双方都没有占优策略,但双方给定对方的策略,自己的策略是最优的(经济学经常举的例子就是battleofsex,足球芭蕾神马的…),比如,双方都可以选A和B,只要双方选一样就有较高收益,不一样收益就低,那么(A,A)和(B,B)就是两个纯策略均衡,尽管A和B都不是占优策略。这种情况大多出现在队友的配合中。比如,队友借我刀杀对方,他是希望我出杀呢还是要刀?更直接的例子是要不要杀自己波的张角。即使不去计算收益矩阵,commonsense也告诉我们这时候混合策略要不得,尽管理论上这确实是个均衡…那么问题在于,如何达到纯策略均衡?

  一种方法是借助信息,当然,我们这里不考虑天眼神技,典型的例子是张角通过弃闪、换牌来告诉队友自己有明闪。有时,火攻也是可以用来传递信息的,比如1号位主公曹操,2号位残血忠臣,主公可以先通过火攻看看手牌是什么,然后决定是否放AOE。另外,鲁肃在没有合适的敌我交换手牌的机会时,可以考虑互通自家人手牌,这样就增加了本方的信息量。另一种方法是创造占优策略,比如,如果我借本方刀目的是要武器,那何不借本方刀杀自己?因为这时候出杀被dominated了,所以队友自然会把武器给过来。当然,前提是身份已经非常明确,不会引起误解。

  三、混合策略解

  好,这是今晚的重头戏,混合策略。在开始讨论三国杀前,先提一个重要的经济学定理:纳什均衡的存在性。简单的说,对于一个NormalForm而言,如果我们允许混合策略存在(比如以50%概率执行A,50%概率执行B),那么至少存在一个纳什均衡。这个定理看似跟三国杀搭不上边,却能得出一些简单而有用的结论。

  我们考虑这样一个情形,甄姬上家诸葛,一般情况下,甄姬会被诸葛压得很惨,但事实上,通过使用正确的混合策略,甄姬还是能大幅度提升自己的收益的。这里我们使用纳什均衡存在定理,我们首先考虑,纯策略均衡存在么?简单起见,我们假定诸葛观星中红牌质量比黑牌质量好,诸葛的策略是要不要把较好的红牌放第三张;甄姬的策略则是是否洛神。如果我们给定诸葛会把红牌放第三张,那么甄姬的策略是什么?不洛神!那么给定甄姬不洛神呢?诸葛应该在第三张黑牌。那么给定第三张是黑牌呢?甄姬又应该洛神…给定洛神诸葛又应该放红牌…由此可见,这个game是没有纯策略均衡的,甄姬一直洛神和一直不洛神都会被完全压制。

  既然没有纯策略均衡,纳什均衡定理告诉我们,一定存在一个混合策略均衡,即甄姬应该一会儿洛神一会儿不洛神。我们可以直观地理解为什么这会打乱诸葛的部署,因为洛神不洛神诸葛最优放牌顺序是不同的,而诸葛在观星是无法知道甄姬是否洛神,因为——还没轮到甄姬动呢!当然这里我无意也没有办法给出精确的甄姬洛神概率,只是想提供这一思想,对于实战的意义在于,有时甄姬突然不洛神一下,可能会有惊喜。有次OL上我甄姬突然不洛神,收获方片决斗一枚,从而改变战局的经历。

  不过,这个game还算容易分析,将博弈发挥到至高境界的武将莫过于于吉(只关心三国杀的童鞋可以跳过这一段了,这完全是吐槽于吉跟sequentialequilibrium…)。与简单的混合策略不同,这里于吉不是简单的说真话说假话,对方信与不信的问题,在这之前于吉有很重要的一步:是否把牌扣下来。不要小看这一步,做博弈论题目的时候把这一步加进去瞬间就使题目难度大增,为什么?于吉说真话说假话,对方是观察不到的,但于吉扣牌与否确是可以观察到的!用术语说,于吉扣牌这个动作叫signal(严格地说,甄姬洛神的例子也有一个signal,诸葛在牌堆放几张牌,也就是说,严格考虑的话,诸葛观星后在牌堆放3、4、5张牌时甄姬洛神的概率应该是不一样的)。并且特别注意,于吉扣一张牌,声称是“桃”,这样牌是否是桃的概率和牌堆里桃的概率是完全不一样的,对方在决策时要根据自己的belief,此外,这个belief还要依据贝叶斯法则更新…所以,要我说,用于吉的时候还是本着娱乐为本的精神,不要追求过多细节。要真说有博弈论对于吉有什么简单的指导的话,那就是,永远说真话/永远说假话/永远信/永远不信,都不是均衡(好像是句废话...==),跟上面甄姬的例子类似地想一下就明白了。

  最后我想说的是,博弈研究的目的是得出一个策略,而策略的执行者说到底是“人”,现实中的人不能简单抽象为完全的理性人,是会犯错的,是会有shock的,是会有tremblinghand的。而且,三国杀说到底,最主要的目的还是娱乐,还是开心,技术固然重要,但shock往往才能逗大家开心(仅指面杀,OL估计要被爆粗口了…),制造更多的效用。

评分

参与人数 1金币 +20 收起 理由
506041569 + 20 继续给力~

查看全部评分

发帖求助前要善用【网站搜索】功能,那里可能会有你要找的答案

中华MOD网推荐搜索:https://kan.1mod.org/

中华MOD网新浪微博:https://weibo.com/1mod

中华MOD网推荐浏览器点击我下载

中华MOD网腾讯微信:All1mod 或首页左边

中华MOD网游戏帮助Q群:218311682

发表于 2011-9-11 23:15:37 | 显示全部楼层
呵呵。。。这不错,,有意思

发帖求助前要善用【网站搜索】功能,那里可能会有你要找的答案

中华MOD网推荐搜索:https://kan.1mod.org/

中华MOD网新浪微博:https://weibo.com/1mod

中华MOD网推荐浏览器点击我下载

中华MOD网腾讯微信:All1mod 或首页左边

中华MOD网游戏帮助Q群:218311682

您需要登录后才可以回帖 登录 | 立即加入

本版积分规则

关闭

站长推荐上一条 /2 下一条

QQ|Archiver|手机版|手机专用客户端|中华MOD官网

GMT+8, 2024-11-23 20:30

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表