博弈论教程系列(3) — 纳什均衡中的支配关系

博弈论教程系列(3) — 纳什均衡中的支配关系
category
tags
type
slug
date
summary
status
icon
password
 

严格支配的混合策略

 
我们今天的主题是关于严格支配的混合策略(Strictly Dominant Mixed Strategies)。

什么是严格支配?

在之前的内容中,我们讨论了纯策略如何能够严格支配另一种纯策略。然而,我们还没有涉及这种概念如何应用于混合策略。今天,我们将把混合策略与严格支配的概念结合起来。这是一个关键的进展,因为即使在纯策略之间没有严格支配关系时,混合策略也可能会揭示新的解构方法。

示例游戏

我们来看一个简单的例子:
notion image
  • 玩家一有三个策略:上、中、下(Up, Middle, Down)。
  • 玩家二有两个策略:左和右(Left, Right)。
如果你想亲自验证,可以暂停一下并思考。但实际上,这个游戏的纯策略中并不存在任何严格支配关系。这意味着仅通过纯策略,我们无法消去任何一个策略。然而,通过引入混合策略,我们可以进一步简化游戏。

混合策略如何严格支配?

假设玩家一选择以下混合策略:
  • 1/2 的概率选择“上”
  • 1/2 的概率选择“下”
我们来分析玩家二的反应:
  1. 当玩家二选择“左”
      • 玩家一有一半时间得到3(选择“上”),一半时间得到-1(选择“下”)。
      • 平均收益为
    1. 当玩家二选择“右”
        • 玩家一有一半时间得到-1(选择“上”),一半时间得到2(选择“下”)。
        • 平均收益为
      无论玩家二选择“左”还是“右”,玩家一的这组混合策略(1/2 上,1/2 下)都优于选择纯策略“中”(其收益固定为0)。因此,纯策略“中”被严格支配,可以被消去

      消去后如何求解?

      notion image
      消去“中”之后,游戏简化为一个熟悉的 对阵表。此时:
      • 玩家一的策略为“上”和“下”;
      • 玩家二的策略为“左”和“右”。
      分析后我们可以发现,这个游戏没有纯策略的纳什均衡。这是因为两个玩家的目标互相冲突,类似于“猜拳”或“猜硬币”问题。

      求混合策略纳什均衡

      通过公式计算,我们可以得到混合策略纳什均衡:
      • 玩家一3/5 的概率选择“上”,以 2/5 的概率选择“下”;
        • notion image
      • 玩家二3/7 的概率选择“左”,以 4/7 的概率选择“右”。
        • notion image

      结论

      本节的主要启示在于,严格支配不仅适用于纯策略,也适用于混合策略。当纯策略之间没有严格支配关系时,引入混合策略可能会帮助我们简化问题。
      在下一节中,我们将讨论 弱支配策略(Weakly Dominant Strategies)。与严格支配相比,弱支配更具挑战性,规则也更加复杂。敬请期待!
       
       

      弱支配策略(Weak Dominance)

      什么是弱支配?

      弱支配是严格支配的一个放宽版。在一个博弈中,如果一个策略总是 至少与另一个策略一样好,并且在某些情况下更好,我们称它为“弱支配”。相比严格支配,弱支配更复杂,因为它允许一种策略在某些情况下与另一种策略的结果相等,而严格支配要求在所有情况下都更优。

      示例博弈

      我们来看一个简单的两人博弈:
      notion image
      • 玩家一有两个策略:上(Up)和下(Down)。
      • 玩家二也有两个策略:左(Left)和右(Right)。
      比较玩家二的“左”和“右”策略:
      1. 当玩家一选择“上”时
        1. notion image
          • 玩家二选择“左”时的收益是1;
          • 玩家二选择“右”时的收益是0。
          • 在这种情况下,“左”优于“右”。
      1. 当玩家一选择“下”时
        1. notion image
          • 玩家二的收益是2,无论选择“左”还是“右”。
          • 在这种情况下,“左”和“右”等价。
      综合来看,“左”至少与“右”一样好,在某些情况下更好。因此,我们说 “左”弱支配“右”

      弱支配策略的消去

      现在假设我们采用 弱支配策略的迭代消去法
      1. 由于“右”被“左”弱支配,我们可以消去“右”
      1. 消去后,剩下的游戏只有玩家二的策略“左”,以及玩家一的两个策略“上”和“下”。
        1. notion image
      1. 玩家一会选择使自己收益最大的策略。在这里,如果玩家二固定选择“左”,玩家一会选择“上”,因为“上”的收益为3,比“下”的收益2更高。
        1. notion image
      因此,通过弱支配策略的迭代消去,我们得到一个纳什均衡:玩家一选择“上”,玩家二选择“左”
      notion image

      弱支配的陷阱

      尽管弱支配策略的迭代消去可以简化游戏,但它可能会导致我们遗漏一些纳什均衡。来看原始游戏:
      • 如果玩家二选择“右”,玩家一选择“下”,两人的收益分别为2和2。
        • notion image
      • 检查这一组合是否为纳什均衡:
        • 玩家二无法通过切换到“左”获得更高的收益(2仍然是最佳收益)。
          • notion image
        • 玩家一无法通过切换到“上”获得更高的收益(收益会从2变为0)。
          • notion image
      因此,“下,右” 也是一个纳什均衡。
      通过弱支配消去法,我们可能会遗漏掉这个纳什均衡。因此,弱支配策略的处理需要更谨慎。
      notion image

      为什么弱支配策略可能被选择?

      虽然从理性角度看,弱支配策略似乎不应被选择,但在某些情况下,它可能具有实际意义。例如:
      • 分配性偏好:在上述博弈中,玩家二可能偏好“右”,因为这样她的收益是2,而不是选择“左”时的1。
      • 可信承诺:玩家二可以通过“承诺”选择“右”来引导玩家一的决策。如果玩家二表明她会选择“右”,玩家一将更倾向于选择“下”,从而实现对玩家二更有利的纳什均衡。

      弱支配策略的结论

      • 弱支配策略的迭代消去可能帮助我们找到纳什均衡,但可能会遗漏其他均衡。
      • 弱支配策略在某些情况下可能对玩家有战略意义,特别是在涉及分配偏好和可信承诺时。
      在下一节中,我们将讨论具有无穷多个纳什均衡的博弈模型,敬请期待!

      无限多个均衡

      在博弈论中,纳什均衡是一组策略组合,所有玩家在给定其他玩家策略的情况下,无法通过单方面改变自己的策略来提高自己的收益。今天我们将讨论一个特殊的情况:博弈中可能存在无限多个纳什均衡。

      示例博弈

      这是我们要研究的博弈:
      notion image
      • 玩家一有两个策略:上(Up)和下(Down)。
      • 玩家二也有两个策略:左(Left)和右(Right)。
      初步分析如下:
      1. 严格支配策略的消去
          • 玩家二的策略“右”是被“左”严格支配的:
            • 如果玩家一选择“上”,“左”的收益为1,“右”的收益为0;
              • notion image
            • 如果玩家一选择“下”,“左”的收益为-2,“右”的收益为-5。
              • notion image
            • 不论玩家一如何选择,“左”的收益始终比“右”高,因此“右”可以被消去。
      1. 简化后的博弈
        1. 消去“右”后,博弈简化为:
          notion image
          • 玩家一的策略为“上”和“下”;
          • 玩家二的唯一选择是“左”。
          • 在这种情况下,玩家一的收益始终是3,无论选择“上”还是“下”。这意味着玩家一在纯策略下对“上”和“下”无所谓(收益相等)。

      存在的纳什均衡

      在这个博弈中,我们发现以下均衡:
      1. 纯策略纳什均衡
          • 玩家二选择“左”,玩家一选择“上”或“下”。
          • 在这两种情况下,任何一方都没有激励单方面改变自己的策略。
          • 因此,“上-左”和“下-左”是两个纯策略纳什均衡。
      1. 部分混合策略纳什均衡
          • 玩家二始终选择“左”这一纯策略,而玩家一在“上”和“下”之间随机选择,遵循混合策略:
            • notion image
          • 玩家一选择“上”的概率为 P;选择“下”的概率为 1−P。
          • 因为玩家一对“上”和“下”无所谓,他可以选择任意
      由于在 区间内有无穷多个数值,玩家一可以采用无穷多种混合策略。这意味着此博弈存在无限多个纳什均衡

      为什么会出现无限多个均衡?

      关键在于:
      • 玩家二选择“左”后,玩家一对“上”和“下”完全无差别(收益均为3)。这种“无差别”使得玩家一可以自由选择混合策略,而不会影响玩家二的决策。
      • 玩家二永远不会选择“右”,因为它是一个被严格支配的策略。
      因此,只要一个玩家的纯策略让另一个玩家在自己的选择上无差别,就可能导致无限多个部分混合策略纳什均衡。

      一个重要的观察

      这种现象并不罕见,尤其是在博弈中存在一个玩家的纯策略使另一方无差别的情况下。实际上,这种情况在我们前面提到的弱支配博弈中也可能出现。你可以尝试回顾弱支配的案例并寻找其中的混合策略均衡。

      总结与展望

      • 无限多个均衡的成因:当一个玩家的纯策略让另一个玩家无差别时,就可能出现无限多个部分混合策略纳什均衡。
      • 纳什均衡的形式:纯策略和混合策略均衡可以共存,混合策略可能是无穷多个。
       
      下一步:我们将在下一节中探讨博弈中纳什均衡的数量特性,例如为什么许多博弈的均衡数是奇数。
       

      奇数规则(The Odd Rule)

      奇数规则指出,几乎所有的博弈都包含奇数个纳什均衡。这一规律可以通过以下例子观察到:
      1. 单个均衡的例子
          • 囚徒困境:1个纯策略纳什均衡。
          • 匹配硬币和混合策略算法博弈:各有1个混合策略纳什均衡。
      1. 多个均衡的例子
          • 性别之战:3个纳什均衡(2个纯策略、1个混合策略)。
          • 鹿猎博弈和红绿灯博弈:各有2个纯策略纳什均衡,但在应用混合策略算法后,每个博弈还额外包含1个混合策略均衡,总共3个均衡。
      几乎所有博弈都遵循这一规则,拥有奇数个均衡。但也有一些例外:
      • 无限个均衡:通常与弱支配策略有关(例如之前讨论的博弈)。
      • 偶数个均衡:这种情况非常罕见。

      免费金钱博弈(The Free Money Game)

      这是一个有趣的例子,展示了博弈中如何出现偶数个纳什均衡

      博弈规则

      • 你和你的朋友需要通过一次盲投表决来决定是否接受免费金钱。
      • 投票规则:
        • 如果双方都投“是(Yes)”,每人获得1美元。
        • 如果其中一方投“否(No)”,两人都得不到钱。

      纳什均衡分析

      notion image
      1. 均衡1:是-是(Yes-Yes)
          • 如果两人都投“是”,双方各得1美元。
          • 任何一方单方面改为“否”,都会从1美元降到0美元,因此没有人愿意偏离这个策略组合。
          • 这是一个纯策略纳什均衡
      1. 均衡2:否-否(No-No)
          • 如果两人都投“否”,双方都得不到钱。
          • 任何一方单方面改为“是”,仍然得不到钱,因此也没有人愿意偏离这个策略组合。
          • 这是另一个纯策略纳什均衡
      notion image

      为什么没有其他均衡?

      为了验证是否存在其他均衡,特别是混合策略纳什均衡,我们进行如下分析:
      • 假设玩家一采用混合策略,在“是”和“否”之间以某种概率分配。
      • 玩家二的最佳回应是选择“是”,因为“否”永远带来0收益,而“是”有可能带来正收益。
      然而,如果玩家二总是选择“是”,玩家一就会选择纯策略“是”,以保证自己的收益最大化。这表明博弈中不可能存在混合策略均衡

      奇数规则的例外

      免费金钱博弈是一个特例,拥有偶数个纳什均衡(2个),主要原因是:
      • 弱支配策略的存在
        • 对每位玩家来说,“是”弱支配“否”,因为“是”在某些情况下提供更高的收益,而在其他情况下提供与“否”相同的收益。
      这种情况在博弈中非常罕见,通常需要仔细检查是否遗漏了其他均衡(例如混合策略均衡)。如果确实只发现偶数个均衡,大概率是因为存在类似的弱支配策略。

      结论与展望

      1. 奇数规则:几乎所有博弈的纳什均衡数为奇数。
      1. 例外情况:偶数个或无限个均衡通常与弱支配策略有关。
      1. 免费金钱博弈的启示:在某些投票类博弈中,可能出现偶数个纳什均衡,体现了弱支配策略的影响。
      下一个话题:我们将进入新的单元,讨论序贯博弈子博弈完美均衡,探索玩家如何通过提前规划和战略思考优化决策。敬请期待!
      上一篇
      博弈论教程系列(2)— 零和博弈与混合策略纳什均衡
      下一篇
      什么是创业中最重要的事?
      Loading...
      2024-11-20
      最新发布
      什么是正确的交易理念?《毛选》已经给了我们答案
      2024-12-1
      这个世界的真相是什么?为什么说“道”比方法论更重要?
      2024-11-29
      十年一次的机遇,2024年A股牛市操作手册,如何让资产快速翻25倍?
      2024-11-27
      为什么手中的绩优股票迟迟不涨?成交量到底怎么看?什么是量价关系?
      2024-11-24
      价格行为技术分析-10-交易区间概念基础
      2024-11-22
      价格行为基础教学-02-认识多空力量
      2024-11-22