概述
策略博弈(Strategy Game)是指在多人决策环境中,每个参与者通过选择一系列行动来达到其个人目标的决策过程。在策略博弈中,每个玩家都可以在不确定其他玩家行动的情况下,选择自己的策略,以最大化其自身利益。
策略博弈可以分为纯策略和混合策略两种形式。纯策略(Pure Strategy)是指在策略博弈中,玩家选择的是一种确定性的行动,而不涉及任何随机性。每个玩家通过选择一个确定的策略来进行决策,而不考虑随机因素。例如,在一个棋类游戏中,玩家选择走哪一步作为其纯策略。混合策略(Mixed Strategy)是指在策略博弈中,玩家以一定的概率分布选择不同的策略。换句话说,玩家通过随机化选择不同的策略,并以一定的概率在不同的策略之间进行选择。混合策略涉及到随机性,玩家的决策不是完全确定的。例如,在一个扑克牌游戏中,玩家可以通过以一定的概率选择不同的下注策略来采用混合策略。
如下表所示,盖硬币方以1/2的概率猜正面,1/2的概率猜反面,这就是一个混合策略。除此以外,Aummann和Brandenburger提出混合策略不应被视为有意识的随机化,而是其他玩家对玩家将做什么的才想。如表1所示,盖硬币方猜测猜硬币方有p的概率选择正面,1-p的概率选择反面。所以猜硬币方选择正面的期望收益为
猜测反面的期望收益为
所以当p>1/2时,盖硬币放选择正面,否则选择反面。
混合策略案例
长期资本管理公司(LTCM)是John Meriwether在1993年成立的公司。在1994年到1997年之间,资产净值从12.5亿美元涨到48亿美元。LTCM的投资策略是寻找相关性较高的投资标的之间的价格差,做多价格低的投资标的,做空价格高的投资标的。用这种策略,当二者价格达到相同时就可以赚取价格差。例如,美国29年期国债价格较低,30年国债由于新发放存在溢价,所以价格较高。此时LTCM做多29年期国债,做空30年期国债。这种投资策略虽然有较大可能获得收益,但价格差普遍较小,所以收益较少。所以LTCM加杠杆来投资。在1997年之前,LTCM的财务杠杆超过25倍。同时,LTCM寻找不同的投资策略,如债券、股票等投资标的间的价格差,其中不同的投资策略之间相关性较低。通过这种方法可以对冲掉高杠杆的风险,因为这样可以在个别投资策略亏损的情况下在其他策略上盈利。然而混合策略纳什均衡,LTCM没有考虑到黑天鹅事件的影响。在1997年发生亚洲金融风暴,1998年俄罗斯金融危机混合策略纳什均衡,使得LTCM的不同投资策略都开始亏损,伴随着极高的杠杆率,在1998年末倒闭。LTCM在和市场的博弈中把市场的策略当作几乎是纯策略,没有对市场的其他变动进行足够的关注,所以最终导致倒闭的结局。
黑天鹅事件指的是发生概率低,但一旦发生会造成重大影响的事件。这一概念由Nicholas Taleb提出。Taleb在2001年美国911事件之前买入认沽权证(Long Put),以在黑天鹅事件中获利。认沽权证,也称看跌期权,是一种金融衍生工具,持有人可以在未来特定时间按合约价格卖出标的资产。看跌期权的收益曲线如下图所示。当标的价格高时亏损为权利金,价格越低收益越高。911事件后,所有大类资产价格都下跌,Taleb从而从中获利。在《黑天鹅》中,Taleb提倡使用“杠铃式”投资策略,即较少比例的10%高风险投资标的,90%几乎无风险的投资标的,不去投资中风险投资标的。用这种策略来在不出现较大回撤的情况下享受高风险带来的收益。
混合策略纳什均衡
混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,主要特征是作为混合策略的一部分的每个纯策略都有相同的期望值,否则博弈者就会选择期望值最高的策略,这就意味着初始状态不是均衡。
如上表所示为老板和员工的博弈。可以看出博弈中不存在纯策略纳什均衡。通过纳什定理,博弈中存在混合策略纳什均衡。对于员工来说,认为老板使用p的概率选择监督,1-p的概率选择放任。对于老板来说,员工使用q的概率选择干活,1-q的概率选择偷懒。此时员工选择干活的期望为
选择偷懒的期望为
当E1=E2时,员工选择不同策略的期望收益相同,此时p=4/7。同理,当q=3/4时老板选择不同策略的期望收益相同。所以,当p=4/7,q=3/4 时为混合策略纳什均衡。
笔者简介
何泓川
NIRC2022级研究生
研究方向:智能网络
限时特惠:本站每日持续更新海量设计资源,一年会员只需29.9元,全站资源免费下载
站长微信:ziyuanshu688