现代博弈论(博弈论海盗分金)

1绪论:
中国民政部于2020年1月19日上午举行例行新闻发布会 。会上发布的数据显示,2019年全国婚姻登记机关共办理结婚登记947.1万对,离婚登记415.4万对,补发结婚证和离婚证书403.4万对 。
这也是中国连续六年结婚人数减少 。数据显示,2013年我国各级民政部门和婚姻登记机构共依法办理结婚登记1346.9万对,不过在经历这一近十年的历史高位后,其后六年连续减少 。其中2019年比2018年减少了66.8万对 。
分析这个状况出现的原因,可能有以下几点:一是适婚人口总数下降 。我国自上世纪七八十年代开始实行计划生育政策,出生人口数量减少,这是当前结婚率下降的最主要原因 。二是随着经济社会的发展,不少人的婚姻观念发生了变化 。三是随着高等教育的普及,年轻人受教育的年限增加,结婚年龄不断推迟,相当一部分适婚人口没有结婚 。这其中,随着受教育程度的提高,女性经济地位的独立等因素,晚婚乃至不婚成为不少人的选择 。
上述的都仅仅是一部分原因,在情感生活中,不少年轻人还是向往恋爱的,但是为什么结婚率持续走低,甚至可以说是大规模走低,可以用博弈论的思想来解释一二 。
2.相关知识:
2.1合作博弈与非合作博弈
合作博弈又称正和博弈,是指博弈双方在博弈过程中,双方利益均有所增加,或者说至少乙方利益增加,另一方利益是不减的 。因而,整个社会的利益都是增加的 。非合作博弈则是有一种互不相容的意味在里面,是指博弈双方在博弈过程中力求收益最大,是一种策略选择问题 。合作博弈与非合作博弈的区别在于,是否存在信息互通以及一个强有力的,双方都必须遵守的协议 。信息互通是形成合作的首要前提和基本条件,能够促使具有共同利益的单个局中人为了相同的目标而结成联盟 。然而,联盟能否获得净收益以及如何在联盟内部分配净收益,需要有可强制执行的契约来保证 。因此,人们在研讨合作博弈时,往往更注重强制执行的契约,这是合作博弈的本质特点 。
2.2囚徒困境
囚徒困境模型可以描述为两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯 。警察知道两人有罪,但缺乏足够的证据 。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八年;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年 。于是,每个囚徒都面临两种选择:坦白或抵赖 。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,抵赖的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,比起抵赖的判十年,坦白还是比抵赖的好 。结果,两个嫌疑犯都选择坦白,各判刑八年 。如果两人都抵赖,各判一年,显然这个结果好 。但是,这个并不能满足每个人的理性决策 。
囚徒困境是完全信息静态博弈的一种 。反应的是个体的最佳决策并非是集体的最佳决策 。换言之,个体的理性行为却引发了集体的非理性行为 。
2.3蜈蚣博弈悖论
蜈蚣博弈是指这样一个博弈:两个博弈方A、B轮流进行策略选择,可供选择的策略有"合作"和"不合作"两种 。规则为A,B两次决策为一组 。第一次若A决策结束,则A,B均得n,第二次若B决策结束则A得到n-1,B得到n+2,下一轮A,B均从n+1开始 。假定A先开始,然后是B,接下来是A,循环有限次 。
从逻辑推理倒推可得,B的最佳策略应当是选择不合作,这样B收益始终比A高,而A的最佳决策则是在一开始就选择不合作,但这与日常生活的逻辑是不符合的 。蜈蚣博弈悖论是完全信息动态博弈的一种典型 。人们在博弈中的真实行动"偏离"了运用逆推法关于博弈的理论预测,造成二者间的矛盾和不一致,这就是蜈蚣博弈的悖论 。
2.4黔驴技穷
黔驴技穷是不完全信息动态博弈的一个简单描述,可以理解为,首先,老虎没见过驴,驴也不认得老虎(信息不完全) 。然后老虎试探驴,通过驴的反应调整自己的信念(就是策略),反之驴也一样 。在不断的试探中,老虎最终发现驴只会大叫或者踢腿,于是坚定信念,采取了自己的最优策略,吃了驴 。即参与人双方都只知道对方行动的类型以及采取这样行动的概率,然后双方不断试探,根据对方的反应调整自己的策略,最终取得最优决策 。
【现代博弈论(博弈论海盗分金)】3.具体分析:
在该恋爱博弈的过程中,有四点假设是必须明确的 。首先,博弈双方是一个信息不对称的双方,即使恋爱双方是青梅竹马,也无法做到完全的信息透明;第二,有限理性人假设,根据所掌握有限情报进行决策,因为没有人能做到完全信息掌握,只能做到相对于对方来说掌握着更多有决策价值的情报;第三,不受感情影响,以完全满意为最终目的进行决策,无论这个获利是短期还是长期,并且该决策更符合逻辑与需求,而不是最优解 。即允许存在“为了长期获利而抛弃短期利益,俗称卖人情”的可能性 。第四,数值可量化,以收益量化为参照物并计算得失而进行决策,不限于将可能性转换为概率、得分、金额、收益函数等 。
3.1完全信息静态博弈——囚徒困境
假设一对青年男女正在恋爱,卿卿我我 。但是无法确认对方付出的是否是真心,真诚的爱着对方,并且无法利用私家侦探等手段对对方进行调查,打破信息对称 。因而做出如下假设 。若双方解释真心付出,那么双方收益均为5,若双方皆不是真心付出,那么双方收益均为0,若一方真心付出,另一方不是 。则真心付出的一方收益为-10,非真心一方收益为10 。
由此可得,背叛的收益要么0,要么10;相爱的收益要么5,要么-10,答案出来了,背叛比相爱更划算 。
再由于损失厌恶的原理,被背叛的一方更会放大这个损失,因而,在某些时刻,就有可能背叛对方 。
3.2完全信息动态博弈——蜈蚣博弈悖论
假设还是这对男女,由上述假设可知,恋爱双方是随时有可能存在背叛情况的 。因而,若某一天双方决定合租房子,月租2000,押二付一,每月轮流支付房租 。并规定:如果谁先出现将异性带回家的情况,则当月立即分手,并老死不相往来,同时取消合租 。为此,双方在门口安装了一个摄像头,并在一开始,双方各自掏出2000,合计4000,放入抽屉,当做备用金,抽屉没锁 。
规则如下:A选择先付出房租,再由B从两项选其一:合作——付出下月房租,再下月房租是A支付;不合作——不用付出房租且拿走备用金,这样就可以分手前再拿走一笔了 。方便计算,以A、B各决策1次计数为1轮,现取6轮,即A-B各交替决策6次 。如果A一开始就选择不合作,收益为(1,1)(A,B各自得1分)在A决策后轮到B决策,B选择合作,收益增加(1,1)且博弈进行下去,此轮收益即为(2,2)(此轮A,B各自得2分并累加至下轮);如果B选择不合作,那么此轮收益为(0,2)(A为0分,B为2分),博弈终止 。该收益为此轮最终收益,并累加至下轮 。
博弈从左至右出发,横向连杆表示不合作,纵向连杆表示合作 。用逆推法分析,无论B合作与否,最后一步的收益都会是12,但他可以选择让A的收益在10或者12,因此,A为了不让自己的收益被降到10,势必会在前一步拒绝合作,收益停留在(11,,11),同理,B为了不让收益从12降至11,势必会在前一步选择不合作,达到(8,10),以此类推,A最终的选择应当是开始就不合作,即收益为(1,1) 。可是,从直觉来说,第一步,势必是要选择合作的,当然,收益可能为0,但是0到1,和1跟10之间的收益差距太大了,因此,在中间某一步,必然会出现背叛的行为 。双方不会在开始行为之前就选择不合作,但是,在合适开始不合作是无法确定的 。所以,互相伤害的情况必然会出现,只是早晚而已 。
3.3不完全信息动态博弈——黔驴技穷
假设一对恋爱中的男女,在平稳度过了一段时间后,男方觉得是时候求婚了,但是,此时,双方仍然在纠结对方是否值得共度一生,此时,双方只能够选择黔驴技穷 。即通过不断试探来取得对方的上下限 。双方可以通过这种试探来建立自己的初步判断 。然后在博弈过程中,通过试探来修正这种判断,并依据这种判断来不断调整自己的策略 。最后,可能会陷入类似平衡积分卡的模式 。这是一种绩效考核方式,通过不断加减来评判对方的行为,最后来调高或调低对方背叛的几率问题 。
当然,如果恋爱双方中,有人坚信以秘书问题的处理方式来选择人生的另一半,那么这对另一方来说,就很残酷了 。毕竟秘书问题的最优解是选取前36.8%的人作为样本,而这些样本无论优秀与否都是会被抛弃的,直到遇见一个比样本所有人都好的人,并将其视为自己的一生伴侣,所以,无论是黔驴技穷,还是秘书问题的解法,都说明了在博弈过程中,双方不可能是双赢的 。
4.总结
在本文的解释过程中,四个假设是偏向于理性化的,甚至是机械的,事实上是在情感生活中,人的主观情感是很重要的一个部分 。没有人能够达到以上提出的假设的,因此“完全理性”的人不存在,人的行为动机是“愿意理性,但只能有限地做到” 。由于人们通常都不可能获得与决策相关的全部信息,况且人的大脑思维能力是有限的,因此任何个人在一般条件下都只能拥有“有限理性”,人们在决策时不可能追求“最优”的结果,而只能追求“满意”的结果 。所以,本文从纯理性的博弈论角度解释了单身问题,虽然过于理性,但是仍然对当今的社会现象有一定的解释作用 。