此条目的主题是一种博弈论策略。关于一种古代法律制裁的概念,请见“以眼还眼”。

以牙还牙(英语:tit for tat)是一个用于博弈论的重复囚徒困境(reiterated prisoner's dilemma)非常有效的策略。这策略最先由数学家阿纳托·拉普伯特(Anatol Rapoport)提出,并在密歇根大学社会学家罗伯特·阿克塞尔罗(Robert Axelrod)有关囚徒困境的研究中击败其他方法,脱颖而出,成为解决囚徒困境的最佳策略[1]。

目录

1 概述

2 囚徒困境例子

3 问题

4 应用于真实世界

4.1 点对点下载

4.2 互惠利他主义

5 参见

6 参考文献

概述

这一策略有两个步骤:

第一个回合选择合作

下一回合是否选合作要看上一回对方是否合作,若对方上一回背叛,此回合我亦背叛;若对方上一回合作,此回合继续合作

“以牙还牙”策略有四个特点:

友善:“以牙还牙”者开始一定采取合作态度,不会背叛对方

报复性:遭到对方背叛,“以牙还牙”者一定会还击报复

宽恕:当对方停止背叛,“以牙还牙”者会原谅对方,继续合作

不羡慕对手:“以牙还牙”者个人永远不会得到最大利益,整个策略以全体的最大利益为依归

在众多策略中,“以牙还牙”是最有效的,曾连续数年击败由计算机科学家,经济学家和心理学家等团队所提出的策略。博弈论者尽管没有实质证据,但他们认为“以牙还牙”是最佳的策略。

囚徒困境例子

假设有四个参与者:两个用“以牙还牙”的策略,另外两个无论任何时候都会背叛其他人以让自己得到最大的好处。假定每个参与者将要面对另外三个参与者进行六次对决。如果一名参与者背叛对方而对方不背叛,前者有5分,后者得0分;如果双方不背叛对方,双方各得3分;如果双方同时背叛对方,双方各得1分。

当“以牙还牙”者对背叛者,前者第一场比赛选择不背叛,而后者正好相反,后者获得5分。在余下的5场比赛,两位参与者背叛对方,每一场比赛各得1分。最后,背叛者得10分,“以牙还牙”者得5分。

当双方均为“以牙还牙”者,在所有6场比赛中彼此均不会背叛对方。双方每回合各得3分,最后每人各得18分。

当背叛者互相对赛,双方每次都会背叛对方。双方每回合各得1分,最后每人各得6分。

尽管“以牙还牙”者从来没有赢得过一场比赛,而背叛者从未输过一场比赛,考虑到双方的最大共同利益,“以牙还牙”仍然是最好的策略。

问题

虽然阿克塞尔罗德证明了“以牙还牙”在某些情况下是最佳的策略,但两名“以牙还牙”者有时候在博弈时仍会产生问题。假如其中一方错误理解形势,就可能造成灾难性结果。在“以牙还牙”的策略下,博弈者被迫惩罚之前背叛自己的对手(尽管他不是有意的),造成恶性循环。双方都认为自己是无辜的,自己所作的只是为了自卫,并归咎对手恶毒或是不跟自己合作。这种情况经常发生在现实世界的冲突,如学生间的打斗和地区战争。而且实际上用“以牙还牙”策略只能保证和对方打成平手,很难获得更大的胜利。[2]

在重复囚徒困境的20周年纪念赛中,来自英国南安普敦大学的一个小组(由尼古拉斯·詹宁斯(Nicholas Jennings)领导,包括了拉蒂普·达什(Rajdeep Dash)、萨瓦帕里·拉姆琼(Sarvapali Ramchurn)、亚历克斯·罗杰斯(Alex Rogers)斯和皮鲁克里士南·维特林根(Perukrishnen Vytelingum))找出了另一种策略,这个新的策略在另一次实验中打败了“以牙还牙”策略。在“以牙还牙”策略成功的那个实验里,竞争者与竞争者之间是独立的。而该团队的新策略却提供了一个小组,这个小组的人都有一个目的,就是力保小组中的其中一人。也就是说这个小组可以看作一个大的竞争者。

应用于真实世界

点对点下载

BitTorrent应用“以牙还牙/投桃报李”策略以优化下载速度[3]。BitTorrent运用的optimistic unchoking技术就是运用了“以牙还牙/投桃报李”策略。BitTorrent会定期随机选择其他用户作上载,以寻找更多潜在合作者(愿意上载的用户),最大化上下载者的共同利益。

互惠利他主义

在动物群落,施予者提供帮助予受益者。利他行为应该得到回报,当双方的需求互换,原来的受益者应报答及帮助原来的施予者。群落当中有机制以查明和惩罚“不报答者”。“以牙还牙/投桃报李”原则是一个调节互惠利他主义的重要机制。

参见

同态复仇

《汉谟拉比法典》:以眼还眼

参考文献

↑ Alexrod, Robert (1984). The Evolution of Cooperation. Basic Books. ISBN 0465021212.

↑ 以牙还牙. [2010-02-19].

↑ Bram Cohen, Incentives Build Robustness in BitTorrent, February 18, 2010, http://www.bittorrent.org/bittorrentecon.pdf

查论编博弈论专题

定义正则形式的博弈 · 扩展形式的博弈 · 图博弈论 · 合作博弈 · 信息集 · 偏好

均衡概念纳什均衡 · 强纳什均衡 · 子博弈均衡 · 贝叶斯-纳什均衡 · 贝叶斯完美均衡 · 颤抖手完美均衡 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优 · 自我应验均衡 · 马尔可夫完美均衡 · 默滕斯稳定均衡 · 核 · 夏普利值 · 吉布斯均衡 · 量子响应均衡

策略优势策略 · 纯策略 · 混合策略 · 以牙还牙 · 冷酷触发策略 · 策略复制论证 · 逆向归纳法 · 前向归纳法 · 马尔可夫策略

博弈类型对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈 · 甄别博弈 · 讨价还价问题 · 多人博弈 · 大型柏松博弈 · 严格决定博弈 · 潜博弈

博弈模型围棋 · 国际象棋 · 无限棋 · 西洋跳棋 · 井字棋 · 囚徒困境(可选择的囚徒博弈 · 用餐者困境) · 旅行者困境 · 猜均值的2/3 · 协调博弈 · 蜈蚣博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 胆小鬼博弈 · 智猪博弈 · 性别战 · 猎鹿博弈 · 赌便士 · 最后通牒博弈(海盗博弈) · 石头、剪子、布 · 独裁者博弈(信任游戏) · 公共品博弈 · 纳什讨价还价问题 · 上校博弈 · 消耗战 · 少数派博弈(El Farol酒吧问题) · 公平分配博弈(切蛋糕问题) · 古诺竞争 · 死结 · 库恩扑克游戏 · 甄别博弈 · 信号博弈 · 公主与怪兽游戏 · 约会问题 · 囚徒帽子谜题

定理极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理 · 极小化极大算法 · 纳什均衡 · 策梅洛定理

关键人物阿尔伯特·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文 · 戴维·M·克雷普斯 · 唐纳德·B·吉利斯 · 朱·弗登博格 · 埃里克·马斯金 · 哈罗德·W·库恩 · 赫伯特·亚历山大·西蒙(司马贺) · 埃尔维·穆兰 · 让·梯若尔 · 让-弗朗索瓦·默滕斯 · 珍妮弗·图尔·蔡司 · 夏仙义·亚诺什·卡罗伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔 · 梅里尔·M·弗勒德 · 奥嘉·邦达雷娃 · 奥斯卡·莫根施特恩 · 保罗·米尔格龙 · 佩顿·杨 · 赖因哈德·泽尔腾 · 罗伯特·阿克塞尔罗 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯 · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里

参见全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论 · 有限理性 · 组合博弈论 · 对抗分析 · 合作性竞争 · 棋局中的先手优势 · 博弈机制 · 博弈论词汇表 · 博弈理论家列表 · 特殊博弈列表 · 双输 · 国际象棋的解局策略 · 拓扑博弈 · 公地悲剧 · 小决定暴政

Copyright © 2088 2017乒乓球世界杯_世界杯体彩 - uzhiqu.com All Rights Reserved.
友情链接