关于tit-for-tat,答李敖之

李敖之说:“一报还一报只是在阿克赛罗德的实验中成绩最好的策略,并不能因此说它是现实中的最佳策略”,同意,举tit-for-tat为例只是为了引出信息问题(识别对方和记住博弈历史)在博弈中的重要性,阿克赛罗德的工作是很初步的,他把博弈条件简化到最简单的程度,现实当然复杂得多,尤其是以下几点:

1)在他的模型里,交易进程是“循环赛”,任意两人的相遇几率是相等的,现实远非如此,现实中,在很大程度上,人们可以选择或约束自己的交易圈子,可以对不同人群采用歧视策略,可以有自己的白名单和黑名单,等等。

2)在他的模型里,每次交易的博弈矩阵是相同的,现实远非如此,有些交易性命攸关,有些则无足轻重,人们在不同交易中显然会采用不同策略。

3)在他的模型里,参与者之间是没有交流的,他们执行策略时所借助的信息,仅仅来自自己所记住的博弈历史,现实远非如此,人有嘴巴和耳朵,且热衷于交头接耳、说三道四、自吹自擂。

4)在他的模型里,参与者不能做广告(宣扬自己的策略和博弈史)、不能许诺、不能威胁、不能揭发、不能联合行动、不能自我绑架,现实远非如此,现实世界充满了上述复杂博弈策略。

首先,我认为在分析其他策略之前,先引入tit-for-tat是非常重要的,在诸多高级复杂策略中,我们都不难发现它的影子,许多策略都是它的针对特殊信息条件的优化版;其次,随着策略向更复杂的方向发展,信息问题变得更重要了,因而,用高级策略替代tit-for-tat,只能增强我文章的观点。

两年前,我曾经尝试用一个系列文章来说明信息在博弈策略进化中核心地位,我在引言中对此做了一个初步概况:

达成合作的几率与如下几个变量密切相关:
1) 博弈者相互识别的能力;
2) 博弈者记忆先前遭遇的能力;
3) 博弈者之间先前遭遇的次数;
4) 博弈者之间先前达成合作的次数;
5) 博弈各方再次遭遇的几率;
6) 博弈者标示自己策略的能力;
7) 博弈者识别对方策略的能力;
8) 博弈者判别对方策略标示之真伪的能力;
9) 博弈者之间交流的可能性;
10) 群体内交换对他人评价的机会;
11) 一个评价在群体内传播的预期广度和可能受众与被评价者的遭遇几率;
12) 预期未来博弈次数;
……

相关文章

标签: |
418

李敖之说:“一报还一报只是在阿克赛罗德的实验中成绩最好的策略,并不能因此说它是现实中的最佳策略”,同意,举tit-for-tat为例只是为了引出信息问题(识别对方和记住博弈历史)在博弈中的重要性,阿克赛罗德的工作是很初步的,他把博弈条件简化到最简单的程度,现实当然复杂得多,尤其是以下几点:

1)在他的模型里,交易进程是“循环赛”,任意两人的相遇几率是相等的,现实远非如此,现实中,在很大程度上,人们可以选择或约束自己的交易圈子,可以对不同人群采用歧视策略,可以有自己的白名单和黑名单,等等。

2)在他的模型里,每次交易的博弈矩阵是相同的,现实远非如此,有些交易性命攸关,有些则无足轻重,人们在不同交易中显然会采用不同策略。

3)在他的模型里,参与者之间是没有交流的,他们执行策略时所借助的信息,仅仅来自自己所记住的博弈历史,现实远非如此,人有嘴巴和耳朵,且热衷于交头接耳、说三道四、自吹自擂。

4)在他的模型里,参与者不能做广告(宣扬自己的策略和博弈史)、不能许诺、不能威胁、不能揭发、不能联合行动、不能自我绑架,现实远非如此,现实世界充满了上述复杂博弈策略。

首先,我认为在分析其他策略之前,先引入tit-for-tat是非常重要的,在诸多高级复杂策略中,我们都不难发现它的影子,许多策略都是它的针对特殊信息条件的优化版;其次,随着策略向更复杂的方向发展,信息问题变得更重要了,因而,用高级策略替代tit-for-tat,只能增强我文章的观点。

两年前,我曾经尝试用一个系列文章来说明信息在博弈策略进化中核心地位,我在引言中对此做了一个初步概况:

达成合作的几率与如下几个变量密切相关:
1) 博弈者相互识别的能力;
2) 博弈者记忆先前遭遇的能力;
3) 博弈者之间先前遭遇的次数;
4) 博弈者之间先前达成合作的次数;
5) 博弈各方再次遭遇的几率;
6) 博弈者标示自己策略的能力;
7) 博弈者识别对方策略的能力;
8) 博弈者判别对方策略标示之真伪的能力;
9) 博弈者之间交流的可能性;
10) 群体内交换对他人评价的机会;
11) 一个评价在群体内传播的预期广度和可能受众与被评价者的遭遇几率;
12) 预期未来博弈次数;
……



已有2条评论

  1. 小橘子 @ 2010-12-30, 02:54

    1) 博弈者相互识别的能力;
    2) 博弈者记忆先前遭遇的能力;
    3) 博弈者之间先前遭遇的次数;
    4) 博弈者之间先前达成合作的次数;
    5) 博弈各方再次遭遇的几率;
    6) 博弈者标示自己策略的能力;
    7) 博弈者识别对方策略的能力;
    8) 博弈者判别对方策略标示之真伪的能力;
    9) 博弈者之间交流的可能性;
    10) 群体内交换对他人评价的机会;
    11) 一个评价在群体内传播的预期广度和可能受众与被评价者的遭遇几率;
    12) 预期未来博弈次数;

    这么多因素,可以分一分层次,归一归类,把繁杂的因素变成有限的几个因素。

    双方博弈策略第一个层次我觉得有这些影响因素:
    a)对对方博弈策略的预期
    b)对不同博弈策略本身的净收益评估
    c)对不同博弈策略在与对方未来交互中的净收益评估
    d)对不同博弈策略在与第三方未来交互中的净收益评估

    a又可以分为
    i)对对方博弈历史表现的了解
    包括4)3)2)7)1)8)
    ii)对对方博弈策略受己方影响程度的预期
    对双方谈判能力的评估等

    b是指对单次博弈的净收益的评估,包括对成本的评估和对收益的评估,又可以分为(这个细分的层次要比acd中的层次低)
    i)不同策略的净收益
    ii)评估的准确性——这样的因素在模型中几乎总是作忽略处理的,如果这样处理,那么在这里的其他因素中出现的“预期”、“评估”都可以省略,用实际情况代替

    c又可以分为
    i)对与对方未来发生交互的概率的预期
    这个概率要分为未来发生第一次交互的概率,第二次交互的概率,依次类推。是5)12)的另一种表述。
    ii)对对方未来行为受此次博弈结果影响程度的预期
    这个影响程度要分为对未来第一次交互的影响,第二次交互的影响,依次类推。

    d)又可以分为
    i)对与第三方未来发生交互的概率的预期
    同c。
    ii)对第三方未来行为受此次博弈结果影响程度的预期
    同c。包括9)10)11)6)

    [回复]

    辉格 回复:

    我之所以这么罗列,是觉得这些能力中的每个都是可以单独进化获得的,而你抽象的结果,却更像是许多能力组合的结果。

    [回复]

发表评论