含有〈心智〉标签的文章(4)

人工智能与心智表征

人工智能与心智表征
辉格
2022年6月19日

继续上周的话题,在上一篇里,我讨论了AI在当前发展路线上将面临的局限,那么,突破这一局限的出路在哪里呢?或者让我换一个更具操作性的问题:未来出现的何种进展,会让我赞叹“这下有戏了!”?

简单说,我期待的是这样一种进展:一个AI系统能解释自己的行动、决定或看法,或者更理想的,一个AI系统的各组成模块都能这么做,至少大部分高层认知模块都能这么做,一些基础知觉模块可能无法解释就自己的知觉过程给出解释,但其知觉结果的表征必须是一个十分有限且相当恒定的离散集,即,当它声称自己看到、听到、闻到或察觉到了什么状况时,这一状况必须以某组清晰界定的概念来表示。

设想一个自动驾驶系统,有次在路上发生了追尾,撞坏了前车,事后它的教练向它提出一连串问题,诸如:你是否认为自己犯了个错误?说说当时发生了什么?你当时是怎么想的?为什么没有及时踩刹车?你考虑了哪些因素后做出的这个决定?在你看来,是否你的某种知觉能力(more...)

标签: | | | | |
9003
人工智能与心智表征 辉格 2022年6月19日 继续上周的话题,在上一篇里,我讨论了AI在当前发展路线上将面临的局限,那么,突破这一局限的出路在哪里呢?或者让我换一个更具操作性的问题:未来出现的何种进展,会让我赞叹“这下有戏了!”? 简单说,我期待的是这样一种进展:一个AI系统能解释自己的行动、决定或看法,或者更理想的,一个AI系统的各组成模块都能这么做,至少大部分高层认知模块都能这么做,一些基础知觉模块可能无法解释就自己的知觉过程给出解释,但其知觉结果的表征必须是一个十分有限且相当恒定的离散集,即,当它声称自己看到、听到、闻到或察觉到了什么状况时,这一状况必须以某组清晰界定的概念来表示。 设想一个自动驾驶系统,有次在路上发生了追尾,撞坏了前车,事后它的教练向它提出一连串问题,诸如:你是否认为自己犯了个错误?说说当时发生了什么?你当时是怎么想的?为什么没有及时踩刹车?你考虑了哪些因素后做出的这个决定?在你看来,是否你的某种知觉能力,或知识储备,或决策系统中,存在某种缺陷或不足,导致你未能做出最佳选择?你从这个事故中学到了什么?或准备去学点什么?…… 假如这个系统能对诸如此类的问题给出有意义的响应,让这样的问答对话能够继续下去,那我便可以说,其设计者的路子走对了,前途大有可观。 目前的AI系统离这还很遥远,而且很难说已经朝这方向发展了,有些系统能把英语说的很溜,但无法深入到实质性问题,它会跟你绕圈子,说一大堆似乎跟交谈主题有关的话,却从来没有表现出自己对主题有真正的理解和看法。 达到我的要求很不容易,系统不仅需要一个心智,这个心智还要能对自身状态进行表征,才可能对外界表述出来。 囫囵系统注定做不到这一点,因为其囫囵性质,其内部状态是无从表征的,对上面那些问题,它能给出的回答只能像这样:我当时的决定是基于对当时当地综合状况的一种整体直觉而做出,我无法将这一整体直觉分解为若干分立的理由或考虑,因为我生来就不是这么认识世界和考虑问题的。 就是说,一个囫囵系统就自己行动/决策所能给出的唯一解释就是它的gut,此时此地,此情此景之下,gut告诉它,这是最好的决定,如果事后证明这显然不是最佳决定,那会如何呢?那只是个负面反馈,一个负面反馈会让系统做出调整,但具体如何调整,是难以言表的,这一难以言表性是系统的囫囵性质决定了的。 那么,将心智状态和心智过程表征出来有什么好处呢? 有很多好处,让我一个个说。 首先,心智表征能让心智之间展开更有意义的合作。设想一个董事会,正在开会以便就是否投资某个项目做出决定,如果这些董事都是囫囵系统,他们在会上能说些什么呢?他们可能各自给出投资意见:我是否赞成这项投资,我的预期回报有多大,或许还能对此给出一条置信曲线:90%置信度收益率上下限多少,70%置信度收益率上下限多少,完全失败的风险多大,诸如此类,但他们无法解释自己是怎么得出这些数字的。 假如各董事意见不一,怎么办呢?唯一能做的,就是投票决定,当然,更精细一点,每位董事可以依其经验值而被赋予不同投票权重,但囫囵系统之间的合作关系到此为止,他们无法展开讨论,无法倾听、检查和推敲各自的陈述与理由,因而也无法相互补充事实或理由,相互说服,相互启发,更一般的说,他们无法将他人的陈述和意见作为输入,用来重新运行自己的心智过程,从而指望得出更好的意见输出,因为他们的唯一理由就是gut,而gut之间是无法对话的。 一群具有心智表征能力的董事就不同了,一位董事可能对项目做一番介绍,其他董事可能要求他就他所列举的一项事实陈述做出澄清,或提出与之冲突的证据(不一致的知觉结果),他们还可以解释自己计算预期收益的方法和过程,他人也可对这些算法和模型提出质疑,比如指出应该考虑另一项输入,或指出另一个模型在此类评估上表现更好,或指出他在从事实认知到结论之间的论证链条上存在逻辑跳跃或缺陷。 所有这些,都需要他们拥有大致兼容的概念框架,对话才能进行,当然,概念框架未必完全一致,比如董事甲可能发现董事乙不理解自己所使用的某个概念(A),但基于过去的对话经历,甲知道乙理解另一个概念(X),此时甲可能会用类比的方法解释到:A与B在结构S中的关系,就像X与Y在结构T中的关系,而乙听到这个解释后,立即重新运行自己的相关认知过程,重新运行的结果可能对这一类比并不买账,但也可能得出了某些新颖的东西——我们把这称为“启发”。 其次,心智表征也会促成专业分工,设想这群董事经过一番讨论后,赞成投资的一派仍未赢得足够票数,几位董事都表达了对某一特定风险的担忧,比如,未来几年内若核聚变技术取得大突破,赞成派预期中的收益将无法实现,赞成派在知晓他们的反对理由后,可能说:既然你们担忧的是这一点,那好,不如我们听听这方面专家的意见,看看这事情发生的机会有多大。 这些董事的心智中可能都有一个风险评估模块,也有一个技术进展跟踪模块,还有一些相似的知识储备,对核聚变技术的发展状况多少有所知觉,可是,他们的每个模块的构造质量和性能表现可能大不相同,知识储备的覆盖面也不同,各自有所短长,另外,除了他们自己,还有其他可与之交流的心智系统存在着,而且,基于以往的表现,以及对这些表现的共同了解,对于各心智系统的短长所在,大家多少有着一些共识,所以,当赞成派提出,让我们听听那位专家(他可能是董事之一,也可能是位请来的客人)怎么说,大家至少是愿意听一听的——如果他们是真诚参与讨论的话——,而他们听到的内容,将作为新输入,触发相关风险评估模块的重新运行,并且可能得出与之前有所不同的输出。 注意,这样的过程得以发生,有几个重要前提:反对者的提出的反对理由不是囫囵的(我就是反对这项投资,没啥道理可讲),而是有细节的(我担心这项特定风险),而且这些细节是基于共同概念框架来表达的:我担忧的是一种“风险”,它与“核聚变技术”有关;而且这一反对理由背后有着一种因果关系预设:“核聚变技术”的“重大突破”将使得“目标项目”丧失其“技术优势”——这一预设同样是可以接受检查和挑战的。 如果一项理由未能经过如此概念化的表达,它是无法被检查、推敲和挑战的,它要么被全盘接受,要么被全盘抛弃,而无法被讨论,它不能被分解成若干逻辑成分,否定其中之一而保留其余,或将某一成分从一个特定值替换为一个函数,并将该值的计算委托给某个外部模块或系统,从而实现分工。 这样的分工与委托要得以实现,需要心智系统能够就问题的其余部分预先达成一致,从而隔离出分歧点,当董事们决定将某一特定风险的评估任务委托给专家时,他们已经就一些前提达成共识:目标项目的核心优势是一种低成本发电技术,因而与其他发电技术构成竞争关系,所以其他某种发电技术的突破是一种潜在风险,核聚变是一种可能的发电技术——要对问题的局部达成这样的共识,同样需要基于概念框架的逻辑分解,囫囵系统是做不到的。 再比如,当董事们决定将某项收益精算任务委托给某位财务专家时,他们必定已经就某些事实的认定(或其认定机制)达成了起码的共识,否则委托将无法进行,当财务专家看到几套相互矛盾的数据时,采用哪一套?如果他自行决定,那就相当于把整个项目评估任务委托给了他,而不是将分解出的一项子任务委托给了他,这种分解,同样基于共同概念框架,也就是我说的语义界面。 第三,心智表征也是相互补充与启发的前提,一个心智系统可能因为缺乏某方面输入而欠缺对某些事物的知觉能力,而来自其他心智的输入可以(1)提起他对某些他之前忽略的事情的兴趣,去获取更多输入,2)即便没有更多额外的实景输入,也可能促发他在既有数据基础上,从新的角度进行概念再识别,即在一些新线索提示下重新运行实体/特征识别程序,结果可能会获得一些新“洞见”,3)如果来源心智足够可信(可信度可经由以往交往经历和公共声誉而得到评估),他甚至可能直接接受一些输入概念或知识,4)这种外来知识不仅包括事实陈述,也可以是拇指法则(如果出现这种情况,就最好不要那么做),或推理/算法模块(如果他戴且仅戴着一只耳环,不妨找找他是同性恋的其他线索,或,看到一个球状物体时,可以这么估算它的体积),很明显,这种受补充与启发的能力,同样是以语义界面的存在为前提的,系统内部必须已经充分清晰的分解为众多独立模块,相互间通过语义界面分隔与交互,否则,此类输入信息将如何被使用,将是毫无头绪的,因为它们不是有关世界的一阶实景数据,脱离语义界面,你不知道如何让它们与心智既已拥有的知识发生关系。 正是心智表征和语义界面所创造的这些全新可能性,让人类心智表现的如此杰出,个体间的认知分工与合作,让认知能力的扩展和知识储备的积累超越了个体寿命与观察机会的局限,以及单一大脑算力与存储量的局限。 而且分工与合作不仅发生在个体之间,也发生在个体心智内部的各模块之间;所谓意识,就是经由全脑激活而出现的各模块间活跃互动状态,所谓斟酌,就是各模块争相轮番表达看法,陈述理由,主张行动方案的过程;这些模块间互动赖以展开的语义界面,和个体间的语义界面(自然语言),在相当大程度上是对应乃至重合的(虽然不必完全一致,一些在模块间起作用的内隐概念,或许从未在自然语言中得到对应表达)。 必须承认,人类在这方面的表现并不完美,许多所谓的讨论其实是假讨论,参与者其实早就拿定了主意,并不准备认真倾听他人意见,接受任何说服,他们只是假装如此,或许那会起一种安抚作用,而且人们在表达看法时也并不总是有效,事实陈述,立场表达,意愿或愿景的表达,推理过程的解释,常以凌乱模糊的方式交杂在一起,缺乏清晰的分解。 许多认知活动在头脑里或许是诸多模块分工的,但进入口语后其来源边界却模糊了,还有数量关系,我们头脑中或许有一部不错的贝叶斯推断机,以精细的量化指标处理着各种事态的或然性(证据之一是我们的刻板印象往往相当准确有效,而且其实并不那么刻板,会随新输入而调整),可是,在内省以及口语表征中,这些数量特性或许全都丢失了,就是说,有些模块缺乏清晰可用的语义界面,它们是黑箱,无论对于意识的内省机制还是人际交流机制,其内部逻辑都是不可见的。 与此同时,语义界面并非人际互动的唯一界面,我们至少还有一个情绪界面,建议和说服并非影响他人行动的仅有手段,感染与恐吓也是,在董事会上,你可以通过播放一段音乐或展示一些视觉素材来影响其他董事的决定,或在恰当时机给他们喂高糖食物,或通过布置、衣饰或身体姿态来营造某种气氛,诸如此类,在许多情况下,情绪界面或许比语义界面更重要。 但无论如何,至少在某些条件下,在某些事情中,语义界面所创造的潜力得到了很好的开发,否则就不会有文明了;众多学科和工程技术领域所积累起的庞大而精致的知识体系,都是此类开发的成果;所以我相信,AI系统若不具备同样能力,将无法取得智人已经取得的这种成就。 另外,同样诱人的是,心智表征将为解决AI终将面临的伦理困境指明方向;囫囵系统或逻辑黑箱是“不可理喻”的,其行动逻辑无法被检查和验证,因而无从知晓其行为是否会符合某种道德规范,它们也无法被劝诫、警告和说服,无法向他解释,为何这么做是错的,违反了哪条道德准则,因为它们不支持语义界面,你也没有任何手段告诉它:因为国会通过了某个法案,所以从今天起,你不能再以某种方式行事了,或你的行动必须遵守某种新规则了,或许你可以设计某种新的训练环境来改变其行为方式,但你没法直接告诉它不能怎么做,而且训练结果的可靠性也是无从事先(通过检查其内部状态而)验证的,只能在事后才知道,这个事后可能是很久以后。 有了心智表征,这些都变得可能了,通过本文开头所演示的那种对话(第三节),我们有机会了解其心智状况,观察世界和思考问题的方式,理解能力,行动策略,价值取向,都将通过对话展示出来。 有了这个前提,我们才可能判断能否将某类任务交给它,是否赋予他某些自由与责任,是否将其接受为一个合格的独立行动主体,成为一位平等的社会参与者,一位公民。 【2023-03-16】 @我宣布个事_我是个伞兵_没毛病嗷:辉总认为今天的AI是否符合之前说过的分层次,语义化的设计? @whigzhou: 不知道,我最近没关注太多,不过从它表现出的能力看,我有点怀疑它已经朝这方向走出了几小步 @whigzhou: 我仍然相信,若不朝这方向走,有些关键门槛是越不过的
意识与吃屎

【2019-08-14】

惊了!人类意识(consciousness)竟然和吃屎有相通之处,不开玩笑,我刚刚认识到这一点,说起来话有点长,

是这样的,吃屎分两种,1)吃其他动物(特别是其他物种)的屎,这个好理解,不同动物的消化机制不同,一种动物的废弃物对另一种动物可能是营养丰富的宝,2)吃自己的屎,这个原理略复杂,简单说是因为消化道是条单向单线程加工流水线,由于缺乏循环回路,某些类型的消化/吸收过程无法完成,例如兔形目的纤维素发酵发生在盲肠,可是发酵产物的最佳吸收环节却是小肠,所以兔子会拉两种屎球,一种干硬,一种湿软,后者拉出后马上又吃掉,于是便构成一(more...)

标签: | | | | | | | |
8144
【2019-08-14】 惊了!人类意识(consciousness)竟然和吃屎有相通之处,不开玩笑,我刚刚认识到这一点,说起来话有点长, 是这样的,吃屎分两种,1)吃其他动物(特别是其他物种)的屎,这个好理解,不同动物的消化机制不同,一种动物的废弃物对另一种动物可能是营养丰富的宝,2)吃自己的屎,这个原理略复杂,简单说是因为消化道是条单向单线程加工流水线,由于缺乏循环回路,某些类型的消化/吸收过程无法完成,例如兔形目的纤维素发酵发生在盲肠,可是发酵产物的最佳吸收环节却是小肠,所以兔子会拉两种屎球,一种干硬,一种湿软,后者拉出后马上又吃掉,于是便构成一条循环回路,突破了消化道的拓扑特性所构成的局限。 再来看意识,意识其实可以视为人类头脑中的一个叙事器(narrator),在一个人清醒状态的大部分时候,不断(通常是无声的)叙述着他的知觉,动机,意图,对当前状况的评估,当前知觉引发的联想,对后果的预测,斟酌下一步举措时涌出的各种相互竞争的理由,等等等等,那么,这些东西为什么要以言语形式叙述出来呢?依我看,这是为了构造回路,因为产生上述种种心理活动的众多神经结构之间的拓扑特性,或许(就像消化道的拓扑特性一样)对认知系统构成了某种功能局限,使之无法形成某些类型的认知能力,叙事器的作用就是把它们的活动转变成言语,再输入言语接受模块(就像软屎球被吃回去一样),然后从那里向众多其他模块广播,从而激发一些如若不然就不会产生的认知活动。 或许是这样。 有关叙事回路的功能,我在《沐猿而冠》附录〈何为理性动物〉里有更详细的阐述。
沐猿而冠·附录·何为理性动物

(本文曾作为附录收入于《沐猿而冠》)

“人是理性动物”——这句话直觉上很容易接受,我们在做决定时会考虑各种理由,会从各种来源收集信息,倾听他人建议,上网搜索一番,权衡利弊;我们也会分析和算计,有时还拿出纸笔计算一番,在重大事情上,甚至会组织调查研究,建立数学模型,运用高端统计工具;即便在不面临抉择的时候,我们也会不停的观察、思考和探索,以便更好的理解这个世界。

可一旦细究起来,却又发现很难说得清楚什么才算理性;饥饿感驱使我们寻找食物,假如我只是不假思索走向冰箱拿出块巧克力,说不上有多理性,可要是空空如也的冰箱促使我放下游戏抓紧写简历找工作,好像就算得上理性了,同样是听从本能的指引,为满足生存所需而做点什么,似乎那些包含了更多预见、计划和迂回手段的行为,更可能被认为是理性的。

有时理性又被视为对抗或克制本能的能力,我出于健康考虑而抵御了奶油曲奇的诱惑,在男女交往中克制色欲而维持了礼节和体面,在商业交往中抵御贪欲而保持诚实守信,都会被视为理性;当然,放弃短期满足可能换来长期回报,因而许多克制都是有其理由的,而且这些理由往往可以经由一连串适应性解释而被追溯到遗传收益这个古老的终极理由。

但也可以没有这样的理由,因为人可以为自己创造新的理由,或把原先的策略理由变成终极理由;换句话说,我们可以只是因为喜欢而做某事,追求某种目标,并为此而克制(more...)

标签: | | | | |
6814
(本文曾作为附录收入于《沐猿而冠》) “人是理性动物”——这句话直觉上很容易接受,我们在做决定时会考虑各种理由,会从各种来源收集信息,倾听他人建议,上网搜索一番,权衡利弊;我们也会分析和算计,有时还拿出纸笔计算一番,在重大事情上,甚至会组织调查研究,建立数学模型,运用高端统计工具;即便在不面临抉择的时候,我们也会不停的观察、思考和探索,以便更好的理解这个世界。 可一旦细究起来,却又发现很难说得清楚什么才算理性;饥饿感驱使我们寻找食物,假如我只是不假思索走向冰箱拿出块巧克力,说不上有多理性,可要是空空如也的冰箱促使我放下游戏抓紧写简历找工作,好像就算得上理性了,同样是听从本能的指引,为满足生存所需而做点什么,似乎那些包含了更多预见、计划和迂回手段的行为,更可能被认为是理性的。 有时理性又被视为对抗或克制本能的能力,我出于健康考虑而抵御了奶油曲奇的诱惑,在男女交往中克制色欲而维持了礼节和体面,在商业交往中抵御贪欲而保持诚实守信,都会被视为理性;当然,放弃短期满足可能换来长期回报,因而许多克制都是有其理由的,而且这些理由往往可以经由一连串适应性解释而被追溯到遗传收益这个古老的终极理由。 但也可以没有这样的理由,因为人可以为自己创造新的理由,或把原先的策略理由变成终极理由;换句话说,我们可以只是因为喜欢而做某事,追求某种目标,并为此而克制本能,学者可以忍受清贫而只为探索奥秘,商人可以在明知毫无利益时仍保持诚信,在围棋这样其目标、规则、胜负、价值完全人为构造的游戏世界中,我们一样可以玩的很开心;所有这些表现,并不会被视为非理性,甚至还常被赞颂为理性的最高境界。 可是这样一来,就更难说清什么才是理性了,火苗让我的手自动缩回来,不算什么理性,我小心避开火苗,算是有点理性,我强忍烧灼而拒绝缩手,你会说我是疯子,可我要是有个好理由(或许那可以让我牢记某次沉痛经历),你是否会说我太理性了?那么,假如这只是一次行为艺术呢?死不免冠的子路,火刑柱上的圣徒,饿死不受嗟来之食的名士,是太疯狂还是太理性呢?那么怀抱鸿鹄之志而甘受胯下之辱的韩信呢? 或许真正重要的是控制感:当我抵御美食诱惑时,感觉自己成功掌控了局面,克制了本能冲动,让我确信自己保有自由意志;相反,假如我不由自主的伸手拿了奶油曲奇,事后又对自己的贪吃感到懊恼,便会感觉自己丧失了控制,被本能所摆布;可是何以如此?既然构成“我”的各子系统相互竞争的结果只能是其中之一胜出,为何其中有些更有资格代表“我”,其胜出被视为理性,而另一些的胜出却被视为失控? 答案或许在于意识这个子系统的特殊地位,意识是一个语义化的行为调制系统,随着人类语言能力的发展,该系统在决定个体行为的诸因素中逐渐获得了一种类似于中央政府在一个国家中所处的地位,取得日益广泛且有效的控制权,而所谓理性,即是指这一中央控制权的执行效能与强度,以及它所表现出的一致性和连贯性(否则其控制就变成了疯狂)。 尽管意识机能的实现细节尚不清楚,不过,为了说明它如何可能在已知神经基础上无须借助任何神秘力量而发展出来,我们不妨从既有知识出发,设想一下它可能会是什么样子。[1] 情形或许是这样:组成我们的模块中,有些是基于语义表征的(用软件术语说,是由符号化的高级语言编写的,而不是通过硬连线之类的硬编码实现的。下文称这些为语义模块),因而其对行为调控的参与,也是通过语言系统而实现的,而能够做到这一点,是因为我们已经有了对语言指令作出响应的能力。 比如当我们的听觉语言中枢(即从听觉系统接收语音并解读为语句的模块)收到同伴发出的祈使句——“住手!”——时,正在伸出的手就会缩回来(或许是因为这个句子会唤起某种痛苦记忆),这样的事情会发生,表明必定存在某个机制,将上述语句转变成了动作指令,姑且将该机制称为受话系统。 当各语义模块竞争行为控制权时,或许发生了类似的事情,受话系统仿佛收到来自某个模块的一个祈使句,并产生了相应的行为控制效果;当然,这句子未必真的说出口再从耳朵传入,或许只是通过某条旁路捷径被传入了受话系统。(意识活动有时确实表现为喃喃自语,在搭积木玩家家的儿童身上,常可观察的此类现象) 当受话系统收到一个语句时,除了可能产生行为效果之外,同时也会将此语句广播给所有需要接收话语信息的模块,于是,那些得以接入受话系统的语义模块,便获得了这样一种地位:它既可能通过发出一个祈使句而直接影响行为,也可能通过发出一个陈述句而影响其他语义模块从而间接影响行为。 比如模块A在监听到某个视觉信号后发出“前面有毒蛇”,模块B收到后,与自己所掌握的知识“毒蛇是危险”做运算后,发出“前面有危险”,模块C收到并运算后,发出“快逃!”;或许同时还有模块D在收到A的输出后,发出“前面有食物”,模块E收到它后发出“快去抓”;或许先前经验让C拥有更高权重而最终胜出,但也可能相反;发出的祈使句指令也可以是影响注意焦点的,比如模块F监听到“快逃”后,发出“慢!先看看身后情况”。 随着语言在人类生活中地位不断提高,这样的模块越来越多,其在行为调控中的作用也日益重要和广泛,而这些模块接入受话系统的那条捷径,成了一条大量指令经其传出的枢纽要道,就像一个麦克风,被连到了某些重要公共场所(比如某些运动中枢或内分泌腺)的大喇叭上,哪个发声源抢到麦,就有机会对行为产生重大影响。 这些模块竞相轮番占用这个麦克风,就像国会大厅里吵吵嚷嚷的议员们,各自主张着一种下一步该如何行动的理由,同时也能相互“听到”各自发出的“声音”并受其影响,当一种声音盖过其他声音时,一个决定便产生了;和国会一样,这一集体议事机制确保各方理由得到陈述和倾听,并经由明确的竞争性程序(是一种神经达尔文机制[2])而产生最终单一决定,同时却不需要任何中央控制者。 【我这里用国会议员比喻各语义模块,这种拟人化叙述容易让人误解为笛卡尔剧场里那个小人(homunculus),其实两者毫无关系,笛卡尔小人代表着意识本身,而我的每位议员只代表意识机能的某个微小组件,比意识本身简单的多,所以不会陷入“为了解释小人又要引入更多小人如此反复以至无穷”这样的困境;正如丹内特所言:只要每次分解出的小人比被分解的那个更简单更笨,小人隐喻就不是问题。[3] 比如当空空如也的冰箱激励某甲去写简历找工作这件事,若将意识视为一个整体,我们会如此叙述此事:空冰箱激发了某甲寻找食物的冲动,在考虑了获取食物的各种可能性后,他认定还是用钱买最方便,可是怎么才能弄到钱呢,考虑了各种可能性后,他认定找份工作最可行,经过这番考虑之后,他坐下来开始写简历。 可是当我们用放大镜凑近了看,将意识分解开,就会如此叙述此事:某甲头脑里的模块A被饥饿感所激活,发出“快去找点吃的”,模块B说“楼下商店里有吃的”,模块C说“那得花钱买”,模块D说“嗯不然会挨打”,模块E说“那可打不过”,模块F说“可是钱包空了”,模块G说“该去找点钱了”,模块H说“帮人干活可以拿到钱”……模块K说“赶紧写简历”——这么做的模块小人,显然不需要像人一样聪明。】 这个持续监听外来信号,调节注意力,表征注意对象,轮番激活各种干预理由,产生行为调控决策的国会,被称为“意识”,该国会的竞争性议事程序,被称为“斟酌(deliberation)”[4];当然,因为还存在影响行动的其他途径,国会决议未必是行为的最终决定,比如膝跳反射和心脏搏动是部门自主的,肠胃蠕动或血压升降也不受国会指挥,甚至像打毛衣这样的精细工作,也可时而脱离国会监控而自行持续;然而对人类来说,国会在行为调控中的地位毕竟越来越重要了。 如此喧闹吵嚷的国会,是如何让个人表现的像一个连贯协调自主的行动主体的?实际上,这一点并不总是能得到保证,当意见对立的两派相持不下,我们可能表现的像布里丹之驴[5],当两派议员各说各话各行其是,则表现为精神分裂,当某位议员阴谋篡夺麦克风而拒绝理睬其他议员的意见时,我们就变成了偏执狂或者疯子,当所有议员都无精打采昏昏欲睡(或许是因为国会休息室里的咖啡断货了)时,我们便陷入抑郁状态,丧失行动能力。 不过,这些情况毕竟是少数,国会通常运行良好,因为自然选择会自动排除激进分子和不合作主义者,确保每位新加入的议员(代表着一种新理由)都足够保守、谦逊而具有合作性;语义模块之间的合作,表现为这样一个事实:我们的语言系统能够处理陈述句之间合并、嵌套、递归、修饰、代入等语法关系,从而让模块之间可以通过复合而构成任意复杂(仅受限于大脑存储容量)的表征结构和控制逻辑。 于是又出现了一些专门处理这种语句复合关系的模块:它们不直接代表任何行动理由(就像国会里有些议员不代表任何利益集团),但他们会对其他议员发出的陈述句作出反应,尝试将它们与已掌握的知识复合而得出一些新的陈述句,这便产生了被称为推理、联想、论证或反驳之类的逻辑演算活动。 还有些议员则像理论家和预言家,它们总在尝试从众多事实中建立一般关系,即,构造各种包含了若干变元的抽象陈述句,并寻找其他陈述句代入其中,那些反复被成功代入的句子就被保留下来,这一过程反复迭代进行(即抽象陈述句又作为子句被构造进其他陈述句),于是,通过多层复合,便形成一套理论模型,被用来表征和模拟任意复杂的系统,在斟酌过程中,它们监听其他议员的意见并输出陈述句作为预测。 【当然,这样的抽象和建模活动并非从空白开始,进化已经在我们头脑中建立了许多表征世界某一方面的模型,不过这些模型都是针对特定生存任务而建立,但有些模块会从新情境中识别出与旧模型相似之处,从而将后者复制并移用于新任务,而且在经过多次复用之后,进而能从各复用版本中提取共同特征,从而产生抽象模型,这样的抽象过程可以反复迭代进行,并产生越来越一般化的模型。】 语言系统的上述特性和发展,使得意识成了一部通用语义引擎[6],它原则上是图灵完备的,因而可以用来表征任何东西,模拟任何过程,实现任何控制逻辑;在斟酌过程中,有关现实世界各方面的记忆表征被参与议事的各模块分别唤起(所谓唤起,就是被某个模块作为子句引用于其演算之中,就像某位议员援引观察事实以支持其主张),并在各模块间广播,于是便在意识中形成了一幅比孤立散布的记忆片段更为完整的世界图景。 类似的,意识的语义表征也可指向其自身:有关个体过往经历的种种记忆——被感知到的外部事件,被提出过的行动主张,被援引过的理由和事实,经历过的斟酌与权衡——,也会在意识中被反复唤起,就像国会档案中保存的调查报告、听证记录、发言稿和表决记录,可随时被任何议员查阅和援引,于是便在意识中形成了对个体经历的连贯记忆,它被称为“自我”,当这些记忆被唤起而进入新的议事过程时,便形成了所谓“自我意识”。 一旦意识本身成为表征对象(表征结果是自我),国会里那些理论家就又有新事情可做了,于是有关意识活动的抽象陈述和理论模型也被建立了起来,这个内部模型就像一个由政治学家所建立、用来演示和预测国会如何议事和决策的理论模型,被心理学家称为“心智理论(theory of mind)”。 心智模型的存在,使得意识能够对其自身的活动作出预测,于是在意识中便产生了诸如“我想要什么,我面临哪些选择,我有哪些理由倾向这个或那个选项,这些选项会给我带来什么,我要怎么做……”之类的心理活动——正是这些意识活动,构成了所谓“自由意志”的表现,只有那些拥有适当心理机能使之能够产生这些活动的个体,才被认为拥有自由意志,只有那些时常有机会产生这些活动的个体,才被认为是自由的。 【比如与自由人相比,一名囚犯更少有机会运用自由意志(即便他的这项机能是健全的),比如“今天晚饭吃什么呢?”这种念头很少在他头脑里冒出来,即便冒出来也很少有机会影响行为,因为他的晚饭是被监狱规定好的。】 由于心智模型是抽象的,可以被用来表征和模拟其他同类个体,并据此而预测其行为,于是我们便获得了移情(empathy)能力,后者大幅提升了我们的合作性与社会性(说服、许诺、引诱、欺骗、圈套、讹诈等社会技能皆以之为前提),也革命性的升级了人类语言的表达能力,反过来又升级了意识这部语义引擎的效能。[7] 【心智模型有时也会被用于表征非同类个体,甚至无生命物体,结果就是万物有灵论,不过,此类表征和模拟的有效性当然会很差(因为表征对象实际上完全是另一种东西,或者压根不存在),会得到大量不合预期的反馈,所以,即便在万物有灵论流行的年代,人们对此也不会太过当真(“当真”的意思是它在行为决定过程中的权重较高)。】 上面种种由意识表征活动而产生的理论模型,也被称为朴素科学(folk science),包括表征物理世界的朴素物理学和表征意识本身的朴素心理学,它们让人类拥有了前所未有的学习和适应能力;缺乏神经系统的简单生物,其个体是没有学习能力的,学习只发生在种群层面上:错误的教训以个体死亡或绝后的方式而被种群之基因组所“吸取”。 神经系统赋予动物个体以学习能力,因而适应性在个体生命期中也可得到提高,但神经系统较简单的低级动物,缺乏对象表征能力,无法建立在头脑(它们可能根本没有头脑)里为对象建立内部模型,其学习和适应只能以联结主义(connectionism)的方式进行,因而被丹内特称为斯金纳式造物。[8] 拥有系统化表征能力和内部模型的高级动物(被丹内特称为波普式造物)有了更好的个体适应方式:模型可以让它们对行为后果进行模拟预测,从而预先排除某些有害行为,而斯金纳造物则只能在伤害后果发生后以记取教训的方式避免错误,两者的差别相当于在一套理论范式指导下通过实验和试错学习的科学研究者,和靠随机瞎蒙乱撞而获得经验的门外汉之间的差别。 然而,缺乏语言能力的波普造物,其表征手段缺乏抽象性和可组合性,其内部模型通常是由硬连线方式在个体早期发育时按基因编码指令装配完成,此后的学习只是参数配置和优化过程,或数据采集和加工过程,就像一台固化了专用程序的特定用途计算机,不能安装新程序去处理新问题,因而其行为模式也就非常单调刻板。 人类语言的抽象能力和可组合性,将意识升级成了一台通用图灵机,它不但可以识别新的对象类型,建立新模型,还可以在每次决策时,针对当前情境进行问题表征,构造出全新的推理链条来寻求解决方案,就像一台会自动为自己编写新程序去处理新问题的超级电脑,甚至可以在观念世界中建立没有现实对应物的虚构模型,并据此而引导行动,将模型投影到现实世界,创造出像克莱因瓶、GPS、欧元系统这样的全新事物。 所谓理性,便是意识——在一台基于语义引擎的通用图灵机上运行着如上所述的议事/决策程序——的运行效能和它对个人行动的掌控强度:与所面临抉择相关的记忆是否被充分唤起,各种相关理由是否被充分表达和倾听,表征这些意见和理由的复合语句是否经受了逻辑一致性检查,是否拥有表征世界的恰当模型,上述过程能否产生对选择后果的有效预测,以及,从长期看,能否识别新对象,建立新模型,发现新理由。 【现在回头再看火苗上那只手,当它自动缩回来时,国会只是收到了报告,并未发生辩论或施加干预,所以谈不上多少理性(当然,比起肠胃蠕动还是多了些理性,后者国会连报告都没收到);但或许事后国会指示视觉系统采集了现场特征,产生了一份题为“一种新危险”的备忘录存入国会档案馆,那他就表现出了些许理性。 假如那只手没有缩回来,或许是因为痛觉系统坏了,那与理性无关;但也可能他有一个理由,比如想展示自己的坚忍,好让同席仇家看到他内心熊熊燃烧的怒火,这样算理性吗?不一定,代表这念头的议员可能在其他念头还没来得及冒出来时就抢到了麦克风,于是“烧伤会留下终身残疾,会妨碍握剑,会让我输掉明天的战斗”之类理由丧失了表达和被倾听的机会,那样的话他就会被视为鲁莽,或者,他头脑里压根没有代表这些理由的模块,或没有议员了解有关烧伤后果的知识,那他就是无知了。 但假如所有这些念头都冒出来过(所谓“冒出来”是指被某个模块发送到受话系统并被广播给其他各模块并得到这些模块的处理),而最终“忍痛示狠”的念头胜过其他念头夺得控制权,甚至他在火堆旁坐下之前早就经历了这番斟酌,甚至这一场景多年来已反复在他头脑里上演,他早已暗暗下定决心,那我们就不得不承认,他是理性的,甚至理性的有点可怕。】 当这些意识机能运行良好时,个体便真切的感受到自由意志的存在,并且被其他同样拥有自由意志的个体毫不迟疑的视为同类,因为这一其他动物身上难觅踪迹的特征实在太鲜明了,其独特性根本无法否认,尽管很少有人能用不带神秘色彩的话说清楚它到底是什么。 然而,尽管自由意志和理性非常鲜明,足以将人类与其他动物断然区分开来,但它并不是一种要么全有要么全无的特性,而是在进化过程和文化发展过程中逐渐获得的,上面所提及的各项元素依此产生并相互加强;这一发展过程至今仍在持续,实际上,就在过去几万年、几千年、几百年和几十年中,它又经历了几次重大升级。 个体头脑的容量和处理能力有限,其知识、理由和理论模型的储备也受限于个体寿命长度和经历的丰富性,假如意识这个头脑国会的档案馆所收藏的资料仅仅来自个人经历,议员们所主张的理由也仅是它们自己所熟知的那些,那这个国会的议事和决策水平就只能停留在文盲村委会的程度,理性能力也将因此而受限。 好在我们生活于群体之中,个人的知识和模型储备可以经由交流而为他人所用,也可经由教化而世代传承,轮子无须再一次次重新发明;随着社会规模扩大,分工加深,越来越多的知识以口耳相传或人工制品的方式存在于文化之中,为个体提供了延伸表征能力。 现在,外国议员时而带着令本村耆老耳目一新的新鲜理由参与国会辩论,国会档案馆则因接入文化这一云存储网盘而容量大增;这一发展在中石器时代突破临界点而引发第一波升级浪潮,被考古学家称为“认知革命”或“文化大跃进”;游戏嗜好、艺术品味和宗教情感等意识机能中的高级元素,在此期间纷纷涌现。 第二轮升级发生在文字出现之后,文字(和其他书面符号系统)极大扩展了文化传播和积累的时间与空间跨度,让文化雪球越滚越大;文字也帮助个体头脑突破其工作记忆局限,以实现更复杂的表征、计算和推理,对比心算和笔算,一则口述神话和一部长篇小说,一首民间歌曲和一部交响乐,便可看出其中差别。 文字也为此后的形式逻辑、人工语言、数学理论创造了前提,没有文字就不会有欧氏几何和牛顿力学;基于这些形式系统而发展起来的现代科学体系,再次加速了知识增长和积累;现代教育将这一急剧膨胀了的文化系统的一个子集,以及用于访问该系统的客户端应用,安装到个体头脑之中,使该客户端和整个文化成为意识机能的延伸部分,从而导致了第三轮升级。 我们生活的时代,见证着正在发生的新一轮升级,电视、通信工具、计算机、互联网、可穿戴设备、搜索引擎、社交网,正在延伸和增强着我们的感官,拓展着我们的信息来源,提升着我们的意识机能和理性能力,也丰富着我们所面对的世界,让我们见识更多新事物,认识到更多可能性,考虑更多新理由,面对更多新选项,从而更真切体会到自由的价值。 ---------------------------------------- [1] 本文余下部分是我基于丹尼尔·丹内特的意识理论而做的猜测,没有实证研究支持,不过这是迄今最能让我自己满意的设想。 [2] 有关神经达尔文机制,可参考威廉·卡尔文(William H. Calvin):《大脑如何思维》。 [3] 丹内特有关小人(homunculus)的评论,见《头脑风暴》(Brainstorms)第7章“作为哲学及作为心理学的人工智能”。 [4] 上述解读源自丹内特的“多重草稿模型(multiple drafts model)”,参见《意识的解释》。 [5] 布里丹之驴(Buridan's ass)是14世纪法国哲学家让·布里丹(Jean Buridan)提出的一个哲学论题:一头完全理性的驴,恰好处于两堆完全相同的干草正中间,将会饿死,因为它无法对究竟该走向哪堆干草作出理性决定。其实布里丹并非该论题的最早提出者,亚里斯多德在《论天》(On the Heavens)中便提出过一条狗面对两块无差别肉时的困境。 [6] 有关意识的语义引擎性质,可参考约翰·豪格兰(John Haugeland):“Semantic Engines: An Introduction to Mind Design”,收录于其《心智设计》第三章。 [7] 移情能力在语言进化中的关键作用,可参见迈克尔·托马塞洛(Michael Tomasello):《人类沟通的起源》。 [8] 关于达尔文、斯金纳、波普、格列高利四种造物的说法,源自丹内特《达尔文的危险观念》第13章第1节。
人脑是图灵完备的吗?

昨天在给《沐猿而冠》补写一个脚注时,想了一下这个问题:

1)心智健全的人很容易学会写程序;

2)一个会写程序的人,加上一个文字编辑器,构成了一个图灵完备的系统,这很明显;

3)将文字编辑器替换成纸和笔,该系统仍是图灵完备的;(当然,在没有TE/IDE/RAD的情况下,编码效率会下降,但这一差别相当于纸带图灵机和电子计算机的差别,不是逻辑上的差别)

4)再增加一些训练,让此人扔掉纸和笔,(我觉得)他大概也能在头脑中精确而(more...)

标签: | |
5546
昨天在给《沐猿而冠》补写一个脚注时,想了一下这个问题: 1)心智健全的人很容易学会写程序; 2)一个会写程序的人,加上一个文字编辑器,构成了一个图灵完备的系统,这很明显; 3)将文字编辑器替换成纸和笔,该系统仍是图灵完备的;(当然,在没有TE/IDE/RAD的情况下,编码效率会下降,但这一差别相当于纸带图灵机和电子计算机的差别,不是逻辑上的差别) 4)再增加一些训练,让此人扔掉纸和笔,(我觉得)他大概也能在头脑中精确而完整的想象写程序的过程,或者用语言将此过程陈述出来; 5)所以人脑大概也是图灵完备的。