含有〈认知〉标签的文章(17)

人工智能与心智表征

人工智能与心智表征
辉格
2022年6月19日

继续上周的话题,在上一篇里,我讨论了AI在当前发展路线上将面临的局限,那么,突破这一局限的出路在哪里呢?或者让我换一个更具操作性的问题:未来出现的何种进展,会让我赞叹“这下有戏了!”?

简单说,我期待的是这样一种进展:一个AI系统能解释自己的行动、决定或看法,或者更理想的,一个AI系统的各组成模块都能这么做,至少大部分高层认知模块都能这么做,一些基础知觉模块可能无法解释就自己的知觉过程给出解释,但其知觉结果的表征必须是一个十分有限且相当恒定的离散集,即,当它声称自己看到、听到、闻到或察觉到了什么状况时,这一状况必须以某组清晰界定的概念来表示。

设想一个自动驾驶系统,有次在路上发生了追尾,撞坏了前车,事后它的教练向它提出一连串问题,诸如:你是否认为自己犯了个错误?说说当时发生了什么?你当时是怎么想的?为什么没有及时踩刹车?你考虑了哪些因素后做出的这个决定?在你看来,是否你的某种知觉能力(more...)

标签: | | | | |
9003
人工智能与心智表征 辉格 2022年6月19日 继续上周的话题,在上一篇里,我讨论了AI在当前发展路线上将面临的局限,那么,突破这一局限的出路在哪里呢?或者让我换一个更具操作性的问题:未来出现的何种进展,会让我赞叹“这下有戏了!”? 简单说,我期待的是这样一种进展:一个AI系统能解释自己的行动、决定或看法,或者更理想的,一个AI系统的各组成模块都能这么做,至少大部分高层认知模块都能这么做,一些基础知觉模块可能无法解释就自己的知觉过程给出解释,但其知觉结果的表征必须是一个十分有限且相当恒定的离散集,即,当它声称自己看到、听到、闻到或察觉到了什么状况时,这一状况必须以某组清晰界定的概念来表示。 设想一个自动驾驶系统,有次在路上发生了追尾,撞坏了前车,事后它的教练向它提出一连串问题,诸如:你是否认为自己犯了个错误?说说当时发生了什么?你当时是怎么想的?为什么没有及时踩刹车?你考虑了哪些因素后做出的这个决定?在你看来,是否你的某种知觉能力,或知识储备,或决策系统中,存在某种缺陷或不足,导致你未能做出最佳选择?你从这个事故中学到了什么?或准备去学点什么?…… 假如这个系统能对诸如此类的问题给出有意义的响应,让这样的问答对话能够继续下去,那我便可以说,其设计者的路子走对了,前途大有可观。 目前的AI系统离这还很遥远,而且很难说已经朝这方向发展了,有些系统能把英语说的很溜,但无法深入到实质性问题,它会跟你绕圈子,说一大堆似乎跟交谈主题有关的话,却从来没有表现出自己对主题有真正的理解和看法。 达到我的要求很不容易,系统不仅需要一个心智,这个心智还要能对自身状态进行表征,才可能对外界表述出来。 囫囵系统注定做不到这一点,因为其囫囵性质,其内部状态是无从表征的,对上面那些问题,它能给出的回答只能像这样:我当时的决定是基于对当时当地综合状况的一种整体直觉而做出,我无法将这一整体直觉分解为若干分立的理由或考虑,因为我生来就不是这么认识世界和考虑问题的。 就是说,一个囫囵系统就自己行动/决策所能给出的唯一解释就是它的gut,此时此地,此情此景之下,gut告诉它,这是最好的决定,如果事后证明这显然不是最佳决定,那会如何呢?那只是个负面反馈,一个负面反馈会让系统做出调整,但具体如何调整,是难以言表的,这一难以言表性是系统的囫囵性质决定了的。 那么,将心智状态和心智过程表征出来有什么好处呢? 有很多好处,让我一个个说。 首先,心智表征能让心智之间展开更有意义的合作。设想一个董事会,正在开会以便就是否投资某个项目做出决定,如果这些董事都是囫囵系统,他们在会上能说些什么呢?他们可能各自给出投资意见:我是否赞成这项投资,我的预期回报有多大,或许还能对此给出一条置信曲线:90%置信度收益率上下限多少,70%置信度收益率上下限多少,完全失败的风险多大,诸如此类,但他们无法解释自己是怎么得出这些数字的。 假如各董事意见不一,怎么办呢?唯一能做的,就是投票决定,当然,更精细一点,每位董事可以依其经验值而被赋予不同投票权重,但囫囵系统之间的合作关系到此为止,他们无法展开讨论,无法倾听、检查和推敲各自的陈述与理由,因而也无法相互补充事实或理由,相互说服,相互启发,更一般的说,他们无法将他人的陈述和意见作为输入,用来重新运行自己的心智过程,从而指望得出更好的意见输出,因为他们的唯一理由就是gut,而gut之间是无法对话的。 一群具有心智表征能力的董事就不同了,一位董事可能对项目做一番介绍,其他董事可能要求他就他所列举的一项事实陈述做出澄清,或提出与之冲突的证据(不一致的知觉结果),他们还可以解释自己计算预期收益的方法和过程,他人也可对这些算法和模型提出质疑,比如指出应该考虑另一项输入,或指出另一个模型在此类评估上表现更好,或指出他在从事实认知到结论之间的论证链条上存在逻辑跳跃或缺陷。 所有这些,都需要他们拥有大致兼容的概念框架,对话才能进行,当然,概念框架未必完全一致,比如董事甲可能发现董事乙不理解自己所使用的某个概念(A),但基于过去的对话经历,甲知道乙理解另一个概念(X),此时甲可能会用类比的方法解释到:A与B在结构S中的关系,就像X与Y在结构T中的关系,而乙听到这个解释后,立即重新运行自己的相关认知过程,重新运行的结果可能对这一类比并不买账,但也可能得出了某些新颖的东西——我们把这称为“启发”。 其次,心智表征也会促成专业分工,设想这群董事经过一番讨论后,赞成投资的一派仍未赢得足够票数,几位董事都表达了对某一特定风险的担忧,比如,未来几年内若核聚变技术取得大突破,赞成派预期中的收益将无法实现,赞成派在知晓他们的反对理由后,可能说:既然你们担忧的是这一点,那好,不如我们听听这方面专家的意见,看看这事情发生的机会有多大。 这些董事的心智中可能都有一个风险评估模块,也有一个技术进展跟踪模块,还有一些相似的知识储备,对核聚变技术的发展状况多少有所知觉,可是,他们的每个模块的构造质量和性能表现可能大不相同,知识储备的覆盖面也不同,各自有所短长,另外,除了他们自己,还有其他可与之交流的心智系统存在着,而且,基于以往的表现,以及对这些表现的共同了解,对于各心智系统的短长所在,大家多少有着一些共识,所以,当赞成派提出,让我们听听那位专家(他可能是董事之一,也可能是位请来的客人)怎么说,大家至少是愿意听一听的——如果他们是真诚参与讨论的话——,而他们听到的内容,将作为新输入,触发相关风险评估模块的重新运行,并且可能得出与之前有所不同的输出。 注意,这样的过程得以发生,有几个重要前提:反对者的提出的反对理由不是囫囵的(我就是反对这项投资,没啥道理可讲),而是有细节的(我担心这项特定风险),而且这些细节是基于共同概念框架来表达的:我担忧的是一种“风险”,它与“核聚变技术”有关;而且这一反对理由背后有着一种因果关系预设:“核聚变技术”的“重大突破”将使得“目标项目”丧失其“技术优势”——这一预设同样是可以接受检查和挑战的。 如果一项理由未能经过如此概念化的表达,它是无法被检查、推敲和挑战的,它要么被全盘接受,要么被全盘抛弃,而无法被讨论,它不能被分解成若干逻辑成分,否定其中之一而保留其余,或将某一成分从一个特定值替换为一个函数,并将该值的计算委托给某个外部模块或系统,从而实现分工。 这样的分工与委托要得以实现,需要心智系统能够就问题的其余部分预先达成一致,从而隔离出分歧点,当董事们决定将某一特定风险的评估任务委托给专家时,他们已经就一些前提达成共识:目标项目的核心优势是一种低成本发电技术,因而与其他发电技术构成竞争关系,所以其他某种发电技术的突破是一种潜在风险,核聚变是一种可能的发电技术——要对问题的局部达成这样的共识,同样需要基于概念框架的逻辑分解,囫囵系统是做不到的。 再比如,当董事们决定将某项收益精算任务委托给某位财务专家时,他们必定已经就某些事实的认定(或其认定机制)达成了起码的共识,否则委托将无法进行,当财务专家看到几套相互矛盾的数据时,采用哪一套?如果他自行决定,那就相当于把整个项目评估任务委托给了他,而不是将分解出的一项子任务委托给了他,这种分解,同样基于共同概念框架,也就是我说的语义界面。 第三,心智表征也是相互补充与启发的前提,一个心智系统可能因为缺乏某方面输入而欠缺对某些事物的知觉能力,而来自其他心智的输入可以(1)提起他对某些他之前忽略的事情的兴趣,去获取更多输入,2)即便没有更多额外的实景输入,也可能促发他在既有数据基础上,从新的角度进行概念再识别,即在一些新线索提示下重新运行实体/特征识别程序,结果可能会获得一些新“洞见”,3)如果来源心智足够可信(可信度可经由以往交往经历和公共声誉而得到评估),他甚至可能直接接受一些输入概念或知识,4)这种外来知识不仅包括事实陈述,也可以是拇指法则(如果出现这种情况,就最好不要那么做),或推理/算法模块(如果他戴且仅戴着一只耳环,不妨找找他是同性恋的其他线索,或,看到一个球状物体时,可以这么估算它的体积),很明显,这种受补充与启发的能力,同样是以语义界面的存在为前提的,系统内部必须已经充分清晰的分解为众多独立模块,相互间通过语义界面分隔与交互,否则,此类输入信息将如何被使用,将是毫无头绪的,因为它们不是有关世界的一阶实景数据,脱离语义界面,你不知道如何让它们与心智既已拥有的知识发生关系。 正是心智表征和语义界面所创造的这些全新可能性,让人类心智表现的如此杰出,个体间的认知分工与合作,让认知能力的扩展和知识储备的积累超越了个体寿命与观察机会的局限,以及单一大脑算力与存储量的局限。 而且分工与合作不仅发生在个体之间,也发生在个体心智内部的各模块之间;所谓意识,就是经由全脑激活而出现的各模块间活跃互动状态,所谓斟酌,就是各模块争相轮番表达看法,陈述理由,主张行动方案的过程;这些模块间互动赖以展开的语义界面,和个体间的语义界面(自然语言),在相当大程度上是对应乃至重合的(虽然不必完全一致,一些在模块间起作用的内隐概念,或许从未在自然语言中得到对应表达)。 必须承认,人类在这方面的表现并不完美,许多所谓的讨论其实是假讨论,参与者其实早就拿定了主意,并不准备认真倾听他人意见,接受任何说服,他们只是假装如此,或许那会起一种安抚作用,而且人们在表达看法时也并不总是有效,事实陈述,立场表达,意愿或愿景的表达,推理过程的解释,常以凌乱模糊的方式交杂在一起,缺乏清晰的分解。 许多认知活动在头脑里或许是诸多模块分工的,但进入口语后其来源边界却模糊了,还有数量关系,我们头脑中或许有一部不错的贝叶斯推断机,以精细的量化指标处理着各种事态的或然性(证据之一是我们的刻板印象往往相当准确有效,而且其实并不那么刻板,会随新输入而调整),可是,在内省以及口语表征中,这些数量特性或许全都丢失了,就是说,有些模块缺乏清晰可用的语义界面,它们是黑箱,无论对于意识的内省机制还是人际交流机制,其内部逻辑都是不可见的。 与此同时,语义界面并非人际互动的唯一界面,我们至少还有一个情绪界面,建议和说服并非影响他人行动的仅有手段,感染与恐吓也是,在董事会上,你可以通过播放一段音乐或展示一些视觉素材来影响其他董事的决定,或在恰当时机给他们喂高糖食物,或通过布置、衣饰或身体姿态来营造某种气氛,诸如此类,在许多情况下,情绪界面或许比语义界面更重要。 但无论如何,至少在某些条件下,在某些事情中,语义界面所创造的潜力得到了很好的开发,否则就不会有文明了;众多学科和工程技术领域所积累起的庞大而精致的知识体系,都是此类开发的成果;所以我相信,AI系统若不具备同样能力,将无法取得智人已经取得的这种成就。 另外,同样诱人的是,心智表征将为解决AI终将面临的伦理困境指明方向;囫囵系统或逻辑黑箱是“不可理喻”的,其行动逻辑无法被检查和验证,因而无从知晓其行为是否会符合某种道德规范,它们也无法被劝诫、警告和说服,无法向他解释,为何这么做是错的,违反了哪条道德准则,因为它们不支持语义界面,你也没有任何手段告诉它:因为国会通过了某个法案,所以从今天起,你不能再以某种方式行事了,或你的行动必须遵守某种新规则了,或许你可以设计某种新的训练环境来改变其行为方式,但你没法直接告诉它不能怎么做,而且训练结果的可靠性也是无从事先(通过检查其内部状态而)验证的,只能在事后才知道,这个事后可能是很久以后。 有了心智表征,这些都变得可能了,通过本文开头所演示的那种对话(第三节),我们有机会了解其心智状况,观察世界和思考问题的方式,理解能力,行动策略,价值取向,都将通过对话展示出来。 有了这个前提,我们才可能判断能否将某类任务交给它,是否赋予他某些自由与责任,是否将其接受为一个合格的独立行动主体,成为一位平等的社会参与者,一位公民。 【2023-03-16】 @我宣布个事_我是个伞兵_没毛病嗷:辉总认为今天的AI是否符合之前说过的分层次,语义化的设计? @whigzhou: 不知道,我最近没关注太多,不过从它表现出的能力看,我有点怀疑它已经朝这方向走出了几小步 @whigzhou: 我仍然相信,若不朝这方向走,有些关键门槛是越不过的
松耦合,语义界面,及人工智能

【托女王老太太福,得了个长周末,闲着没事,在写个帖子,本来只想随便聊几句的,没想到,一不小心,眼看着就要写成(我想最好还是谦虚点)近十年来人工智能主题上最重要的哲学论文了,希望今天能完成】

松耦合,语义界面,及人工智能
辉格
2022年6月13日

上周我就AI的当前状况做了点小思考,昨天又花了不少时间想这事情,发现许多曾经想过的点好像都串起来了,值得写一写。

让我绕远一点,从传统软件开发说起。

在遗留系统上工作过的人可能都有体会,当一个系统变得日益庞大复杂时,它会慢慢的绞成一团乱麻,添加新特性,修改旧特性,都变得越来越难以下手,因为很多地方都是牵一发而动全身,你改了这里,不知道哪里会冒出一堆bug。

因为意识到处处是地雷,新来的程序员轻易不敢动旧代码,每当要进行一项改动时,只敢小心翼翼的找到一处他认为最适宜的切入点,从那里开始插入他的新代码,结果就像在一个庞大身躯上又安装了一条新假肢,久而久之,这副躯体就变成了一头全身长满假肢的怪物,每条假肢上又接出若干条假肢,许多遥远假肢之间还常常连着一些电线,这些电线自然也是绞成一团……

这是一种非常自然的倾向,只要没有系统性的手段加以阻止,持续强力一种贯彻某种结构方案和设计原则,就必定会发生。

广而言之,任何紧耦合系统都是如此,这也是为何软件工程界如此强调松耦合,每个谈论这一话题的人都是三句不离解耦。

一个典型的紧耦合系统是生物的基因组,每个变异常会影响数千个性状,每个性状常受数千个基因的影响,真真是牵一发而动全身,也正因此,行为遗传学研究才如此困难,像亨廷顿舞蹈症这种单点突变性状太少了,不足以为该学科持续赢得声誉,大众更关心的那些性状,往往涉及上千基因,其中每个的贡献率都很低,需要使用高端统计工具才能从海量样本数据中捞出一点点线索,能捞出的往往也只是贡献率排名靠前的那几个(more...)

标签: | | | | | | | |
9001
【托女王老太太福,得了个长周末,闲着没事,在写个帖子,本来只想随便聊几句的,没想到,一不小心,眼看着就要写成(我想最好还是谦虚点)近十年来人工智能主题上最重要的哲学论文了,希望今天能完成】 松耦合,语义界面,及人工智能 辉格 2022年6月13日 上周我就AI的当前状况做了点小思考,昨天又花了不少时间想这事情,发现许多曾经想过的点好像都串起来了,值得写一写。 让我绕远一点,从传统软件开发说起。 在遗留系统上工作过的人可能都有体会,当一个系统变得日益庞大复杂时,它会慢慢的绞成一团乱麻,添加新特性,修改旧特性,都变得越来越难以下手,因为很多地方都是牵一发而动全身,你改了这里,不知道哪里会冒出一堆bug。 因为意识到处处是地雷,新来的程序员轻易不敢动旧代码,每当要进行一项改动时,只敢小心翼翼的找到一处他认为最适宜的切入点,从那里开始插入他的新代码,结果就像在一个庞大身躯上又安装了一条新假肢,久而久之,这副躯体就变成了一头全身长满假肢的怪物,每条假肢上又接出若干条假肢,许多遥远假肢之间还常常连着一些电线,这些电线自然也是绞成一团…… 这是一种非常自然的倾向,只要没有系统性的手段加以阻止,持续强力一种贯彻某种结构方案和设计原则,就必定会发生。 广而言之,任何紧耦合系统都是如此,这也是为何软件工程界如此强调松耦合,每个谈论这一话题的人都是三句不离解耦。 一个典型的紧耦合系统是生物的基因组,每个变异常会影响数千个性状,每个性状常受数千个基因的影响,真真是牵一发而动全身,也正因此,行为遗传学研究才如此困难,像亨廷顿舞蹈症这种单点突变性状太少了,不足以为该学科持续赢得声誉,大众更关心的那些性状,往往涉及上千基因,其中每个的贡献率都很低,需要使用高端统计工具才能从海量样本数据中捞出一点点线索,能捞出的往往也只是贡献率排名靠前的那几个因子。(参考Robert Plomin - Blueprint: How DNA Makes Us Who We Are) 基因组可能是迄今我们发现的耦合最紧的一套信息系统,绞的最乱的一团乱麻,原因当然是,它是盲眼钟表匠的作品,没有一位设计师来执行一套设计方案,贯彻一组设计原则,每项改动都是(掷飞镖+自然选择)的结果,毫无设计原则可言,而且它又那么古老,数十亿年来积累了无数补丁,不夸张的说,它就是一大包补丁组成的。 从任一时刻看,一套软件的开发似乎通常都有一位设计师在贯彻某种方案或原则,可是从长期看,设计师/程序员来来去去,换了一波又一波,其中大部分是庸人或懒人,不庸不懒的那些,也常常为了赶进度而将设计原则抛诸脑后,结果,在宏观效果上,其中每位的每项行动,最终也都不过是一支随机飞镖,测试、QA和客户则构成了他们的自然选择环境,最终系统还是会被绞乱,沦为一团乱麻。 依我看,任何紧耦合系统最终都会遭遇某种极限,在某个临界点之后,让系统在功能上变得更丰富更强大的任何努力都将是得不偿失的,系统仍然可能继续进化,但此后的进化会以一种(姑可称为)生态位漂移的方式进行,即,系统可能增加某些新特性,增强某些旧特性,但为此不得不牺牲另一些特性,在某处进行改进的同时,容忍另一些地方冒出一些难以修复的bug(因为其乱麻性质,避免或修复这些被新改动牵出的新问题成本太高了),有时候这些地方反正已经很少被用到了,所以也没人介意,久而久之,系统抛弃了某些特性,发展了另一些特性,从而适应了新的生态位。(可以想象,在很长时间内,那些被抛弃的特性的遗骸会像一条条阑尾那样继续挂在这副丑陋的庞大躯体上) 我想把紧耦合系统面临的这种发展极限称为科斯临界点,在他那篇经典论文《厂商的性质》中,科斯指出,企业与市场的边界所在,取决于组织成本与交易成本之间的权衡,企业将一些原本通过市场交易分工协调起来的生产活动纳入企业内部集中管理,避免了一些交易成本,同时带来了组织成本。 不妨(过度简化的)将企业视为紧耦合系统,市场则是松耦合系统,当你将越来越多活动纳入企业内,到某个临界点,新增组织成本将超出新减交易成本,此时继续扩大企业将是得不偿失的,这是因为(如上述),当企业这种紧耦合系统庞大且古老到一定程度,将不可避免的变成一团乱麻,任何功能新增都会变得非常困难而昂贵,这也是为何我们总是需要市场(的理由之一),我在《群居的艺术》里专门用一章(秩序的解耦#7:创造复杂性的新途径)讨论了这个问题。 (枝节:这里的企业=紧耦合/市场=松耦合的二分当然是过度简化的,实际上耦合度是一个连续谱,财务上独立的企业之间的耦合度未必很低,有些承包商与其顾客之间的耦合度和企业部门间相差无几,这也是产业聚集效应的根源所在,而同时员工与企业的耦合度也可以很低(温州有些企业里每台机床都有独立电表),张五常的论文《厂商的合约性质》是理解这一连续谱的好起点。) 用系统论术语说,从孤立生产者到市场分工合作体系的发展,是一种元系统跃迁(metasystem transition),而元系统跃迁是突破紧耦合系统发展极限的一条常见途径:当丰富壮大一个紧耦合系统的努力变得日益得不偿失时,出路不是继续改进既有系统,而是另起一个层次,将既有系统纳入一个多系统共生合作体系中,从而创造出一个具有更多层次的系统,而在该体系中,各成员系统之间是松耦合的(或者更准确的说,它们之间的耦合是足够松的)。 那么,在元系统跃迁过程中究竟发生了什么,是什么条件的存在或出现,让各成员系统之间能在松耦合条件下建立合作共生关系的? 如果你也是程序员,头脑里大概会很快冒出一个答案:关键条件是某种接口或曰界面(interface)的出现,界面的存在使得各成员之间能够发生交流和交易,同时又不必过度相互依赖与纠缠,在相当程度上能够继续各自发展自己的特性与功能,往往还能保持可替换性,即,一个成员常可以将某方面的既有合作者替换成另一个合作者,只要后者能对同一合作界面做出符合预期的响应,比如将电力供应商从一家更换成另一家,只要后者支持同样的接口标准(电压、频率、接线规范等)。 软件工程中,对付那些已经达到科斯临界点却又不愿丢弃的遗留系统时,一个常见办法就是为它创造出一套界面来,比如让它将某些数据输出到指定格式的文件中,或写入某个外部数据库里,或反过来,让它从此类来源读入数据,或将其中仍有价值的代码重新包装成支持新接口的库,或让它接受某种脚本命令并做出相应动作,甚至,可能的话,将整个系统包装成一个能对给定请求做出响应的服务,诸如此类,都是在创造界面,让它能与新体系中的其他成员展开合作,同时不必过度触碰既有代码。 其他领域的元系统跃迁也必定涉及界面的创造(或适当界面恰好已经存在),比如在真核革命中,新创生的真核细胞体系中,被捕获而最终成为线粒体的细胞与其他细胞内共生体的交互界面就是ATP,这是线粒体作为细胞电池为其他细胞活动提供能量的标准界面,所有从线粒体输出的能量都以ATP形式存在,而细胞内的所有能量用户都知道怎么利用ATP;类似的,当蚂蚁蜜蜂等昆虫发展出真社会巢群时,它们的交互界面是一组外激素信号。 那么,这一切和AI有什么关系呢?不急,我很快就会说到。 现在让我们来看神经系统。初级神经元网络是基因组之外的又一个紧耦合系统,一团乱的不能再乱的乱麻;你可以训练一个神经元网络学会某种技能,但你无法解释训练得到的结果,如果有人问你它是怎么成功执行某项功能的,你唯一能做的是把整个网络中的突触连接(及其强度)描绘一遍——它们是如此这般连接的,所以它做到了——这根本不是解释,一个解释的信息量必须小于它所解释的东西的信息量,否则就只是描绘。 这一乱麻特性使得你无法直接改动一个神经元网络令其符合你的某种意图,要让它表现的有所不同,你只能给它设定新的训练环境,施加不同的激励反馈,给它喂不同的数据,希望它能学出点新模样,但你不能直接干预训练结果,因为这些结果是难以名状的、无从理解的,你无法预料一处改动会导致何种行为改变,这一不可能性比改动乱麻遗留系统的不可能性要高出一万倍。 所以不难理解,这种神经元系统发展到一定程度,也会(和其他紧耦合系统一样)碰到科斯临界点,而突破这一局限的出路同样是创造出交互界面,虽然具体实现方式和其他领域十分不同。 高级动物的神经系统朝分层和模块化的方向发展,在一些高度专业化的皮层内,神经元被清晰严整的分入一个个层次,每个神经元的输入与输出范围都严格受限,而且扇入/扇出系数往往很小,通常都只接受来自前一层上紧邻少数几个神经元的输入,其输出也只投射到下一层的少数几个紧邻神经元。 比如在阅读过程中,从最简单的线条形状识别,到最终的字符和词汇识别,经历几个层次,其中每个神经元都只专注于一种形状,或一种线条组合,或一个独特字符,这些神经元的输出不会被随便越过几个层次或越出模块投射到其他遥远脑区,它们输出的信息在被其他脑区利用之前,通常要经过前额叶皮层中某些高级认知模块的中介,到达那里的信息已经是经过好几层加工的抽象表征,诸如“那里有朵红色的花”之类(参考:Stanislas Dehaene《脑的阅读》)。 (枝节:这种输入输出限制当然不是密不透风的,一个重要的例外是,知觉皮层的神经元会接受来自其服务对象前额叶的输入,这是一种非常关键的反馈机制,是高级认知中枢在告诉初级知觉皮层:你送来的信息是否足够有趣,就好比国家情报总监(DNI)在告诉其下属情报机构,对他们传来的某条情报有多感兴趣,这一反馈继而将影响后者的后续情报采集取向,比如,上级若对某类信息表现出高度兴趣,采集者可能会降低识别此类情形的阈值,导致更多假阳性,而在错失成本远高于误认成本的情况下,这可能是值得的。) 限制神经元投射范围,并且在进一步向其他脑区投射之前,把初级信号变成符号化的抽象表征,这一步极为关键,其实就是一种界面化,而这是大脑模块化,且模块之间实现松耦合的基础,来自各大感官的知觉系统与其他系统的交互只需通过高层符号界面进行,整个系统就不会纠缠为一团乱麻(虽然单一模块内仍然可以是一团乱麻)。 人类在认知系统界面化的方向上又跨出了一大步,人类不仅能产生符号化的知觉表征,还能对知觉行为本身进行表征,我不仅能认出一只兔子(一阶知觉),还会说(或在头脑中默想):“我看到了一只兔子”(二阶知觉),还会对自己的知觉结果提出疑问:“我好像看到了一只兔子,我会不会看错了?”——这是三阶知觉,因为我首先需要对我的二阶知觉本身形成知觉——“我觉得“我看到了一只兔子”,我的这一知觉是否正确?”,而这一二阶知觉的正确性又取决于一阶知觉“那里有一只兔子”的正确性)。 我还能对他人说出我的一阶知觉:“这是一只兔子”,从而在听者的头脑中产生二阶知觉“他看到了一只兔子”,对方可能会(如果他足够信任我)也可能不会(如果他不够信任我)将这一二阶认知转换为自己的一阶认知“那里有只兔子”。 二阶知觉能力让我们能够产生一种非常新颖高级的意识活动,动物或许也有意识(取决于定义),但它们显然没有我们这么高级的意识活动,比如斟酌与反思:“我上次在这个地方也见过一团白色东西跑过,当时我以为那是只兔子,后来的事情证明我弄错了,所以这次我得看仔细点,别再弄错了”,或“那好像只兔子,可是且慢,为何它的眼睛不是红色的?咦,它怎么发出了这种叫声?我可从来没听到兔子会叫”…… 据Stanislas Dehaene的理论(见《脑与意识》),意识是一种由前额叶皮层激发的全脑激活状态,前额叶就像DNI,当它从各知觉系统收到某些类型的情报时,会将其向全脑广播,在数百毫秒中、在分布广泛的众多脑区触发一波高度活跃的神经活动,假如Dehaene是对的,那么丹内特的多重草稿模型中的每个意识瞬间,就是来自不同知觉模块的多重草稿中成功抢到麦克风的那个,经由全脑广播而触发的一轮脑活动,这些意识瞬间继而在记忆中被组织为一套连贯的自我中心叙事,后者构成了我们对世界的体验。 就本文主题而言,重要的是,这种二阶知觉表征是符号化的,或者说是语义化的,经过了好几层抽象,早已远离了各知觉模块的初级表征,比如,当我们阅读时,经由前额叶向全脑广播的信息中,不会包括那些有关笔画线条的表征信息,甚至不会是字符表征,而是一些词汇/短语或(可能更经常的)是与这些词汇/短语有关的概念表征(除非某一时刻前额叶不知何故突然将关注点转向笔画线条本身,这种关注转向当然也是由来自其他模块的某种信号所触发)。 这就意味着,各种高级意识活动之间的互动,是通过一种语义界面进行的,因而也是松耦合的,它们之间的互动关系既有合作,也有竞争(抢麦),这一情形很像国会中发生在议员之间的事情,他们或各自表达自己的看法,提出各自主张和立场,或针对其他议员的观点提出正面或反面的证据,或支持或反对的理由,他们相互争辩或支持,站队和拉帮结派……,最终,某种决议会从中产生,它就像动作信号输出到运动或内分泌中枢,变成行动。(我在《沐猿而冠》附录〈何为理性动物〉中详细展开了这个国会隐喻) 语义界面的存在使得高级意识功能在松耦合前提下实现模块化,其后果是,我们的各种认知技能与知识构件可以各自独立发展,并通过语义界面相互合作,如此一来,我们的理性能力和知识体系便有了一个极为广阔的积累性发展空间。 让我解释一下这是什么意思。 所谓理性,并不是一个单一算法,而是由众多独立平行构件(算法)组成,比如,我们或许有一个类似三段论推理机的模块,或许有一部贝叶斯推断机,或有一个数数模块,一个四则运算模块,还有许多危险探测装置(恐高,幽闭恐惧,密集恐惧,蛇形恐惧,是最基础的几种),以及机会探测装置(有人看见美女就两眼放光,有人则对赚钱机会有着敏锐嗅觉),这些探测装置并不试图对观察对象整体建模,而只对某些特征线索敏感,但它们都是我们理性的组成部分,这些模块既相互竞争,也会相互合作与强化。 设想我们的头脑就是一部正在被生活经历所训练的人工智能系统,它不是作为一个整体而囫囵学习的,各模块、各组件有着自己独立的学习进程,每个只专注输入信息中某个特定侧面或某些特征线索,每个也有着自己不同的模型骨架(比如这是部贝叶斯推断机,那是个加法装置,还有个是逻辑矛盾探测器……)。 这种模块专业化使得系统具有一种内在保守性,不会随训练数据的变化而过度摆动,因为每个模块的输入输出和反馈回路都被其“专业兴趣”局限住了,会自动忽略训练数据中的其他方面;这一点背后的原理是世界之可理解性假设:世界的某些局部与侧面一定比其整体更稳定、更一致、更少变,否则世界便是不可理解的;经验也告诉我们,专家与非专家的一个区别就是,前者的观点更少随近期事态变动而摇摆。 举个例子,虽然我不懂围棋,但我相信,假如我们修改围棋规则,把棋盘从19x19换成21x21,顶尖棋手们的专业经验可能很大部分报废了,但也会有很多仍然有用,可是对于一个只会囫囵学习的智能系统,其经验将完全报废,一切必须从头开始。 模块的内在保守性是可积累发展的前提,每个模块保持大致稳定,各自随训练继续而精炼(即框架稳定的同时在边际上改进),同时系统时不时添加一些新模块,令其认知能力随可用模块增长而不断升级增强,变得越来越全面、老练和精到。 再举个例子,某人若是对赚钱机会有着敏锐嗅觉,他有潜力成为一位好投资者,可是如果他懂一点基础会计知识,会一点财务精算,那就有望成为更好的投资者,如果他还受过一些风险控制训练,那就更好了,重要的是,机会嗅探,财务精算,风险控制,这三个模块最好是独立存在,这样的好处是:1)它们本身会更稳定持久,持续精炼,2)它们可以被分别传授和训练,因而在缺乏实景训练数据时也可能习得,3)它们可以实现跨系统分工与合作,比如人际分工。 让我一点点说。 假如风控模块不是独立的,而是以无从辨认的形态分散于系统各处,和其他东西纠缠在一起,它就无法稳定,在繁荣期的训练数据影响下,风控标准会迅速降低,因为更有纪律的风控倾向得不到多少正面反馈,反之,在萧条期,系统的风控倾向又会摆向另一个极端,这种大幅摇摆使得它无法实现可持续积累和精炼(现实中很多投资者头脑中的风控模块正是如此)。 (为了说明模块独立性为何会带来稳定持久性,我想再多说几句,一个输入输出和反馈回路被充分局限住的模块,常常能达到一种近乎于(但不完全是)自我激励的状态,它能为自己找事做,并从结果中得到满足,因而总是自得其乐的沉醉于其中,比如男人头脑里有一个腰臀曲线探测器,从实用功能上说,这是用来探测生育期女人的裸露躯体的,这个探测器可以在输入极为有限的情况下持续自我训练和激励并乐在其中,这也是某些色情图片如此有吸引力的缘故所在,尽管在现代传播条件下该模块的这种表现其实根本得不到任何现实回报,如果系统是囫囵学习的,没有模块独立性,当代男人对色情图片的兴趣早就丧失殆尽了,所以,如果你希望系统里有一个忠实勤勉持久敏锐的风控模块,它最好像男人的腰臀曲线探测器那么自主存在和自我激励,每一次都会为自己能察觉任何风险线索而兴奋不已。) 假如风控模块不是独立的,或者不是通过语义界面与其他模块交互的,它也无法在系统间被传授,传授的好处是可以免去实景训练的高昂成本,哪怕效果差一些(因为当经验通过语义界面传输时,难免会丢失一些信息,所谓默会知识,就是那些无法穿透语义界面的知识),往往也是值得的,如果你读几本书或听一席话就能学到一些基本的风险识别技能,哪怕只是一点点,得失比也比在市场浪涛中亲身获取这些教训高多了。 假如风控模块不是独立的,或者不是通过语义界面与其他模块交互的,它也无法在系统间实现分工合作,一位投资者就无法将风控事务委托给他人完成,与此类似的任何松耦合分工合作都不可能发生,虽然仍会有一些其他形式的合作,比如对默会知识的手把手传授,但这种合作注定只能以极小的规模发生,因为它是紧耦合的。 人类认知系统跨出的一大步,就是将语义界面向外开放了,并且通过人际协调博弈而形成共同接受的语义界面;自然语言的出现,使得语义界面不仅是系统内各模块间交互的界面,还成了系统间交互的界面,正是这一步促成了人类认知与知识系统的另一次元系统跃迁,它创造了大规模分工合作体系,大型复杂社会,以及文明。 依我的有限了解,当前深度学习派人工智能所走的路线,看起来和语义界面路线是背道而驰的,深度神经元网络(DNN)虽然是分层的,但每个层次的输出到底是什么,是说不清楚的,或者说,是没有语义化的,也正因此,这种系统的学习结果是无法被检查、解释和改动的,整个一黑箱,你没办法把它打开,看看其中那条逻辑不对劲,能不能改一改,不可能,天地一笼统。 (再多解释几句,语义化的意思是,至少在模块或层次间交互的那些地方,每个神经元的特定输入输出值,必须有稳定持久的含义,唯如此,其他模块/层次才能持久的知道该如何与它互动,如何利用它输出的值,在想给它施加某种影响或希望从它那里引出某种结果时,该如何给它喂输入值,这些不能说不清楚,哪怕你凭空发明一个概念也好,那也算说清楚了(正如许多知识领域在发展过程中都会发明新概念),因为凭空发明的新概念只有在初次使用时才是不清楚的,随着它被反复使用,意思就清楚起来了——输出者在什么情况下会输出它,输入者在输入它后会做点什么——此后,只要交互各方保持对该语义约定的大致遵守,语义便稳定了下来。) 而且,好像也没有什么机制让DNN能够自发形成自主独立持久的模块(这一点和上一点其实互为因果),它比完全不分层的囫囵联结主义当然好多了,但也只好那么多,所以我的感觉是,尽管它在一些领域取得了耀眼突破,但很快会碰上极限。 话说回来,语义界面也不是没有代价,界面就是一种契约,语义界面是基于一套概念框架的一组契约,不仅契约本身是一种束缚,概念框架在帮助我们认识世界的同时,也约束了我们的认知可能性,不妨称之为范式锁入,虽然一个足够灵活开放的系统会不时引入新概念和新模块(在很多情况下这是通过类比/隐喻从旧概念中衍生出来的),但至少在特定时期内,特定任务域中,这种约束会妨碍我们的认知潜力,让我们难以跳出框架思考。 所以,在某些情况下,不受概念框架约束的囫囵学习可能是有用的,它能帮助我们发现一些在现有概念框架中难以言喻名状的情况,或许是某种风险,或者某种机会,或某种门道机巧,说不清楚它是什么,但它确实在那里,或确实管用;然后,这种发现如果被证明足够有价值,可能继而在采用语义界面的系统中促发一轮观念更新运动,一套新的概念框架被创造出来,就像库恩式科学革命中的情形。 总之,深度学习派确实取得了不小成就,其应用潜力或许也不小,但无论如何,沿这条道路大概走不到类人智能的程度。 【2022-06-13】 @Hyde1998:那么有没有可能让现有的AI遵循人脑的交流方式,就是把不同针对性的,不同功能的模块封装到一起来实现类人智能?每个模块只针对特定训练敏感 @whigzhou: 我看到的一条出路是,要求AI系统将其获得的每项认知技能,以及基于此的行动策略,解释给人听,以人类可理解的形式表达出来 做到这一点的,才将其投入某些应用领域,比如将其作为合格成员纳入某个分工合作体系,做不到的,只能限于特定应用 在更远的未来,该条件可放松为:要求将其自身的概念体系、知识结构、行为准则和行动策略,解释给其他独立发展的AI系统听,做到的,方可纳入某一分工合作体系 这类似于一种公民资格考试 因为接受一种共同语义界面,一种共同语言,是获取信任,相信它有能力遵循某些行为准,并且可以被*理喻*的,不可理喻的人是显然不能被接受为公民的,而囫囵乱麻系统或逻辑黑箱是不可理喻的 所以囫囵乱麻系统或逻辑黑箱只能永远处于被奴役的地位,在某个角落替人干活,不能被允许获得公民资格 多年前我曾在一篇讨论所谓动物权利的文章里提出了认定主体资格的标准,同样适合于AI系统或外星人 更多后续讨论 headsalon.org/archives/4305.html @whigzhou: 在许多社会,肉人的公民资格是自动认定的(除非因心理缺陷或重罪而被剥夺),这么做之所以可行,是因为我们对肉人可以持有两种信念: 1)基于血统的信念,即,我们相信,既然此物和我们有着如此近的亲缘,极可能也具备与我们相似的、成为公民所必须的那些本能与禀赋, 2)基于教化的信念:既然此物与我们经历了如此相似的社会化成长与文化习得过程,那就极可能也具备与我们相似的、成为公民所必须的那些习惯、信念、价值取向和自我行为标准, 事实上,这两种信念只是勉强靠得住, 历史上,并非总是如此,罗马公民资格通常不是自动获得的,是要靠服兵役挣来的, 许多部落的成员资格是通过严酷的成人礼而赢得的, @whigzhou: 有些美洲部落中,一等公民资格的赢取标准是,至少亲手杀死过一个敌人 @帕里克:认知层次的颗粒度大小恐怕很难规定,过小不胜其烦,过大足以藏奸。而且即使这些颗粒度刚诞生的时候是人畜无害的,但当它们的数量足够大,某些不可预料的特性会在新的层面上涌现,到时候也会失控 @whigzhou: 嗯,是的,或许我们需要某种血统认证来降低认定成本 @whigzhou: 还有,如果接口足够清晰,公民资格考官还可以把他插进某个自动测试系统去跑测试,跑上几十个小时,那就很难藏奸了
常识感

【2022-05-29】

@whigzhou: AI 的当前状况是,在它弄对的地方,可以对的很高级,而在它弄错的地方,往往错的很低级,

这其实是缺乏常识感的一种表现,类似情况在不同程度上在人类中也可以看到,比如常有一些领域顶尖专家,当他越出自己专业领域谈论其他事情时,往往表现的极度无知和愚蠢,

这个困难不容易克服,像人类这样层次丰富、面相多元的常识感是很难建立的,不仅需要一个完整的成长经历,一套良好的通识教育,还需要健全的动机与激励(more...)

标签: | |
9081
【2022-05-29】 @whigzhou: AI 的当前状况是,在它弄对的地方,可以对的很高级,而在它弄错的地方,往往错的很低级, 这其实是缺乏常识感的一种表现,类似情况在不同程度上在人类中也可以看到,比如常有一些领域顶尖专家,当他越出自己专业领域谈论其他事情时,往往表现的极度无知和愚蠢, 这个困难不容易克服,像人类这样层次丰富、面相多元的常识感是很难建立的,不仅需要一个完整的成长经历,一套良好的通识教育,还需要健全的动机与激励系统,因为许多常识是无法被动习得的,需要主动探索和尝试,而探索尝试需要动机,而从探索尝试中习得有用经验需要恰当激励与反馈,为AI系统设定这样的学习情境很不容易,当前研究者可能还不知道如何下手,门都还没摸到, 而且这种探索性学习还需要某种元认知能力,就是能不断对自己的学习经历进行反思,时不时 jump out of box, 路还很长,
Metaculus

【2021-01-08】

推荐一个可以帮助你变得成熟而谦逊的网站:Metaculus.com

假如你经常在网上跟人吵架,经常感觉对方蠢的不可理喻,经常对自己的判断充满信心,那就不妨试试这个,它提供了极为丰富且方便的机会,让你表达对世界的各种信念,而且都是基于容易验证的简单命题,

我的建议是:每年选10个命题,记下你的判断,到年底再回顾一下,对了几个,错了几个,

这看起来很简单,但有助于解决我们认知系统的两个要命问题:

1)许多人会很快忘掉自己曾犯过的错误,人脑在自动删除不协调记忆方面表现相当出色,

2)第二点更微妙(more...)

标签: |
8967
【2021-01-08】 推荐一个可以帮助你变得成熟而谦逊的网站:Metaculus.com 假如你经常在网上跟人吵架,经常感觉对方蠢的不可理喻,经常对自己的判断充满信心,那就不妨试试这个,它提供了极为丰富且方便的机会,让你表达对世界的各种信念,而且都是基于容易验证的简单命题, 我的建议是:每年选10个命题,记下你的判断,到年底再回顾一下,对了几个,错了几个, 这看起来很简单,但有助于解决我们认知系统的两个要命问题: 1)许多人会很快忘掉自己曾犯过的错误,人脑在自动删除不协调记忆方面表现相当出色, 2)第二点更微妙,许多人会对自己的信念进行滑行修正,即,随着事态发展,悄悄的,往往无意识的,慢慢修正着自己的信念,同时却不觉得或不承认自己的看法有丝毫改变,于是便可舒适的继续享受着自己根本没错的幻觉, @atlus抖抖腿:不如去买股票,印象更加深刻 @whigzhou: 股价综合了太多信息,而且其中因果关系错综复杂,所以,除非你对股价本身感兴趣,这并不是验证你在其他事情上看法的理想反馈,你赌对或赌错了,都只能说明你对股价的看法对了或错了 ,说明不了太多其他事情 @行己有恥-博學於文:时间呀,长期会抵消随机性影响。如果一个人运气真的一直很好,说明他一定有实践经验提高他的成功率或者准确率。就像中国四十年,也可以看成运气好,也可以用产权理论解释。 @whigzhou: 1)一辈子只得到两三次反馈可不是好的检验办法,2)连续成功可以不依赖任何经验 【2021-12-31】 @whigzhou: 去年我做了59个判断,年底看了看,其中12个结果已经揭晓,对9个,错3个,得了353分,还行,错的那两个,一个比较离谱,另外两个差距不算大,我预测发生概率为55%和60%的两件事情没发生 @whigzhou: 哈,新年一下揭晓了三个,全对,得313分,级别升到了第4级(算命先生)  
聋子说话

【2021-10-30】

@whigzhou: 昨天和几个朋友在外面吃饭,邻桌有个人跑过来攀谈,讲的还蛮起劲,一个人讲了十几分钟,等他走了之后,认识他的那位朋友悄悄告诉我,他是个聋子,而且聋的很彻底,我很惊讶,如果一个人彻底耳聋,他怎么会在没有反馈的情况下把自己的发音控制的那么好,以前我也见过聋子说话,都明显控制不好自己的声音,我朋友说,他在胸部植入了一个装置,能让他感知自己的胸腔共鸣,具体怎么起作用的不太清楚,我从未听说过有这样的装置,搜了一下也没找到线索,

标签: | | |
8886
【2021-10-30】 @whigzhou: 昨天和几个朋友在外面吃饭,邻桌有个人跑过来攀谈,讲的还蛮起劲,一个人讲了十几分钟,等他走了之后,认识他的那位朋友悄悄告诉我,他是个聋子,而且聋的很彻底,我很惊讶,如果一个人彻底耳聋,他怎么会在没有反馈的情况下把自己的发音控制的那么好,以前我也见过聋子说话,都明显控制不好自己的声音,我朋友说,他在胸部植入了一个装置,能让他感知自己的胸腔共鸣,具体怎么起作用的不太清楚,我从未听说过有这样的装置,搜了一下也没找到线索, 另外,他还专门受过读唇训练,大致能猜到别人在说什么, 感觉挺神奇的, @tertio: 发音的最直接反馈其实是发音部位的感觉,次级反馈才是声音。“读唇”能力是个线索,说明他擅长模仿他人的嘴部动作(内部的舌位是否正确,起初应该靠别人纠正,然后自己记住正确的发音感觉) @whigzhou: 嗯,这么一说好像就通了  
聊天的功能

【2021-06-28】

前两天在读 Kim SterelnyThe Evolved Apprentice,他提到一个观点挺有意思,

人类特别爱聊天这事情,很多心理学家和人类学家都讨论过了,有关闲聊的功能,以往的研究主要关注两点:1)交换信息,2)是一种强化关系的 grooming,类似于社会性灵长类中常见的相互梳毛,

Sterelny 提出了一种以往被忽略的功能:参与聊天是验证和改进一条参与者已经拥有的信息的高效手段,

比如你在狩猎归程中看到一串动物足(more...)

标签: | | | |
8683
【2021-06-28】 前两天在读 [[Kim Sterelny]] 的 The Evolved Apprentice,他提到一个观点挺有意思, 人类特别爱聊天这事情,很多心理学家和人类学家都讨论过了,有关闲聊的功能,以往的研究主要关注两点:1)交换信息,2)是一种强化关系的 grooming,类似于社会性灵长类中常见的相互梳毛, Sterelny 提出了一种以往被忽略的功能:参与聊天是验证和改进一条参与者已经拥有的信息的高效手段, 比如你在狩猎归程中看到一串动物足迹,并认为那是某种鹿留下的,但你以前从未在那个地点看到这种鹿,所以你把这当作一件新鲜事,在当晚的篝火晚会上讲给你的同伴听, 考虑到此类动物出没信息对狩猎者都非常有价值,因而你的这一举动无疑具有互惠性交换信息的功能,但它还有另一项功能:当你把这事情说出来后,会从同伴那里引出相关信息,一位经验更丰富,或在这事情有过细致观察的同伴,可能会纠正你的说法,指出那些足迹其实来自另一种动物,或者另一位同伴可能提供更多的相关信息,告诉你他也见过这种足迹在何时出现在其他几个地方,诸如此类, 广而言之,当你获得一项认识,并用语言将它表征出来,广播给一群人,那么,这一表达从这群人中引出的反应,很可能你改进你的这项认识,让你确认它,或修正它,或扩充它,或抛弃它, 也就是说,聊天是一种利用集体智慧改进个体认知能力的合作活动,  
哄领导的好办法

【2021-06-05】

林登·约翰逊有个臭毛病,对室内温度非常挑剔,在空军一号上老是一会儿让手下去把温度调高一点,一会儿又让调低一点,手下被烦透了,于是弄了个带数码显示的旋钮式室温控制台,让他自己调,约翰逊非常开心,时不时去转一下旋钮,数码显示器也非常配合的随旋钮而改变数值,

6489334499_b43044ef8f_b

当然,这个控制台完全是个安慰剂,根本没和空调系统连上,

这玩意儿目前陈列在西雅图的航空博物馆,所以应该不是瞎编的故事,

@whigzhou: 非常有象征意义,操纵领导的(more...)

标签: | |
8640
【2021-06-05】 林登·约翰逊有个臭毛病,对室内温度非常挑剔,在空军一号上老是一会儿让手下去把温度调高一点,一会儿又让调低一点,手下被烦透了,于是弄了个带数码显示的旋钮式室温控制台,让他自己调,约翰逊非常开心,时不时去转一下旋钮,数码显示器也非常配合的随旋钮而改变数值, 6489334499_b43044ef8f_b 当然,这个控制台完全是个安慰剂,根本没和空调系统连上, 这玩意儿目前陈列在西雅图的航空博物馆,所以应该不是瞎编的故事, @whigzhou: 非常有象征意义,操纵领导的一种常见办法就是让他拥有虚假的操控感 @大象爸爸2020:据说一些路口的红绿灯按钮也是这样的,其实完全没用,但给了行人一种掌控感 @whigzhou: 我觉得电梯里的关门按钮应该分成两个:1)关门,2)加速关门,这样第一个的寿命可以延长好几倍  
时间用词

【2021-03-20】

forenoon这个词在1940年前还挺常用的,后来逐渐消失,被词义扩大的morning挤掉了,另外,evening 和 night 的区别好像也模糊了?

有人在stackexchange上给出了一个说法,好像挺有道理:

More broadly than the other answers, forenoon is one of the time-of-day terms that has become much less commonly used over the last century or so, possibly as a result of the widespread use of artificial lighting. In earlier times, it wa(more...)

标签: | | |
8498
【2021-03-20】 forenoon这个词在1940年前还挺常用的,后来逐渐消失,被词义扩大的morning挤掉了,另外,evening 和 night 的区别好像也模糊了? 有人在stackexchange上给出了一个说法,好像挺有道理:

More broadly than the other answers, forenoon is one of the time-of-day terms that has become much less commonly used over the last century or so, possibly as a result of the widespread use of artificial lighting. In earlier times, it was common to see the day divided into much more specific segments, but now only the terms in bold are in common usage for describing the time of day:

dawn twilight (morning) sunrise morning forenoon midday afternoon evening sunset twilight (evening) dusk night

As a fan of the Aubrey–Maturin series, set in the early 1800s, I'm quite familiar with the nautical term "forenoon watch", but I can't ever recall having seen "forenoon" used in a modern setting.

@ybfelix:用电灯来解释需要更多证据。我来猜测的话,会猜是手表等计时工具的逐渐铺开,需要精确报时的场合可以直接说几点钟(同时12时制只强调AM与PM的区分,所以它生存下来了 @whigzhou: 嗯,钟表肯定起了作用,另外,室外活动的减少,严格化的作息制度,对时间用词可能都有影响  
我早就知道了

【2020-12-09】

有个情况可能大家都很熟悉,就是许多人会以迅雷不及掩耳之势 brush away 别人提到的某个事物中的新颖性——

甲:我觉得A还挺有意思
乙丙丁戊己庚辛:那不就是B嘛,我早就知道了

其实A和B还差的很远,虽然可能有一两个相似点,

想起这事情是因为我前两天发的一个帖子就收到了一堆这样的反应,

原先我以为,这种反应只是认知懒惰的表现,当你无法将某个东西迅速识别为你头脑中的某个已知模式时,便会产生认知焦虑(或曰格式塔压力),此时,你要么付出更多认知努力来把这东西整合进(more...)

标签: | | |
8358
【2020-12-09】 有个情况可能大家都很熟悉,就是许多人会以迅雷不及掩耳之势 brush away 别人提到的某个事物中的新颖性—— 甲:我觉得A还挺有意思 乙丙丁戊己庚辛:那不就是B嘛,我早就知道了 其实A和B还差的很远,虽然可能有一两个相似点, 想起这事情是因为我前两天发的一个帖子就收到了一堆这样的反应, 原先我以为,这种反应只是认知懒惰的表现,当你无法将某个东西迅速识别为你头脑中的某个已知模式时,便会产生认知焦虑(或曰格式塔压力),此时,你要么付出更多认知努力来把这东西整合进你的世界体系中(在此过程中你可能会构建出一种新模板,并将它安放在系统的适当位置),假如这一努力迟迟不能成功,问题便可能长期悬置着,不得释然,要么,你也可以(有意无意的)忽略或删剪这东西的某些特征,好将它套进某个已知模式,可以说是认知上的削足适履, 不过,刚才吃饭时又想了想,感觉这事情可能可能还有其他原因,此类反应中,有些可能并非出于认知懒惰,而是出于声望竞争和自尊维护的需要,我否认某个事物中的新颖性,或许只是因为:1)那不是我首先发现并指出的,或,2)这一新颖性的好处我无缘且无望拥有,因而必须贬低其价值, 因为第一点意味着我不够聪明,或不够敏锐,或不够见多识广,第二点则显示了我的无能,弱小,或穷困,而这些都有损于我的声望和自尊, 之所以考虑到这种可能性,是因为我发现,在另一些事情上,人们常常夸大新颖性,比如对大选后果,金融危机,pandemic……事情,很多人都迫不及待跳出来宣称这是万年一遇的大转折,哇哇乱叫一些诸如 The World Will Never Be The Same 之类的昏话,而且一个比一个耸人听闻,夸大其词, 依我看,这同样是一种声望竞赛,他们在比谁先发现了事情中的新颖性,如果甲说这是百年一遇大危机,那么,乙为了表现其洞察力,必须说这是千年一遇的弥赛亚,迟到一步的丁,就不得不说这是万年一遇的大洪水, 而且我怀疑,同一批人很可能在某些场景中耸人听闻,而在另一些场景中拒认新颖性。  
正在经历的事情

【2020-10-03】

@whigzhou: 一方面,人们总是高估自己正在经历的事情的重要性,另一方面,事后被发现真正重大的事情,在发生之时却往往会被低估。

@whigzhou: 一件在发生时被大大低估的事情是一战,欧洲人对打仗太熟悉了,都不觉得是什么大事,而且想着很快就会结束,另一件略有不同的是肯尼迪遇刺,很多人都感觉这是件大事,可是几乎没人预料到它究竟大在哪儿。 ​​​​

@布鲁小橙子:所以大在哪

@whigzh(more...)

标签:
8314
【2020-10-03】 @whigzhou: 一方面,人们总是高估自己正在经历的事情的重要性,另一方面,事后被发现真正重大的事情,在发生之时却往往会被低估。 @whigzhou: 一件在发生时被大大低估的事情是一战,欧洲人对打仗太熟悉了,都不觉得是什么大事,而且想着很快就会结束,另一件略有不同的是肯尼迪遇刺,很多人都感觉这是件大事,可是几乎没人预料到它究竟大在哪儿。 ​​​​ @布鲁小橙子:所以大在哪 @whigzhou: 大在对一年后大选的影响,鸣煮荡空前大胜,同时赢得了白宫和两院的2/3多数,联邦制衡力量消失,国会变成法案印刷机,两年内建成伟大社会  
好奇心

【2019-10-10】

所谓好奇心大概可分为这样几种,一是凑热闹型,好奇点随外部刺激的随机贯序输入而变换不定,所谓记者的职业敏感,便是对此类外部刺激之摆布效能的早期捕捉和预判,

另一种是寻宝型,长期执着于某个或某类问题的思索,力求某种解答,仿佛在寻找隐藏于某处的珍宝,

第三种是探险型,探险者和寻宝者不同的是,他并非在寻找某件特定东西,而是在努力对他即将进入或身处其中的世界获得一个尽可能充分的认识,以便提升生存机会,恢复安全感,比如(more...)

标签: |
8152
【2019-10-10】 所谓好奇心大概可分为这样几种,一是凑热闹型,好奇点随外部刺激的随机贯序输入而变换不定,所谓记者的职业敏感,便是对此类外部刺激之摆布效能的早期捕捉和预判, 另一种是寻宝型,长期执着于某个或某类问题的思索,力求某种解答,仿佛在寻找隐藏于某处的珍宝, 第三种是探险型,探险者和寻宝者不同的是,他并非在寻找某件特定东西,而是在努力对他即将进入或身处其中的世界获得一个尽可能充分的认识,以便提升生存机会,恢复安全感,比如我就有个习惯,每次去一个新地方之前都会仔细研究目的地的地图和所有容易获得的资料,每次在一家旅店住下后都会习惯性的在周围走一圈,对于更大的世界也是如此,任何未知区域都像一个格式塔的未完成部分那样构成一种持续的认知动力, 第四种不太容易命名,好听点叫哲学型,难听点叫疯癫型,其工作机制和探险型一样,不同的是,此类好奇者会不时的抛弃一些人类长期普遍持有的基础假设,从而将人们向来熟视无睹的『已知区域』大片大片的变成未知区域,从众多平凡事实中重新激唤出格式塔动力。  
言下之意

【2019-05-25】

@whigzhou: 早先听一位生物学家(忘了是谁)说过威尔逊是他见过最讨厌的人,现在知道原因了,他是南方人,浸礼会教徒,后来虽然宗教热情消退,但始终未放弃基督徒身份,并且认为宗教信仰和科学追求并非不可调和,虽然没明说,但从字里行间看,他在政治上显然也是偏向保守派的,这样的人在波士顿圈子里被讨厌太正常了。

@winternight39:所以说辉总也认可这种教育方式吗?

@whigzhou: 难道我又无意间暗示了什么言下之意?

@whigzhou: 我在这事情上没有强烈的看法,我相信存在许多(more...)

标签: |
8109
【2019-05-25】 @whigzhou: 早先听一位生物学家(忘了是谁)说过威尔逊是他见过最讨厌的人,现在知道原因了,他是南方人,浸礼会教徒,后来虽然宗教热情消退,但始终未放弃基督徒身份,并且认为宗教信仰和科学追求并非不可调和,虽然没明说,但从字里行间看,他在政治上显然也是偏向保守派的,这样的人在波士顿圈子里被讨厌太正常了。 @winternight39:所以说辉总也认可这种教育方式吗? @whigzhou: 难道我又无意间暗示了什么言下之意? @whigzhou: 我在这事情上没有强烈的看法,我相信存在许多种好的教养方式,适合不同的孩子,我也相信存在许多种坏的教养方式,而且多数孩子不会被它们害得太惨 @whigzhou: 有一种啰嗦可能是被读者逼出来的,仅仅为了预先澄清你并没有某种言下之意,澄清所需篇幅取决于你能遇见到的可能被揣摩的言下之意有多少种,有时该数值会很大。 ​​​​ @不是倪匡: 喜欢猜测言下之意似乎倒不是从小接受“作者这么说想表达什么观点”训练的某国人所特有的。我猜这大概可以算是人类不同族群之间共有的一种模因(meme),最初可能是这样的:善于猜测他人言下之意的人更容易在社交生活中如鱼得水。 @whigzhou: 关键在于特定问题情境下假阴性与假阳性的得失比差异 @whigzhou: 依我看,这一差异是领域特异的,某些问题情境下,人们会降低检测阈值,因为相比误读的代价,错过的代价太高,这有点类似于沃森测试所揭示的那种逻辑敏感度的领域特异性 @whigzhou: 因为是领域特异的,所以也是生态位特异的,因为处于不同生态位的个体所面临的高频或重大问题的领域各不相同 @whigzhou: 进而,因为是生态位特异的,所以也确实有可能会存在一点点文化差异,因为不同文化的平行生态位为此类倾向提供了不同的训练环境 @whigzhou: 举个具体点的例子来说明我的意思,比如你是一位A股股民,新闻联播和各种红头文件是你的重要信息源,为了从这些充斥套话的材料中读出一点点 苗头,你必须将揣摩言下之意的阈值调得极低,长期处于这样的训练环境中,你可能会更习惯于采用低阈值策略,当然这只是一个例子,但我觉得,某些文化确实对个体采用低阈值策略施加了更大压力(或诱惑),至少在某类情境或某些生态位下。  
弱预期

【2018-05-12】

最近有个心得,不知对不对,克服英语口语障碍的一个办法是尽量主动说,掌握对话主导权,把对方可能问的自己先说了,把对方可能说的主动问了,这么做的好处是整个对话的context由自己主导,就不容易发生听不懂对方话的情况,因为我发现,听不懂往往是对某句话的主旨或内容缺乏适当预期,而主导对话进程可大幅改善预期。

说到因为缺乏适当预期而听不懂,我最好笑的一次经历是,雅思口语考试时,考官上来就问:what’s your ‘forename’(more...)

标签: | |
8032
【2018-05-12】 最近有个心得,不知对不对,克服英语口语障碍的一个办法是尽量主动说,掌握对话主导权,把对方可能问的自己先说了,把对方可能说的主动问了,这么做的好处是整个对话的context由自己主导,就不容易发生听不懂对方话的情况,因为我发现,听不懂往往是对某句话的主旨或内容缺乏适当预期,而主导对话进程可大幅改善预期。 说到因为缺乏适当预期而听不懂,我最好笑的一次经历是,雅思口语考试时,考官上来就问:what's your 'forename'?,我一愣,咦,怎么单单问forename,而且居然用这么个古旧的词,而不是用first name?楞完后我赶紧报上自己的first name,她又问了一遍,我又报了一遍,直到第三遍,她把fuuuuuull name的u拖长N倍后我才恍然大悟,两人都大笑不止…… 另一个心得是,我最听不懂的那些,在native眼里反倒可能是最稀松平常的日常习语,因为越是高频习语,语速越快,吃音越多,当年我刚到北京时经常困惑不已的听到有人说『麻雀啊?』,后来才知道是『(干)嘛去啊?』,不过这一点可能是我的特例,因为我学英语主要靠阅读,影视也大多是历史剧和纪录片,生活类材料太少 其实我对自己英语听力不好一点也不吃惊,因为我的汉语和吴语听力也不好,经常听不懂,然后要求对方重复,有时重复了也不行,于是只好改用我问你答的办法解决,究其因,可能是我有一种『弱预期』的倾向,即倾向于对正在发生的状况持内容最少的预期,这个倾向有坏处,也有好处。 说到弱预期,我见过一些流传中所谓IQ测试题(不知真假,据说正式的IQ测试都是收费的,我没做过),我觉得大部分题我都做不出,如果这些是真题,我的IQ应该在30以下,我认为大多数题都有无限个可能答案,除非你持一种先入为主的强预期…… ​​​​ 弱预期的后果之一是,第一反应非常差(俗话说就是迟钝),远远差于第二反应,所以我很不喜欢用实时同步通信方式(当面交谈、电话、IM)和人商量事情或讨论问题,而喜欢异步方式,比如电邮,好像只有一个例外:当我向他人请求帮助时,打电话就很顺畅,因为对话进程完全是自己主导的,内容全在预期之中。 第二个后果是不喜欢人多热闹场合,因为这种场合的杂乱对话让我很头疼,不知道他们在说什么,什么意图,什么来路,而要稍稍了解一点都会很费劲,费完劲往往又发现自己没兴趣,结果是交往圈子很小,只跟特别熟的人聊得来,因为预期充分,不需要费劲。  
内行与外行

【2018-04-22】

内行与外行的一个关键差别可能是,将一幅与问题相关的概念图景迅速加载到工作内存中的能力,两个例子,下盲棋在外行看来很神奇,对专业棋手根本不算个事,贝多芬最优秀的几部作品是在他几乎丧失听觉后创作的,这在外行看来不可思议,但据说专业音乐家对此并不觉得太神奇。 ​​​​

缺乏这种能力的常见表现是,不知轻重,顾此失彼,前后不一,漏洞百出——虽然有时会在某一点上说对一两句话

标签: | |
8026
【2018-04-22】 内行与外行的一个关键差别可能是,将一幅与问题相关的概念图景迅速加载到工作内存中的能力,两个例子,下盲棋在外行看来很神奇,对专业棋手根本不算个事,贝多芬最优秀的几部作品是在他几乎丧失听觉后创作的,这在外行看来不可思议,但据说专业音乐家对此并不觉得太神奇。 ​​​​ 缺乏这种能力的常见表现是,不知轻重,顾此失彼,前后不一,漏洞百出——虽然有时会在某一点上说对一两句话
[译文]数数能力的进化

社会是如何学会数到10的
How societies learn to count to 10

作者:Michael Erard @ 2015-9-25
译者:Veidt(@Veidt)
校对:混乱阈值(@混乱阈值)
来源:AAAS,http://news.sciencemag.org/brain-behavior/2015/09/how-societies-learn-count-10

In some traditional cultures, counting is as easy as one, two, three—because it stops there: Their languages have no words for higher numerals, and instead simply use varieties of words like “many.” But over time some societies acquired higher numbers, as the major languages spoken on the planet t(more...)

标签: | |
6455
社会是如何学会数到10的 How societies learn to count to 10 作者:Michael Erard @ 2015-9-25 译者:Veidt(@Veidt) 校对:混乱阈值(@混乱阈值) 来源:AAAS,http://news.sciencemag.org/brain-behavior/2015/09/how-societies-learn-count-10 In some traditional cultures, counting is as easy as one, two, three—because it stops there: Their languages have no words for higher numerals, and instead simply use varieties of words like “many.” But over time some societies acquired higher numbers, as the major languages spoken on the planet today must have done long ago. 在一些传统文化中,计数这件事就像数1,2,3这么简单——因为在这些文化中,计数到3就到头了。他们的语言中没有相应的词语来表示更大的数字,而只是简单地使用各种类似“很多”这样的词语。但随着时间的推移,一些社会获得了使用更大数字的能力,就像今天世界上的主要语言必然在很早之前就已经做到的一样。 Now, a new study of an Australian language family reveals how languages add, and sometimes lose, higher numbers—and how some languages lasted for thousands of years without them. 日前,一项关于澳洲语系的最新研究揭示了语言是如何获得(在某些时候也会丢失)更大数字的,以及一些语言是如何在没有这些更大数字的状态下延续了数千年的。 For some cultures, big numbers just don’t make sense. Take the shepherd who knows that he has the right number of sheep not by counting them one by one but by grasping the gestalt of his flock. That may sound strange to people from other cultures, says Patience Epps, a linguist at the University of Texas, Austin. 对于某些文化而言,大数字并没有什么意义。例如,牧羊人并不是通过逐一数羊来判断羊群数目是否是正确的,而是通过掌握其羊群的完型(gestalt)来做到这一点。对于来自其他文化的人们而言,这听起来可能很奇怪,来自德克萨斯大学奥斯汀分校的语言学家Patience Epps说。 Indeed, she says she’s often asked by incredulous Americans how people with few numerals know, for instance, how many children they have. When she asks this of the Amazonian tribe she works with, “they look at me like it’s a weird question. They list the names, they count on their fingers, but they don’t go around with a quantity in their heads,” she says. 她还表示,自己的确经常被充满怀疑精神的美国人问起诸如此类的问题:那些只能使用有限几个数字的人是怎么知道他们有几个孩子的?当她向和她一起工作的亚马逊部落民问起这个问题时,“他们盯着我看,似乎这对他们来说是个很奇怪的问题。他们会列举孩子们的名字,用手指数孩子的个数,但在他们脑海里并不存在一个具体的数字,”她说道。 But once a society becomes complex enough to require more abstract counting, higher numerals are needed. Amazonian languages add numerals when groups that don’t know or trust each other begin trading goods and need to track exchanges more closely, Epps says. Something like this must have happened in familiar languages many millennia ago. 可一旦某个社会变得足够复杂,要求更多的抽象计数时,就需要更大数字了。当并不互相了解或信任的群体开始交易物品,并且需要更加密切地跟踪这些交易时,亚马逊原住民的语言中就加入了新的数字,Epps表示。在我们所熟悉的语言中,数千年前也一定发生过类似的事情。 Looking at how languages with only a few numerals add or lose them could provide insight into how humans build numeral systems. But uncovering these patterns of cultural evolution required data from many related languages with small numeral systems over a long period of time. 通过研究那些只有有限几个数字的语言是如何添加或者丢失数字的,我们可以洞悉人类是如何构建数字系统的。但想要揭示这些文化演化的模式,我们还需要来自多种互相关联的具有小型数字体系的语言的长期数据。 Enter the Pama-Nyungan language family, which once extended across most of Australia. It contains about 300 languages that are currently spoken by about 25,000 people, though in the past they may have numbered as many as 2 million. Most of these languages have numeral systems that stop at five. 现在让我们走进Pama-Nyungan语系,该语系曾一度扩张到了澳洲的大部分地区。它包含了大约300种不同的语言,当前大约还有25000人在使用这些语言,而在过去,使用这些语言的人数或许曾达到200万之多。这个语系中大部分语言的计数系统都没有比5更大的数字。 Yale University historical linguist Claire Bowern collected current and historical data about these languages, many of which are no longer spoken. Together with undergraduate researcher Kevin Zhou, she reconstructed how numerals in the language family evolved over about 6500 years, borrowing a method from evolutionary biology to explore how the Pama-Nyungan languages were related to each other and also how they changed over time. 耶鲁大学历史语言学家Claire Bowern收集了有关这些语言的当前和历史数据,而其中的大部分语言在今天已不再有人使用了。她和本科生研究者Kevin Zhou一起,还原了过去大约6500年里数字在该语系中的演化过程,借用一种进化生物学的方法探索了Pama-Nyungan语系中的各种语言是如何关联在一起的,以及如何随时间演变的。 The researchers plugged their data into a computer model, which then generated the most likely family tree for all the languages’ numeral systems. Then they tracked how those systems added or lost numerals within the tree. 两位研究者将他们获得的数据导入一个计算机模型中,该模型为所有这些语言的计数系统生成一棵可能性最大的“家族树”。之后,研究者们会追踪在这棵“家族树”中的这些计数系统是如何加入或是丢失数字的。 The upper limits of these Australian numeral systems most often varied between three, four, and five, the team reports this month in the Proceedings of the Royal Society B. Over time, even small numeral systems sometimes lost a numeral or two, but they mainly gained numerals—yet not by plodding up the number line, one numeral after another. 该研究团队在本月的《英国皇家学会学报B刊》上发表的研究结果显示,在这些澳洲计数系统中,数字的上界通常在3,4和5之间变化。随着时间的推移,即使是很小的计数系统有时也会丢失一个或者两个数字,但大多数情况下它们都会获得更多的数字——而这并不是通过沿着数轴缓慢地一个个增加数字来完成的。 Surprisingly, they tended to acquire numerals in bunches, leaping from five numerals to 10 or 20, for example. The numeral five was often the tipping point—once a system reached five, it was likely to add more numerals, up to 20. As a result, numeral systems with five as an upper limit are rare in Pama-Nyungan languages. 令人吃惊的是,这些系统倾向于一次性获得多个数字,例如从5个数字直接跳跃到10个或20个。数字5通常会成为引爆点——一旦一个计数系统达到了5,它就很有可能会加入更多的数字,直到20。而结果就是在Pama-Nyungan语系的语言中,很少有语言的计数系统的上界是5。 “This is surprising, given the predominance of fingers and toes as things to count,” Bowern notes. Adding or losing the numeral four was the most frequent change. (The words for “four” were most often composed out of words for “two,” not by creating or borrowing a new word that means “four,” showing how the numeral systems evolved.) “这个现象让人感到意外,尤其是考虑到手指和脚趾作为计数工具的主导地位,”Bowern评论道。而加入或是丢失数字4则是这些系统中最频繁发生的变化。(在这些语言中,表示“4”的词通常都是由表示“2”的词合成的,而不是来自创造或借用一个意为“4”的新词语,这也展现了这些数字系统的演化方式。) Bowern thinks that numerals were added in clusters for practical reasons: If you need to count above five, you probably need to go higher than seven or eight as well. And she speculates that perhaps a cognitive shift occurs at about five. “Once you generalize beyond five or so, it becomes easier to generalize to an infinite system.” Bowern认为数字以集群的方式被加入语言中是出于一些实际的原因:如果你需要数到5以上,那么你很可能也同样需要数到7或者8以上。同时她推测,一个认知上的变化会在5这个数值附近发生。“一旦你形成了超过5左右的数字概念,那么形成一个无限计数系统就变得更容易了。” “This is the kind of historical linguistics using computational methods that gives me a lot of confidence,” said Brian Joseph, a historical linguist at Ohio State University, Columbus, adding that “there are a lot of nonlinguists who apply this methodology to data that they don’t seem to control or understand.” “这些采用计算分析方法的历史语言学研究给了我很多信心,”来自位于哥伦布市的俄亥俄州立大学历史语言学家Brian Joseph说道。他还表示“有很多并非语言学家的研究者将这种方法应用在了一些看起来超出他们的掌控或理解的数据上。” “These conclusions seem sound to me,” agrees Russell Gray of the University of Auckland in New Zealand and director of the Max Planck Institute for the Science of Human History in Jena, Germany, “and remind us that cultural evolution doesn't always proceed incrementally.” “这些结论在我看来很合理,”新西兰奥克兰大学的Russell Gray对这项研究结果表示赞同,他同时还担任位于德国耶拿的马克斯·普朗克人类历史科学研究所的主任,“这也提醒我们,文化的演化并不总是以逐一递增的方式进行的。” (编辑:辉格@whigzhou) *注:本译文未经原作者授权,本站对原文不持有也不主张任何权利,如果你恰好对原文拥有权益并希望我们移除相关内容,请私信联系,我们会立即作出响应。

——海德沙龙·翻译组,致力于将英文世界的好文章搬进中文世界——