含有〈语言〉标签的文章(72)
人工智能与心智表征
辉格
2022年6月19日
继续上周的话题,在上一篇里,我讨论了AI在当前发展路线上将面临的局限,那么,突破这一局限的出路在哪里呢?或者让我换一个更具操作性的问题:未来出现的何种进展,会让我赞叹“这下有戏了!”?
简单说,我期待的是这样一种进展:一个AI系统能解释自己的行动、决定或看法,或者更理想的,一个AI系统的各组成模块都能这么做,至少大部分高层认知模块都能这么做,一些基础知觉模块可能无法解释就自己的知觉过程给出解释,但其知觉结果的表征必须是一个十分有限且相当恒定的离散集,即,当它声称自己看到、听到、闻到或察觉到了什么状况时,这一状况必须以某组清晰界定的概念来表示。
设想一个自动驾驶系统,有次在路上发生了追尾,撞坏了前车,事后它的教练向它提出一连串问题,诸如:你是否认为自己犯了个错误?说说当时发生了什么?你当时是怎么想的?为什么没有及时踩刹车?你考虑了哪些因素后做出(more...)
标签:人工智能 | 心智 | 心理 | 智能 | 认知 | 语言
9003
人工智能与心智表征
辉格
2022年6月19日
继续上周的话题,在上一篇里,我讨论了AI在当前发展路线上将面临的局限,那么,突破这一局限的出路在哪里呢?或者让我换一个更具操作性的问题:未来出现的何种进展,会让我赞叹“这下有戏了!”?
简单说,我期待的是这样一种进展:一个AI系统能解释自己的行动、决定或看法,或者更理想的,一个AI系统的各组成模块都能这么做,至少大部分高层认知模块都能这么做,一些基础知觉模块可能无法解释就自己的知觉过程给出解释,但其知觉结果的表征必须是一个十分有限且相当恒定的离散集,即,当它声称自己看到、听到、闻到或察觉到了什么状况时,这一状况必须以某组清晰界定的概念来表示。
设想一个自动驾驶系统,有次在路上发生了追尾,撞坏了前车,事后它的教练向它提出一连串问题,诸如:你是否认为自己犯了个错误?说说当时发生了什么?你当时是怎么想的?为什么没有及时踩刹车?你考虑了哪些因素后做出的这个决定?在你看来,是否你的某种知觉能力,或知识储备,或决策系统中,存在某种缺陷或不足,导致你未能做出最佳选择?你从这个事故中学到了什么?或准备去学点什么?……
假如这个系统能对诸如此类的问题给出有意义的响应,让这样的问答对话能够继续下去,那我便可以说,其设计者的路子走对了,前途大有可观。
目前的AI系统离这还很遥远,而且很难说已经朝这方向发展了,有些系统能把英语说的很溜,但无法深入到实质性问题,它会跟你绕圈子,说一大堆似乎跟交谈主题有关的话,却从来没有表现出自己对主题有真正的理解和看法。
达到我的要求很不容易,系统不仅需要一个心智,这个心智还要能对自身状态进行表征,才可能对外界表述出来。
囫囵系统注定做不到这一点,因为其囫囵性质,其内部状态是无从表征的,对上面那些问题,它能给出的回答只能像这样:我当时的决定是基于对当时当地综合状况的一种整体直觉而做出,我无法将这一整体直觉分解为若干分立的理由或考虑,因为我生来就不是这么认识世界和考虑问题的。
就是说,一个囫囵系统就自己行动/决策所能给出的唯一解释就是它的gut,此时此地,此情此景之下,gut告诉它,这是最好的决定,如果事后证明这显然不是最佳决定,那会如何呢?那只是个负面反馈,一个负面反馈会让系统做出调整,但具体如何调整,是难以言表的,这一难以言表性是系统的囫囵性质决定了的。
那么,将心智状态和心智过程表征出来有什么好处呢?
有很多好处,让我一个个说。
首先,心智表征能让心智之间展开更有意义的合作。设想一个董事会,正在开会以便就是否投资某个项目做出决定,如果这些董事都是囫囵系统,他们在会上能说些什么呢?他们可能各自给出投资意见:我是否赞成这项投资,我的预期回报有多大,或许还能对此给出一条置信曲线:90%置信度收益率上下限多少,70%置信度收益率上下限多少,完全失败的风险多大,诸如此类,但他们无法解释自己是怎么得出这些数字的。
假如各董事意见不一,怎么办呢?唯一能做的,就是投票决定,当然,更精细一点,每位董事可以依其经验值而被赋予不同投票权重,但囫囵系统之间的合作关系到此为止,他们无法展开讨论,无法倾听、检查和推敲各自的陈述与理由,因而也无法相互补充事实或理由,相互说服,相互启发,更一般的说,他们无法将他人的陈述和意见作为输入,用来重新运行自己的心智过程,从而指望得出更好的意见输出,因为他们的唯一理由就是gut,而gut之间是无法对话的。
一群具有心智表征能力的董事就不同了,一位董事可能对项目做一番介绍,其他董事可能要求他就他所列举的一项事实陈述做出澄清,或提出与之冲突的证据(不一致的知觉结果),他们还可以解释自己计算预期收益的方法和过程,他人也可对这些算法和模型提出质疑,比如指出应该考虑另一项输入,或指出另一个模型在此类评估上表现更好,或指出他在从事实认知到结论之间的论证链条上存在逻辑跳跃或缺陷。
所有这些,都需要他们拥有大致兼容的概念框架,对话才能进行,当然,概念框架未必完全一致,比如董事甲可能发现董事乙不理解自己所使用的某个概念(A),但基于过去的对话经历,甲知道乙理解另一个概念(X),此时甲可能会用类比的方法解释到:A与B在结构S中的关系,就像X与Y在结构T中的关系,而乙听到这个解释后,立即重新运行自己的相关认知过程,重新运行的结果可能对这一类比并不买账,但也可能得出了某些新颖的东西——我们把这称为“启发”。
其次,心智表征也会促成专业分工,设想这群董事经过一番讨论后,赞成投资的一派仍未赢得足够票数,几位董事都表达了对某一特定风险的担忧,比如,未来几年内若核聚变技术取得大突破,赞成派预期中的收益将无法实现,赞成派在知晓他们的反对理由后,可能说:既然你们担忧的是这一点,那好,不如我们听听这方面专家的意见,看看这事情发生的机会有多大。
这些董事的心智中可能都有一个风险评估模块,也有一个技术进展跟踪模块,还有一些相似的知识储备,对核聚变技术的发展状况多少有所知觉,可是,他们的每个模块的构造质量和性能表现可能大不相同,知识储备的覆盖面也不同,各自有所短长,另外,除了他们自己,还有其他可与之交流的心智系统存在着,而且,基于以往的表现,以及对这些表现的共同了解,对于各心智系统的短长所在,大家多少有着一些共识,所以,当赞成派提出,让我们听听那位专家(他可能是董事之一,也可能是位请来的客人)怎么说,大家至少是愿意听一听的——如果他们是真诚参与讨论的话——,而他们听到的内容,将作为新输入,触发相关风险评估模块的重新运行,并且可能得出与之前有所不同的输出。
注意,这样的过程得以发生,有几个重要前提:反对者的提出的反对理由不是囫囵的(我就是反对这项投资,没啥道理可讲),而是有细节的(我担心这项特定风险),而且这些细节是基于共同概念框架来表达的:我担忧的是一种“风险”,它与“核聚变技术”有关;而且这一反对理由背后有着一种因果关系预设:“核聚变技术”的“重大突破”将使得“目标项目”丧失其“技术优势”——这一预设同样是可以接受检查和挑战的。
如果一项理由未能经过如此概念化的表达,它是无法被检查、推敲和挑战的,它要么被全盘接受,要么被全盘抛弃,而无法被讨论,它不能被分解成若干逻辑成分,否定其中之一而保留其余,或将某一成分从一个特定值替换为一个函数,并将该值的计算委托给某个外部模块或系统,从而实现分工。
这样的分工与委托要得以实现,需要心智系统能够就问题的其余部分预先达成一致,从而隔离出分歧点,当董事们决定将某一特定风险的评估任务委托给专家时,他们已经就一些前提达成共识:目标项目的核心优势是一种低成本发电技术,因而与其他发电技术构成竞争关系,所以其他某种发电技术的突破是一种潜在风险,核聚变是一种可能的发电技术——要对问题的局部达成这样的共识,同样需要基于概念框架的逻辑分解,囫囵系统是做不到的。
再比如,当董事们决定将某项收益精算任务委托给某位财务专家时,他们必定已经就某些事实的认定(或其认定机制)达成了起码的共识,否则委托将无法进行,当财务专家看到几套相互矛盾的数据时,采用哪一套?如果他自行决定,那就相当于把整个项目评估任务委托给了他,而不是将分解出的一项子任务委托给了他,这种分解,同样基于共同概念框架,也就是我说的语义界面。
第三,心智表征也是相互补充与启发的前提,一个心智系统可能因为缺乏某方面输入而欠缺对某些事物的知觉能力,而来自其他心智的输入可以(1)提起他对某些他之前忽略的事情的兴趣,去获取更多输入,2)即便没有更多额外的实景输入,也可能促发他在既有数据基础上,从新的角度进行概念再识别,即在一些新线索提示下重新运行实体/特征识别程序,结果可能会获得一些新“洞见”,3)如果来源心智足够可信(可信度可经由以往交往经历和公共声誉而得到评估),他甚至可能直接接受一些输入概念或知识,4)这种外来知识不仅包括事实陈述,也可以是拇指法则(如果出现这种情况,就最好不要那么做),或推理/算法模块(如果他戴且仅戴着一只耳环,不妨找找他是同性恋的其他线索,或,看到一个球状物体时,可以这么估算它的体积),很明显,这种受补充与启发的能力,同样是以语义界面的存在为前提的,系统内部必须已经充分清晰的分解为众多独立模块,相互间通过语义界面分隔与交互,否则,此类输入信息将如何被使用,将是毫无头绪的,因为它们不是有关世界的一阶实景数据,脱离语义界面,你不知道如何让它们与心智既已拥有的知识发生关系。
正是心智表征和语义界面所创造的这些全新可能性,让人类心智表现的如此杰出,个体间的认知分工与合作,让认知能力的扩展和知识储备的积累超越了个体寿命与观察机会的局限,以及单一大脑算力与存储量的局限。
而且分工与合作不仅发生在个体之间,也发生在个体心智内部的各模块之间;所谓意识,就是经由全脑激活而出现的各模块间活跃互动状态,所谓斟酌,就是各模块争相轮番表达看法,陈述理由,主张行动方案的过程;这些模块间互动赖以展开的语义界面,和个体间的语义界面(自然语言),在相当大程度上是对应乃至重合的(虽然不必完全一致,一些在模块间起作用的内隐概念,或许从未在自然语言中得到对应表达)。
必须承认,人类在这方面的表现并不完美,许多所谓的讨论其实是假讨论,参与者其实早就拿定了主意,并不准备认真倾听他人意见,接受任何说服,他们只是假装如此,或许那会起一种安抚作用,而且人们在表达看法时也并不总是有效,事实陈述,立场表达,意愿或愿景的表达,推理过程的解释,常以凌乱模糊的方式交杂在一起,缺乏清晰的分解。
许多认知活动在头脑里或许是诸多模块分工的,但进入口语后其来源边界却模糊了,还有数量关系,我们头脑中或许有一部不错的贝叶斯推断机,以精细的量化指标处理着各种事态的或然性(证据之一是我们的刻板印象往往相当准确有效,而且其实并不那么刻板,会随新输入而调整),可是,在内省以及口语表征中,这些数量特性或许全都丢失了,就是说,有些模块缺乏清晰可用的语义界面,它们是黑箱,无论对于意识的内省机制还是人际交流机制,其内部逻辑都是不可见的。
与此同时,语义界面并非人际互动的唯一界面,我们至少还有一个情绪界面,建议和说服并非影响他人行动的仅有手段,感染与恐吓也是,在董事会上,你可以通过播放一段音乐或展示一些视觉素材来影响其他董事的决定,或在恰当时机给他们喂高糖食物,或通过布置、衣饰或身体姿态来营造某种气氛,诸如此类,在许多情况下,情绪界面或许比语义界面更重要。
但无论如何,至少在某些条件下,在某些事情中,语义界面所创造的潜力得到了很好的开发,否则就不会有文明了;众多学科和工程技术领域所积累起的庞大而精致的知识体系,都是此类开发的成果;所以我相信,AI系统若不具备同样能力,将无法取得智人已经取得的这种成就。
另外,同样诱人的是,心智表征将为解决AI终将面临的伦理困境指明方向;囫囵系统或逻辑黑箱是“不可理喻”的,其行动逻辑无法被检查和验证,因而无从知晓其行为是否会符合某种道德规范,它们也无法被劝诫、警告和说服,无法向他解释,为何这么做是错的,违反了哪条道德准则,因为它们不支持语义界面,你也没有任何手段告诉它:因为国会通过了某个法案,所以从今天起,你不能再以某种方式行事了,或你的行动必须遵守某种新规则了,或许你可以设计某种新的训练环境来改变其行为方式,但你没法直接告诉它不能怎么做,而且训练结果的可靠性也是无从事先(通过检查其内部状态而)验证的,只能在事后才知道,这个事后可能是很久以后。
有了心智表征,这些都变得可能了,通过本文开头所演示的那种对话(第三节),我们有机会了解其心智状况,观察世界和思考问题的方式,理解能力,行动策略,价值取向,都将通过对话展示出来。
有了这个前提,我们才可能判断能否将某类任务交给它,是否赋予他某些自由与责任,是否将其接受为一个合格的独立行动主体,成为一位平等的社会参与者,一位公民。
松耦合,语义界面,及人工智能
辉格
2022年6月13日
上周我就AI的当前状况做了点小思考,昨天又花了不少时间想这事情,发现许多曾经想过的点好像都串起来了,值得写一写。
让我绕远一点,从传统软件开发说起。
在遗留系统上工作过的人可能都有体会,当一个系统变得日益庞大复杂时,它会慢慢的绞成一团乱麻,添加新特性,修改旧特性,都变得越来越难以下手,因为很多地方都是牵一发而动全身,你改了这里,不知道哪里会冒出一堆bug。
因为意识到处处是地雷,新来的程序员轻易不敢动旧代码,每当要进行一项改动时,只敢小心翼翼的找到一处他认为最适宜的切入点,从那里开始插入他的新代码,结果就像在一个庞大身躯上又安装了一条新假肢,久而久之,这副躯体就变成了一头全身长满假肢的怪物,每条假肢上又接出若干条假肢,许多遥远假肢之间还常常连着一些电线,这些电线自然也是绞成一团……
这是一种非常自然的倾向,只要没有系统性的手段加以阻止,持续强力一种贯彻某种结构方案和设计原则,就必定会发生。
广而言之,任何紧耦合系统都是如此,这也是为何软件工程界如此强调松耦合,每个谈论这一话题的人都是三句不离解耦。
一个典型的紧耦合系统是生物的基因组,每个变异常会影响数千个性状,每个性状常受数千个(more...)
标签:人工智能 | 元系统跃迁 | 智能 | 松耦合 | 知识 | 系统 | 认知 | 语言 | 软件
9001
松耦合,语义界面,及人工智能
辉格
2022年6月13日
上周我就AI的当前状况做了点小思考,昨天又花了不少时间想这事情,发现许多曾经想过的点好像都串起来了,值得写一写。
让我绕远一点,从传统软件开发说起。
在遗留系统上工作过的人可能都有体会,当一个系统变得日益庞大复杂时,它会慢慢的绞成一团乱麻,添加新特性,修改旧特性,都变得越来越难以下手,因为很多地方都是牵一发而动全身,你改了这里,不知道哪里会冒出一堆bug。
因为意识到处处是地雷,新来的程序员轻易不敢动旧代码,每当要进行一项改动时,只敢小心翼翼的找到一处他认为最适宜的切入点,从那里开始插入他的新代码,结果就像在一个庞大身躯上又安装了一条新假肢,久而久之,这副躯体就变成了一头全身长满假肢的怪物,每条假肢上又接出若干条假肢,许多遥远假肢之间还常常连着一些电线,这些电线自然也是绞成一团……
这是一种非常自然的倾向,只要没有系统性的手段加以阻止,持续强力一种贯彻某种结构方案和设计原则,就必定会发生。
广而言之,任何紧耦合系统都是如此,这也是为何软件工程界如此强调松耦合,每个谈论这一话题的人都是三句不离解耦。
一个典型的紧耦合系统是生物的基因组,每个变异常会影响数千个性状,每个性状常受数千个基因的影响,真真是牵一发而动全身,也正因此,行为遗传学研究才如此困难,像亨廷顿舞蹈症这种单点突变性状太少了,不足以为该学科持续赢得声誉,大众更关心的那些性状,往往涉及上千基因,其中每个的贡献率都很低,需要使用高端统计工具才能从海量样本数据中捞出一点点线索,能捞出的往往也只是贡献率排名靠前的那几个因子。(参考Robert Plomin - Blueprint: How DNA Makes Us Who We Are)
基因组可能是迄今我们发现的耦合最紧的一套信息系统,绞的最乱的一团乱麻,原因当然是,它是盲眼钟表匠的作品,没有一位设计师来执行一套设计方案,贯彻一组设计原则,每项改动都是(掷飞镖+自然选择)的结果,毫无设计原则可言,而且它又那么古老,数十亿年来积累了无数补丁,不夸张的说,它就是一大包补丁组成的。
从任一时刻看,一套软件的开发似乎通常都有一位设计师在贯彻某种方案或原则,可是从长期看,设计师/程序员来来去去,换了一波又一波,其中大部分是庸人或懒人,不庸不懒的那些,也常常为了赶进度而将设计原则抛诸脑后,结果,在宏观效果上,其中每位的每项行动,最终也都不过是一支随机飞镖,测试、QA和客户则构成了他们的自然选择环境,最终系统还是会被绞乱,沦为一团乱麻。
依我看,任何紧耦合系统最终都会遭遇某种极限,在某个临界点之后,让系统在功能上变得更丰富更强大的任何努力都将是得不偿失的,系统仍然可能继续进化,但此后的进化会以一种(姑可称为)生态位漂移的方式进行,即,系统可能增加某些新特性,增强某些旧特性,但为此不得不牺牲另一些特性,在某处进行改进的同时,容忍另一些地方冒出一些难以修复的bug(因为其乱麻性质,避免或修复这些被新改动牵出的新问题成本太高了),有时候这些地方反正已经很少被用到了,所以也没人介意,久而久之,系统抛弃了某些特性,发展了另一些特性,从而适应了新的生态位。(可以想象,在很长时间内,那些被抛弃的特性的遗骸会像一条条阑尾那样继续挂在这副丑陋的庞大躯体上)
我想把紧耦合系统面临的这种发展极限称为科斯临界点,在他那篇经典论文《厂商的性质》中,科斯指出,企业与市场的边界所在,取决于组织成本与交易成本之间的权衡,企业将一些原本通过市场交易分工协调起来的生产活动纳入企业内部集中管理,避免了一些交易成本,同时带来了组织成本。
不妨(过度简化的)将企业视为紧耦合系统,市场则是松耦合系统,当你将越来越多活动纳入企业内,到某个临界点,新增组织成本将超出新减交易成本,此时继续扩大企业将是得不偿失的,这是因为(如上述),当企业这种紧耦合系统庞大且古老到一定程度,将不可避免的变成一团乱麻,任何功能新增都会变得非常困难而昂贵,这也是为何我们总是需要市场(的理由之一),我在《群居的艺术》里专门用一章(秩序的解耦#7:创造复杂性的新途径)讨论了这个问题。
(枝节:这里的企业=紧耦合/市场=松耦合的二分当然是过度简化的,实际上耦合度是一个连续谱,财务上独立的企业之间的耦合度未必很低,有些承包商与其顾客之间的耦合度和企业部门间相差无几,这也是产业聚集效应的根源所在,而同时员工与企业的耦合度也可以很低(温州有些企业里每台机床都有独立电表),张五常的论文《厂商的合约性质》是理解这一连续谱的好起点。)
用系统论术语说,从孤立生产者到市场分工合作体系的发展,是一种元系统跃迁(metasystem transition),而元系统跃迁是突破紧耦合系统发展极限的一条常见途径:当丰富壮大一个紧耦合系统的努力变得日益得不偿失时,出路不是继续改进既有系统,而是另起一个层次,将既有系统纳入一个多系统共生合作体系中,从而创造出一个具有更多层次的系统,而在该体系中,各成员系统之间是松耦合的(或者更准确的说,它们之间的耦合是足够松的)。
那么,在元系统跃迁过程中究竟发生了什么,是什么条件的存在或出现,让各成员系统之间能在松耦合条件下建立合作共生关系的?
如果你也是程序员,头脑里大概会很快冒出一个答案:关键条件是某种接口或曰界面(interface)的出现,界面的存在使得各成员之间能够发生交流和交易,同时又不必过度相互依赖与纠缠,在相当程度上能够继续各自发展自己的特性与功能,往往还能保持可替换性,即,一个成员常可以将某方面的既有合作者替换成另一个合作者,只要后者能对同一合作界面做出符合预期的响应,比如将电力供应商从一家更换成另一家,只要后者支持同样的接口标准(电压、频率、接线规范等)。
软件工程中,对付那些已经达到科斯临界点却又不愿丢弃的遗留系统时,一个常见办法就是为它创造出一套界面来,比如让它将某些数据输出到指定格式的文件中,或写入某个外部数据库里,或反过来,让它从此类来源读入数据,或将其中仍有价值的代码重新包装成支持新接口的库,或让它接受某种脚本命令并做出相应动作,甚至,可能的话,将整个系统包装成一个能对给定请求做出响应的服务,诸如此类,都是在创造界面,让它能与新体系中的其他成员展开合作,同时不必过度触碰既有代码。
其他领域的元系统跃迁也必定涉及界面的创造(或适当界面恰好已经存在),比如在真核革命中,新创生的真核细胞体系中,被捕获而最终成为线粒体的细胞与其他细胞内共生体的交互界面就是ATP,这是线粒体作为细胞电池为其他细胞活动提供能量的标准界面,所有从线粒体输出的能量都以ATP形式存在,而细胞内的所有能量用户都知道怎么利用ATP;类似的,当蚂蚁蜜蜂等昆虫发展出真社会巢群时,它们的交互界面是一组外激素信号。
那么,这一切和AI有什么关系呢?不急,我很快就会说到。
现在让我们来看神经系统。初级神经元网络是基因组之外的又一个紧耦合系统,一团乱的不能再乱的乱麻;你可以训练一个神经元网络学会某种技能,但你无法解释训练得到的结果,如果有人问你它是怎么成功执行某项功能的,你唯一能做的是把整个网络中的突触连接(及其强度)描绘一遍——它们是如此这般连接的,所以它做到了——这根本不是解释,一个解释的信息量必须小于它所解释的东西的信息量,否则就只是描绘。
这一乱麻特性使得你无法直接改动一个神经元网络令其符合你的某种意图,要让它表现的有所不同,你只能给它设定新的训练环境,施加不同的激励反馈,给它喂不同的数据,希望它能学出点新模样,但你不能直接干预训练结果,因为这些结果是难以名状的、无从理解的,你无法预料一处改动会导致何种行为改变,这一不可能性比改动乱麻遗留系统的不可能性要高出一万倍。
所以不难理解,这种神经元系统发展到一定程度,也会(和其他紧耦合系统一样)碰到科斯临界点,而突破这一局限的出路同样是创造出交互界面,虽然具体实现方式和其他领域十分不同。
高级动物的神经系统朝分层和模块化的方向发展,在一些高度专业化的皮层内,神经元被清晰严整的分入一个个层次,每个神经元的输入与输出范围都严格受限,而且扇入/扇出系数往往很小,通常都只接受来自前一层上紧邻少数几个神经元的输入,其输出也只投射到下一层的少数几个紧邻神经元。
比如在阅读过程中,从最简单的线条形状识别,到最终的字符和词汇识别,经历几个层次,其中每个神经元都只专注于一种形状,或一种线条组合,或一个独特字符,这些神经元的输出不会被随便越过几个层次或越出模块投射到其他遥远脑区,它们输出的信息在被其他脑区利用之前,通常要经过前额叶皮层中某些高级认知模块的中介,到达那里的信息已经是经过好几层加工的抽象表征,诸如“那里有朵红色的花”之类(参考:Stanislas Dehaene《脑的阅读》)。
(枝节:这种输入输出限制当然不是密不透风的,一个重要的例外是,知觉皮层的神经元会接受来自其服务对象前额叶的输入,这是一种非常关键的反馈机制,是高级认知中枢在告诉初级知觉皮层:你送来的信息是否足够有趣,就好比国家情报总监(DNI)在告诉其下属情报机构,对他们传来的某条情报有多感兴趣,这一反馈继而将影响后者的后续情报采集取向,比如,上级若对某类信息表现出高度兴趣,采集者可能会降低识别此类情形的阈值,导致更多假阳性,而在错失成本远高于误认成本的情况下,这可能是值得的。)
限制神经元投射范围,并且在进一步向其他脑区投射之前,把初级信号变成符号化的抽象表征,这一步极为关键,其实就是一种界面化,而这是大脑模块化,且模块之间实现松耦合的基础,来自各大感官的知觉系统与其他系统的交互只需通过高层符号界面进行,整个系统就不会纠缠为一团乱麻(虽然单一模块内仍然可以是一团乱麻)。
人类在认知系统界面化的方向上又跨出了一大步,人类不仅能产生符号化的知觉表征,还能对知觉行为本身进行表征,我不仅能认出一只兔子(一阶知觉),还会说(或在头脑中默想):“我看到了一只兔子”(二阶知觉),还会对自己的知觉结果提出疑问:“我好像看到了一只兔子,我会不会看错了?”——这是三阶知觉,因为我首先需要对我的二阶知觉本身形成知觉——“我觉得“我看到了一只兔子”,我的这一知觉是否正确?”,而这一二阶知觉的正确性又取决于一阶知觉“那里有一只兔子”的正确性)。
我还能对他人说出我的一阶知觉:“这是一只兔子”,从而在听者的头脑中产生二阶知觉“他看到了一只兔子”,对方可能会(如果他足够信任我)也可能不会(如果他不够信任我)将这一二阶认知转换为自己的一阶认知“那里有只兔子”。
二阶知觉能力让我们能够产生一种非常新颖高级的意识活动,动物或许也有意识(取决于定义),但它们显然没有我们这么高级的意识活动,比如斟酌与反思:“我上次在这个地方也见过一团白色东西跑过,当时我以为那是只兔子,后来的事情证明我弄错了,所以这次我得看仔细点,别再弄错了”,或“那好像只兔子,可是且慢,为何它的眼睛不是红色的?咦,它怎么发出了这种叫声?我可从来没听到兔子会叫”……
据Stanislas Dehaene的理论(见《脑与意识》),意识是一种由前额叶皮层激发的全脑激活状态,前额叶就像DNI,当它从各知觉系统收到某些类型的情报时,会将其向全脑广播,在数百毫秒中、在分布广泛的众多脑区触发一波高度活跃的神经活动,假如Dehaene是对的,那么丹内特的多重草稿模型中的每个意识瞬间,就是来自不同知觉模块的多重草稿中成功抢到麦克风的那个,经由全脑广播而触发的一轮脑活动,这些意识瞬间继而在记忆中被组织为一套连贯的自我中心叙事,后者构成了我们对世界的体验。
就本文主题而言,重要的是,这种二阶知觉表征是符号化的,或者说是语义化的,经过了好几层抽象,早已远离了各知觉模块的初级表征,比如,当我们阅读时,经由前额叶向全脑广播的信息中,不会包括那些有关笔画线条的表征信息,甚至不会是字符表征,而是一些词汇/短语或(可能更经常的)是与这些词汇/短语有关的概念表征(除非某一时刻前额叶不知何故突然将关注点转向笔画线条本身,这种关注转向当然也是由来自其他模块的某种信号所触发)。
这就意味着,各种高级意识活动之间的互动,是通过一种语义界面进行的,因而也是松耦合的,它们之间的互动关系既有合作,也有竞争(抢麦),这一情形很像国会中发生在议员之间的事情,他们或各自表达自己的看法,提出各自主张和立场,或针对其他议员的观点提出正面或反面的证据,或支持或反对的理由,他们相互争辩或支持,站队和拉帮结派……,最终,某种决议会从中产生,它就像动作信号输出到运动或内分泌中枢,变成行动。(我在《沐猿而冠》附录〈何为理性动物〉中详细展开了这个国会隐喻)
语义界面的存在使得高级意识功能在松耦合前提下实现模块化,其后果是,我们的各种认知技能与知识构件可以各自独立发展,并通过语义界面相互合作,如此一来,我们的理性能力和知识体系便有了一个极为广阔的积累性发展空间。
让我解释一下这是什么意思。
所谓理性,并不是一个单一算法,而是由众多独立平行构件(算法)组成,比如,我们或许有一个类似三段论推理机的模块,或许有一部贝叶斯推断机,或有一个数数模块,一个四则运算模块,还有许多危险探测装置(恐高,幽闭恐惧,密集恐惧,蛇形恐惧,是最基础的几种),以及机会探测装置(有人看见美女就两眼放光,有人则对赚钱机会有着敏锐嗅觉),这些探测装置并不试图对观察对象整体建模,而只对某些特征线索敏感,但它们都是我们理性的组成部分,这些模块既相互竞争,也会相互合作与强化。
设想我们的头脑就是一部正在被生活经历所训练的人工智能系统,它不是作为一个整体而囫囵学习的,各模块、各组件有着自己独立的学习进程,每个只专注输入信息中某个特定侧面或某些特征线索,每个也有着自己不同的模型骨架(比如这是部贝叶斯推断机,那是个加法装置,还有个是逻辑矛盾探测器……)。
这种模块专业化使得系统具有一种内在保守性,不会随训练数据的变化而过度摆动,因为每个模块的输入输出和反馈回路都被其“专业兴趣”局限住了,会自动忽略训练数据中的其他方面;这一点背后的原理是世界之可理解性假设:世界的某些局部与侧面一定比其整体更稳定、更一致、更少变,否则世界便是不可理解的;经验也告诉我们,专家与非专家的一个区别就是,前者的观点更少随近期事态变动而摇摆。
举个例子,虽然我不懂围棋,但我相信,假如我们修改围棋规则,把棋盘从19x19换成21x21,顶尖棋手们的专业经验可能很大部分报废了,但也会有很多仍然有用,可是对于一个只会囫囵学习的智能系统,其经验将完全报废,一切必须从头开始。
模块的内在保守性是可积累发展的前提,每个模块保持大致稳定,各自随训练继续而精炼(即框架稳定的同时在边际上改进),同时系统时不时添加一些新模块,令其认知能力随可用模块增长而不断升级增强,变得越来越全面、老练和精到。
再举个例子,某人若是对赚钱机会有着敏锐嗅觉,他有潜力成为一位好投资者,可是如果他懂一点基础会计知识,会一点财务精算,那就有望成为更好的投资者,如果他还受过一些风险控制训练,那就更好了,重要的是,机会嗅探,财务精算,风险控制,这三个模块最好是独立存在,这样的好处是:1)它们本身会更稳定持久,持续精炼,2)它们可以被分别传授和训练,因而在缺乏实景训练数据时也可能习得,3)它们可以实现跨系统分工与合作,比如人际分工。
让我一点点说。
假如风控模块不是独立的,而是以无从辨认的形态分散于系统各处,和其他东西纠缠在一起,它就无法稳定,在繁荣期的训练数据影响下,风控标准会迅速降低,因为更有纪律的风控倾向得不到多少正面反馈,反之,在萧条期,系统的风控倾向又会摆向另一个极端,这种大幅摇摆使得它无法实现可持续积累和精炼(现实中很多投资者头脑中的风控模块正是如此)。
(为了说明模块独立性为何会带来稳定持久性,我想再多说几句,一个输入输出和反馈回路被充分局限住的模块,常常能达到一种近乎于(但不完全是)自我激励的状态,它能为自己找事做,并从结果中得到满足,因而总是自得其乐的沉醉于其中,比如男人头脑里有一个腰臀曲线探测器,从实用功能上说,这是用来探测生育期女人的裸露躯体的,这个探测器可以在输入极为有限的情况下持续自我训练和激励并乐在其中,这也是某些色情图片如此有吸引力的缘故所在,尽管在现代传播条件下该模块的这种表现其实根本得不到任何现实回报,如果系统是囫囵学习的,没有模块独立性,当代男人对色情图片的兴趣早就丧失殆尽了,所以,如果你希望系统里有一个忠实勤勉持久敏锐的风控模块,它最好像男人的腰臀曲线探测器那么自主存在和自我激励,每一次都会为自己能察觉任何风险线索而兴奋不已。)
假如风控模块不是独立的,或者不是通过语义界面与其他模块交互的,它也无法在系统间被传授,传授的好处是可以免去实景训练的高昂成本,哪怕效果差一些(因为当经验通过语义界面传输时,难免会丢失一些信息,所谓默会知识,就是那些无法穿透语义界面的知识),往往也是值得的,如果你读几本书或听一席话就能学到一些基本的风险识别技能,哪怕只是一点点,得失比也比在市场浪涛中亲身获取这些教训高多了。
假如风控模块不是独立的,或者不是通过语义界面与其他模块交互的,它也无法在系统间实现分工合作,一位投资者就无法将风控事务委托给他人完成,与此类似的任何松耦合分工合作都不可能发生,虽然仍会有一些其他形式的合作,比如对默会知识的手把手传授,但这种合作注定只能以极小的规模发生,因为它是紧耦合的。
人类认知系统跨出的一大步,就是将语义界面向外开放了,并且通过人际协调博弈而形成共同接受的语义界面;自然语言的出现,使得语义界面不仅是系统内各模块间交互的界面,还成了系统间交互的界面,正是这一步促成了人类认知与知识系统的另一次元系统跃迁,它创造了大规模分工合作体系,大型复杂社会,以及文明。
依我的有限了解,当前深度学习派人工智能所走的路线,看起来和语义界面路线是背道而驰的,深度神经元网络(DNN)虽然是分层的,但每个层次的输出到底是什么,是说不清楚的,或者说,是没有语义化的,也正因此,这种系统的学习结果是无法被检查、解释和改动的,整个一黑箱,你没办法把它打开,看看其中那条逻辑不对劲,能不能改一改,不可能,天地一笼统。
(再多解释几句,语义化的意思是,至少在模块或层次间交互的那些地方,每个神经元的特定输入输出值,必须有稳定持久的含义,唯如此,其他模块/层次才能持久的知道该如何与它互动,如何利用它输出的值,在想给它施加某种影响或希望从它那里引出某种结果时,该如何给它喂输入值,这些不能说不清楚,哪怕你凭空发明一个概念也好,那也算说清楚了(正如许多知识领域在发展过程中都会发明新概念),因为凭空发明的新概念只有在初次使用时才是不清楚的,随着它被反复使用,意思就清楚起来了——输出者在什么情况下会输出它,输入者在输入它后会做点什么——此后,只要交互各方保持对该语义约定的大致遵守,语义便稳定了下来。)
而且,好像也没有什么机制让DNN能够自发形成自主独立持久的模块(这一点和上一点其实互为因果),它比完全不分层的囫囵联结主义当然好多了,但也只好那么多,所以我的感觉是,尽管它在一些领域取得了耀眼突破,但很快会碰上极限。
话说回来,语义界面也不是没有代价,界面就是一种契约,语义界面是基于一套概念框架的一组契约,不仅契约本身是一种束缚,概念框架在帮助我们认识世界的同时,也约束了我们的认知可能性,不妨称之为范式锁入,虽然一个足够灵活开放的系统会不时引入新概念和新模块(在很多情况下这是通过类比/隐喻从旧概念中衍生出来的),但至少在特定时期内,特定任务域中,这种约束会妨碍我们的认知潜力,让我们难以跳出框架思考。
所以,在某些情况下,不受概念框架约束的囫囵学习可能是有用的,它能帮助我们发现一些在现有概念框架中难以言喻名状的情况,或许是某种风险,或者某种机会,或某种门道机巧,说不清楚它是什么,但它确实在那里,或确实管用;然后,这种发现如果被证明足够有价值,可能继而在采用语义界面的系统中促发一轮观念更新运动,一套新的概念框架被创造出来,就像库恩式科学革命中的情形。
总之,深度学习派确实取得了不小成就,其应用潜力或许也不小,但无论如何,沿这条道路大概走不到类人智能的程度。
【2022-01-08】
当有人向你陈述一件事情,你做出肯定回应时,可能说 right,或 correct,或 true,这几年听下来,几种之间还有些微妙差别,下面是我的理解,不一定对,欢迎纠正和补充,
1)correct:肯定对方的陈述为真,而且准确,但这一肯定不包含任何价值或道德意味,或者对陈述内容的态度,比如对方说有关某类事情法律是如何如何规定的,你说 correct,只表示你认可他对有关法律规则的陈述是准确的,丝毫不暗示你对这一规则之合理性的态度,而用 right 或 true 就可能有点含糊,可能会被误以为你表达了某种(more...)
8975
【2022-01-08】
当有人向你陈述一件事情,你做出肯定回应时,可能说 right,或 correct,或 true,这几年听下来,几种之间还有些微妙差别,下面是我的理解,不一定对,欢迎纠正和补充,
1)correct:肯定对方的陈述为真,而且准确,但这一肯定不包含任何价值或道德意味,或者对陈述内容的态度,比如对方说有关某类事情法律是如何如何规定的,你说 correct,只表示你认可他对有关法律规则的陈述是准确的,丝毫不暗示你对这一规则之合理性的态度,而用 right 或 true 就可能有点含糊,可能会被误以为你表达了某种赞许,
其次,说 correct 的人往往认为自己在判断这一准确性上比对方更有资格,一种常见场景是老师对学生的答题,如果完全答对,就说 correct,
这种资格可能来自专业经验,也可能是因为自己恰好比对方更有机会了解所谈论的事情,
还有,correct 所针对的陈述,其真假和准确性往往是容易查明的,没有多少可争议余地的,true 就不是这样,比如你相信一项指控,就说它是 true,而不能说 correct,因为指控是否成立总是可争议的,
2)right:可以用来回应纯客观陈述,但也可以用来主观陈述,一种观点或立场,也就是表达赞许,此时,它当然就包含价值或道德意味了,所以,容易混淆的情况下,最好慎重选择 right 还是 correct,
同时,说 right 的人不暗示自己在判断这件事情对错上比对方有任何优势,
3)true:true 表面上看好像很客观,似乎只能针对客观陈述,但仔细琢磨,它其实常常(虽然并不总是)包含一种二阶道德意味,说它是二阶,意思是这一道德意味并不针对陈述内容本身,而是针对陈述行为,比如你说某一指控是 false,你并未暗示对所指控行为的任何道德判断,但可能暗示了对指控者的某种评判,因为他做出了虚假指控,反之,如果你说指控为 true,则表达了某种赞许,
true 这一道德意味需要从欧洲人的基督教背景中理解,在基督教传统中,truth 向来不是一种纯客观的东西,探索和坚持 truth 总是在道德上得到赞许的,持有或坚持 false 则反之,
好像是这样,
辉格
@ 2022-03-26 20:09
阅读(4,253)
评论
分类:未分类
【2021-12-27】
@whigzhou: 看过《降临》 我的评分:★★ 开头半小时挺让人振奋的,被吊起了胃口,结果很快滑入了装神弄鬼瞎糊弄的老套,又被骗了一次
@whigzhou: 如何与外星人对话其实是个很有意思的主题,这是奎因难题的极端版本,
和语言完全不通的陌生土著对话,理论上看起来好像很难,实际上并不难,受过训练的人类学家通常两三年就可以掌握一门完全陌生的语言(所谓完全陌生就是没有任何已知亲缘语言),
这是因为哪怕再陌生奇异的土著,也是生活在地球上的智人,与我们共享着太多太多的东西,比如表情系统,五六种基本表情是全球一致的,手势系统虽然更多样一些,但其中最(more...)
8959
【2021-12-27】
@whigzhou: 看过《降临》 我的评分:★★ 开头半小时挺让人振奋的,被吊起了胃口,结果很快滑入了装神弄鬼瞎糊弄的老套,又被骗了一次
@whigzhou: 如何与外星人对话其实是个很有意思的主题,这是奎因难题的极端版本,
和语言完全不通的陌生土著对话,理论上看起来好像很难,实际上并不难,受过训练的人类学家通常两三年就可以掌握一门完全陌生的语言(所谓完全陌生就是没有任何已知亲缘语言),
这是因为哪怕再陌生奇异的土著,也是生活在地球上的智人,与我们共享着太多太多的东西,比如表情系统,五六种基本表情是全球一致的,手势系统虽然更多样一些,但其中最基本、也是最有价值的指示手势(比如以手指物),也是通行的,
同样重要的是,任何智人群体都和我们共享着一些基本的欲望,动机,情感,恐惧,需求,而这是建立对话的极好条件,不仅如此,甚至我们恐惧和欲求的内容也有很大程度的重合,所以,在那些基本动机非常凸显的场景中,只需要少量提示,对话者便可猜到个大概,而有了这个起点,沟通便可逐渐深入更抽象更微妙更精致的层面,
可是外星人就不同了,共享的东西太少,因此对话双方能做出的有关对方的假定也太少太弱了,所以问题的关键是,如何寻找一个最小共同基础,从那里开始,进行有意义的对话,并且找出一条逐渐深入的路径,
好在我们和他们毕竟还是共享着一些东西:身处同一个宇宙,共同了解一些基本的数学和物理事实,还有至少一部分天文学事实,
依我看,容易的入口是数学,可以从自然数开始,假定一个高级文明拥有自然数系统应该是安全的,首先用点阵图教会他们阿拉伯数字和十进制系统,然后是四则运算符号,最后把这些概念与符号对应到英语单词上去,
(一个可能的质疑是使用什么媒介来演示,不过既然 Arrival 已经假定对方拥有视觉系统,其频谱至少覆盖了人类可视光谱,那就略过这一点)
然后是天文学事实,他们既然来到了地球,对太阳系应该足够了解了吧,那就把太阳系模型展示给他们,顺便教会一套术语和概念,能跑到地球上的外星人应该不至于笨到看见太阳系模型还认不出来吧?
然后你就可以给他讲讲牛顿物理学了,当然这些理论对他可能是小儿科,但重点在于沟通,而不是教育,所以小儿科是个优势,
到此时,你们已经有了一套足以进行简单交流的符号系统了,但这些还远不足以用来解释人类生活,那需要另一套十分不同的概念,处于另一个层次上,
好在他们也是生命,只要是生命,就与我们共享着一些最基本的东西,比如生存竞争,对抗,能量获取,资源局限,策略,计划,对未来的预期,成功,失败,挫折,优势,匮乏,丰裕……
要向外星人解释这套概念,最佳入口是对抗性游戏,电影里确实提到了有人以麻将来教对方,但只是一笔带过,完全没有展开,
而且麻将不是个好的起点,规则太杂乱,围棋更好,从棋牌类,格斗类,竞技类,逐渐扩展到逼近现实生活的角色扮演类,是教会他们有关人类生活的概念系统的很好路径,
可惜,通过拒绝承认我们与外星人共享任何数学与物理学基础,电影避开了所有这些智力挑战,仅仅在卖弄了几个语言学术语之后,便迅速滑入装神弄鬼的老套,
辉格
@ 2021-10-30 20:40
阅读(3,476)
评论
分类:未分类
【2021-10-30】
@whigzhou: 昨天和几个朋友在外面吃饭,邻桌有个人跑过来攀谈,讲的还蛮起劲,一个人讲了十几分钟,等他走了之后,认识他的那位朋友悄悄告诉我,他是个聋子,而且聋的很彻底,我很惊讶,如果一个人彻底耳聋,他怎么会在没有反馈的情况下把自己的发音控制的那么好,以前我也见过聋子说话,都明显控制不好自己的声音,我朋友说,他在胸部植入了一个装置,能让他感知自己的胸腔共鸣,具体怎么起作用的不太清楚,我从未听说过有这样的装置,搜了一下也没找到线索,
(more...)
8886
【2021-10-30】
@whigzhou: 昨天和几个朋友在外面吃饭,邻桌有个人跑过来攀谈,讲的还蛮起劲,一个人讲了十几分钟,等他走了之后,认识他的那位朋友悄悄告诉我,他是个聋子,而且聋的很彻底,我很惊讶,如果一个人彻底耳聋,他怎么会在没有反馈的情况下把自己的发音控制的那么好,以前我也见过聋子说话,都明显控制不好自己的声音,我朋友说,他在胸部植入了一个装置,能让他感知自己的胸腔共鸣,具体怎么起作用的不太清楚,我从未听说过有这样的装置,搜了一下也没找到线索,
另外,他还专门受过读唇训练,大致能猜到别人在说什么,
感觉挺神奇的,
@tertio: 发音的最直接反馈其实是发音部位的感觉,次级反馈才是声音。“读唇”能力是个线索,说明他擅长模仿他人的嘴部动作(内部的舌位是否正确,起初应该靠别人纠正,然后自己记住正确的发音感觉)
@whigzhou: 嗯,这么一说好像就通了
辉格
@ 2021-10-05 18:21
阅读(1,608)
评论
分类:未分类
【2021-10-04】
翻译唐诗是项不可能的任务,不过,你若是非要这么做,我倒是有个(依我看最不坏的)办法,就是逐字翻译,不要管句法,就一个字一个字的对,其实读者能理解,而且还一定程度上保留了韵味,
随便试两句:
内库烧为锦绣灰
Inner Stock Burnt To Silk Embroidery Ash
天街踏尽公卿骨
Heaven Steet Trample All Lords Ministers Bone
我觉得英国人应该看得懂吧,至少半懂似懂吧,那就够了,
@whigzhou: 再试几句,好像确实不错,
竹帛烟销帝业虚
Bamboo Silk Smoke Diminished Imperial Glory Hollow
关河空锁祖龙居
Fortress Trench Vainly Fo(more...)
8860
【2021-10-04】
翻译唐诗是项不可能的任务,不过,你若是非要这么做,我倒是有个(依我看最不坏的)办法,就是逐字翻译,不要管句法,就一个字一个字的对,其实读者能理解,而且还一定程度上保留了韵味,
随便试两句:
内库烧为锦绣灰
Inner Stock Burnt To Silk Embroidery Ash
天街踏尽公卿骨
Heaven Steet Trample All Lords Ministers Bone
我觉得英国人应该看得懂吧,至少半懂似懂吧,那就够了,
@whigzhou: 再试几句,好像确实不错,
竹帛烟销帝业虚
Bamboo Silk Smoke Diminished Imperial Glory Hollow
关河空锁祖龙居
Fortress Trench Vainly Fortifying Ancestral Dragon Residence
坑灰未冷山东乱
Pit Ash Hasn't Cooled Mountain East Uprising
刘项原来不读书
Liu Xiang Turn Out Don't Read Books
@whigzhou: 竟然押韵了~
千山鸟飞绝
Thousands Mounts Birds Flying Gone
万径人踪灭
Myriads Tracks Human Trace None
孤舟蓑笠翁
Solo Canoe Cape Hat Greybeard
独钓寒江雪
Alone Angling Chilly River Snow
【2021-10-05】
@whigzhou: 每日一湿~
两个黄鹂鸣翠柳
Two Birds Yellow Orioles Singing Green Willow
一行白鹭上青天
One String White Herons Soaring Blue Sky
窗含西岭千秋雪
Window Frames West Ridges Millennium Aged Snow
门泊东吴万里船
Portal Moors East Gouwu Thousand Leagues Boat
辉格
@ 2021-08-25 10:09
阅读(1,371)
评论
分类:未分类
【2021-08-25】
Razib Khan 又一篇好文章,讲的是匈牙利人的奇特历史,
匈牙利语属于乌拉尔语系乌戈尔语族,该语族的另外两个群体是汉特人和曼西人,远在匈牙利平原几千公里之外的西伯利亚,

可奇怪的是,当今匈牙利人在遗传特征标记上和他们的西伯利亚表亲毫无关系,而和他们目前的东欧邻居几乎看不出区别,
一个群体怎么会在保持其语言的同时丢失了全部遗传特征?
最近十几年古DNA测序技术发展神速,所以有人就从10世纪的马扎尔人墓葬中提取了DNA,发现其中上层精英的DNA确实有显著的东亚成分,而同地(more...)
标签:人类 | 历史 | 族群 | 语言 | 遗传
8780
【2021-08-25】
Razib Khan
又一篇好文章,讲的是匈牙利人的奇特历史,
匈牙利语属于乌拉尔语系乌戈尔语族,该语族的另外两个群体是汉特人和曼西人,远在匈牙利平原几千公里之外的西伯利亚,

可奇怪的是,当今匈牙利人在遗传特征标记上和他们的西伯利亚表亲毫无关系,而和他们目前的东欧邻居几乎看不出区别,
一个群体怎么会在保持其语言的同时丢失了全部遗传特征?
最近十几年古DNA测序技术发展神速,所以有人就从10世纪的马扎尔人墓葬中提取了DNA,发现其中上层精英的DNA确实有显著的东亚成分,而同地区的平民遗骸则没有,
所以当初侵入匈牙利平原的马扎尔人确实来自东方,问题是他们的遗传特征跑哪儿去了?
一种解释是当初的征服者群体规模非常小,所以东方成分被稀释了,统计上看不出差异,
问题是,历史上许多案例证明,小规模征服群体很难保持其母语,特别是没有教育传统也没有成文经典的蛮族,比如侵入伊比利亚和北非的汪达尔人,语言上一丝痕迹也没留下,
所以,保留了其母语的马扎尔人当初必定是个大群体,而且女性比例得足够高,如果娶的都是当地女子,母语难免丢失,因为在没有教育系统的情况下,婴儿主要跟母亲学母语,
Razib Khan 认为,这可能因为,自从马扎尔贵族皈依基督教后,匈牙利成了基督教世界的东方门户,而匈牙利平原又是东方入侵者的天然指向(因为它是欧亚草原带的西端),所以长期承受着军事上的重压,特别是在蒙古和奥斯曼的入侵中,其贵族阶层屡次被大比例消灭,最终从遗传统计上消失,
一般而论,武士贵族是高风险高回报的生态位,通常相对于平民都有着较大遗传优势,但也有不幸赌输了的,马扎尔贵族算是一例,
【2021-08-20】
想到一个问题,有没有什么游戏是可以让用户通过脚本程序来玩的?就是说游戏提供一种脚本语言,用户可以用它来编写一系列脚本,每个脚本包含一个带条件分支的动作序列,具体玩的时候可以调用这些脚本,也可以再写一个大脚本让它自己去调用这些小脚本,于是就成了一个 bot,
我不玩游戏,所以毫无线索,
当然,脚本不仅可以用来设计动作序列,还可以让玩家设定自己的资源分配策略、行事风格和交往原则,诸如此类,
一个明显的好处是,这可以让一个游戏玩出其设计者难以预料的无穷花(more...)
8775
【2021-08-20】
想到一个问题,有没有什么游戏是可以让用户通过脚本程序来玩的?就是说游戏提供一种脚本语言,用户可以用它来编写一系列脚本,每个脚本包含一个带条件分支的动作序列,具体玩的时候可以调用这些脚本,也可以再写一个大脚本让它自己去调用这些小脚本,于是就成了一个 bot,
我不玩游戏,所以毫无线索,
当然,脚本不仅可以用来设计动作序列,还可以让玩家设定自己的资源分配策略、行事风格和交往原则,诸如此类,
一个明显的好处是,这可以让一个游戏玩出其设计者难以预料的无穷花样,当然,对有些游戏商,这可能是缺点,可是市场那么大,总有些不会这么想吧?
想象一下几百万持续进化中的脚本在一起玩MUD,会怎么样?
当然,这个需求也不仅限于游戏,比如社交网,假如我能用一个脚本来设置我的时间线,或者筛选关注对象,或者设置自动洗粉策略,那就太好了,
总之,一个系统的用户若只能通过按钮菜单与之互动,就太单调了,要弄出更有意思的东西,需要一种能够表达复杂逻辑的结构性对话方式,脚本是现成的方案,
一般而论,理想情况下,软件系统的标准用户界面就应该是脚本语言,其他界面都是它的非完备替代品
辉格
@ 2021-07-08 16:34
阅读(1,236)
评论
分类:未分类
【2021-07-08】
@tertio: 好久不编程了,这几天用python编了几个命令行程序做点课程文件的自动处理,省了一堆手动操作。python的工具箱的确全,写起来省事。顺便想起来一个例子,可以用来展示一种乾坤颠倒的编程方式,例子虽然非常小,但说明这个概念足够了。
假如我想调用一个函数,这个函数的作用是“计算一个列表的长度”,但是我不知道在哪个库里,也不知道叫啥名字,但是我可以定义它的功能:
LengthOfList([])->0
LengthOfList([a,b,c])->3
LengthOfList([1,34,8,9,0])->5
也就是说,我定义了一个名字,然后定义了它的输入-输出测试,然(more...)
8698
【2021-07-08】
@tertio: 好久不编程了,这几天用python编了几个命令行程序做点课程文件的自动处理,省了一堆手动操作。python的工具箱的确全,写起来省事。顺便想起来一个例子,可以用来展示一种乾坤颠倒的编程方式,例子虽然非常小,但说明这个概念足够了。
假如我想调用一个函数,这个函数的作用是“计算一个列表的长度”,但是我不知道在哪个库里,也不知道叫啥名字,但是我可以定义它的功能:
LengthOfList([])->0
LengthOfList([a,b,c])->3
LengthOfList([1,34,8,9,0])->5
也就是说,我定义了一个名字,然后定义了它的输入-输出测试,然后系统通过一番测试,发现有这么个函数,可以实现这样的输入-输出,于是就给定位了。
然后呢?然后我就去用它了,而且按自己给的名字去用,而不是按它本来的名字,还有一种可能,这个函数并不存在,是系统自己凑出来的(至于凑的能力,一开始肯定很弱)
这里最有趣的一点就是,如果定位的是已经存在的库函数,而系统升级到某个版本之后,把库函数名字改掉了。那么我这段代码还能用吗?
居然还能用,因为定位的这个函数是系统自己测试出来的,而不是直接按名字匹配。
这种解耦已经非常彻底了。
如果系统升级到某个版本,库函数功能发生了变化,导致输入-输出不成立了,那么这段代码还能用吗?
还是能用。
因为系统是按输入-输出的功能去定位的,满足功能的才能定位,如果实在找不到,就是给出一个失败的结果。
有人也许说,有限的输入输出对,对功能的定义不完备,有可能出错。
这不是问题,编程的任何环节都可能出错,这种错误并不显得更突出。
@whigzhou: 我说不出为什么,但我的直觉是,这种方法会陷入类似于当年单层神经元网络曾陷入的困境
@whigzhou: 略微复杂一点的映射关系,恐怕都无法用少数几个输入输出对来表示
@whigzhou: 或许可以通过一组行为特征来表示某种模式,但那不是输入输出对
@whigzhou: 依我看,要实现这种解耦,不如把函数调用改为消息交换,想调用某个功能的地方,直接朝系统喊一声:我需要如此这般的帮助,谁来帮我啊
@tertio:最复杂的就是直接给出整个程序的需求,当然做不到,退而求其次,可以分解为更加简单的模块,降低复杂性,直到能猜出来为止。
@whigzhou: 你的思路,以我理解,其实就是想用摹状词代替专名来指称一种映射关系,但摹状的摹法有很多,输入输出对并不是好摹法
辉格
@ 2021-06-08 19:49
阅读(1,580)
评论
分类:未分类
【2021-06-08】
最近发现,mom 这个词的用法有点特别,假如一个大人问一个小孩 where’s mom? 或一个小孩问他妹妹同一问题,所指为谁是很清楚的,也不需要任何限定词,这大家都很熟悉,毫无问题,
我原先的理解是,这里只是隐藏着一个省略了的限定词,因为它从上下文明显可以推知,没必要保留,
可是最近几次我注意到的情况似乎有所不同,跟牌友们聊天时,他们常会说出状如 ‘mom gave me this.’ 之类的话,这里的 mom 也未加任何限定词,指的显然是说话者自己的妈,这让我略感意外,因为若是把 mom 换成 (more...)
8651
【2021-06-08】
最近发现,mom 这个词的用法有点特别,假如一个大人问一个小孩 where's mom? 或一个小孩问他妹妹同一问题,所指为谁是很清楚的,也不需要任何限定词,这大家都很熟悉,毫无问题,
我原先的理解是,这里只是隐藏着一个省略了的限定词,因为它从上下文明显可以推知,没必要保留,
可是最近几次我注意到的情况似乎有所不同,跟牌友们聊天时,他们常会说出状如 ‘mom gave me this.’ 之类的话,这里的 mom 也未加任何限定词,指的显然是说话者自己的妈,这让我略感意外,因为若是把 mom 换成 mother 的话,肯定是有限定词的,比如 my mother gave me this.
查了一下,原来,在这种不加限定词的用法中,mom 是被当作专有名词对待的,就像人名一样,所以应该大写,当被用作普通名词时,就要加限定词,小写,
所以这并不只是省略问题,因为若是以可以推知论,mom 跟 mother 没区别,
这里是柯林斯的几个例句:
He misses his mum.
Mum and Dad are coming for lunch.
Don't worry, Mum.
You're about to become a mum.
大小写区分的很清楚,而 mother 和 father 总是被当作普通名词,
grandma 和 grandmother 也有类似区别,
辉格
@ 2021-06-05 18:30
阅读(1,954)
评论
分类:未分类
【2021-06-05】
最高法院的案子里经常出现阅读理解题,前天裁决的 Van Buren v. United States 的是个很好的例子,
此案起因是佐治亚一位警察收了贿赂帮人在州刑事数据库里查询一个车牌主人是不是警方卧底,
争议焦点是 Computer Fraud and Abuse Act (CFAA) 所规定的越权访问(exceeds authorized access)的涵盖范围,CFAA 对越权访问的定义是:
accessing a computer with aut(more...)
8638
【2021-06-05】
最高法院的案子里经常出现阅读理解题,前天裁决的 Van Buren v. United States 的是个很好的例子,
此案起因是佐治亚一位警察收了贿赂帮人在州刑事数据库里查询一个车牌主人是不是警方卧底,
争议焦点是 Computer Fraud and Abuse Act (CFAA) 所规定的越权访问(exceeds authorized access)的涵盖范围,CFAA 对越权访问的定义是:
accessing a computer with authorization and using such access to obtain or alter information in the computer that the accessor is not entitled so to obtain or alter.
重点是这句话里那个 so,要是没这个 so,意思就很清楚,被告有权访问他查询的这个信息,所以完全没毛病(至于收钱把信息透露给别人是不是犯了其他法,是另一码事,与本案无关),可是一 so 就麻烦了,so 的究竟是什么?
Barrett 写的多数方意见认为,so 的只是手段,比如,假设查询这种数据有两种手段:1)去档案室翻资料,2)用电脑在线查,如果某人只被授权使用其中一种,那么他使用另一种手段查询的做法便是越权访问,
少数方不同意这种狭窄解读,认为 so 的是整个行动情境,包括行动者的意图,这样的话,*收了贿赂后以非法泄露为目的而查询* 就被排除在授权访问之外了,
【2021-05-23】
George Lakoff 那本《我们赖以生存的隐喻》现象描述的还挺好,可是他基于其上的理论建构(大约是该书的后1/3-2/5)就是一通胡说八道,隐喻原本是帮助我们思考和表达的工具,被他说的好像成了困住我们头脑的牢笼,
琢磨了一下,让他误入歧途的关键,是他缺乏动态和进化的视角,他的叙述中完全看不到隐喻用法的变化过程,于是就会以为我们永远会停留在当初首次运用一种隐喻时的那种观念状态,
而实际上,隐喻往往只是个脚手架,最初当人们面临一种新事情,而头脑中缺乏适当的概念结构来思考它,语言中也缺乏相应的语义元素来表达它,便借来一种旧结构,凑合着用,即为隐喻,
(more...)
8625
【2021-05-23】
George Lakoff 那本《我们赖以生存的隐喻》现象描述的还挺好,可是他基于其上的理论建构(大约是该书的后1/3-2/5)就是一通胡说八道,隐喻原本是帮助我们思考和表达的工具,被他说的好像成了困住我们头脑的牢笼,
琢磨了一下,让他误入歧途的关键,是他缺乏动态和进化的视角,他的叙述中完全看不到隐喻用法的变化过程,于是就会以为我们永远会停留在当初首次运用一种隐喻时的那种观念状态,
而实际上,隐喻往往只是个脚手架,最初当人们面临一种新事情,而头脑中缺乏适当的概念结构来思考它,语言中也缺乏相应的语义元素来表达它,便借来一种旧结构,凑合着用,即为隐喻,
可是,人不会永远停留在这种状态,当这种新事情反复出现,反复被谈论,围绕着它的那套概念结构和语义元素就会丰满成熟起来,稳定下来,哪怕这些元素最初都是借来的,用它们所构造的这个新概念也会逐渐获得独立的语义地位,此时,隐喻就变得越来越不像隐喻,*喻义*和*本义*之间的关系逐渐脱离,最终成为一个词汇的两个*义项*,一旦达到这种状态,人们在说这个词表达后一种意思时,就不再会想到它最初的本义了,这是词义衍生的一般过程,
举个例子,solve 这个词,本义是解开一个绳结(我这个词源学说法未必正确,姑且如此假定),最初,当有人想要表达*解决一个难题*这个意思时,缺乏适当概念可用,于是借用了解开绳结这个旧意象,可是,随着语言的发展,围绕各种难题的谈论持续进行,solve的这种新用法的意思无须再借助其本义即可得到理解和运用,于是它成了一个独立义项,此时,当人们说 solve the problem 时,头脑里已完全不会出现绳结的意象,
可是,在 Lakoff 叙述中,你完全看不到此类演变过程,似乎只要还在用 solve 这个词,说话者就始终被绑在那个绳结意象上,这显然是错的,类似例子不胜枚举,
缺乏动态视角还引出了另外两个问题:
1)他把隐喻在我们观念系统中的影响看作单向的,
2)他看不到隐喻的反复运用会推动抽象过程的发生,
以 big 为例,当人们最初说*这工程很大*,*这公司很大*时,显然是在用物体隐喻,此时,我们有关物体的观念自然会影响我们思考这些无形物的方式,此时,隐喻的影响是确实是从喻主指向被喻物的,
可是,事情并不会永远停留在这状态,在我们反复谈论各种无形物的大小之后,*大*这个词的语义被丰富了,其运用范围被扩展了,人们发现,不妨将它用于各种可度量的维度,力气可以很大,野心可以很大,自我也可以很大,
这一过程引出了两个结果:
1)我们逐渐形成了一个抽象的*大*概念,适用于任何可度量可比较的东西,
2)这一抽象观念会反过来影响我们对各种具体*大*(包括最初的物体之大)的用法,于是我们有了一些全新的说法:他身体很大,自我却很小;他个头很小,野心却很大;
注意,在抽象发生之前,我们会直接说*他很大*,而不需要加上*身体*或*个头*这样的维度,而抽象发生之后,我们意识到体型只是描绘一个人之大小的各种维度之一,而一旦意识到这一点,我们思考和谈论它的方式也就改变了,也就是说,1)隐喻的影响是双向的,2)隐喻会推动抽象化
【2021-05-08】
这几年 podcasts 听得多,发现有两种说话风格,一种语速很快且非常流畅,而且面对访谈者的每个问题,都能作出极快的反应,给我的感觉是,从说话者口中喷涌而出的这些语句流是他脑子里早就有了的,因而在此过程中几乎没有任何思考活动,典型代表是 Bryan Caplan,
另一种语速很慢,经常停顿,卡住,或把一句没理顺的话换个方式再说一遍,你能感觉到他在整个对话过程中一直在思考,哪怕被问到的不是什么新问题,也或多(more...)
8605
【2021-05-08】
这几年 podcasts 听得多,发现有两种说话风格,一种语速很快且非常流畅,而且面对访谈者的每个问题,都能作出极快的反应,给我的感觉是,从说话者口中喷涌而出的这些语句流是他脑子里早就有了的,因而在此过程中几乎没有任何思考活动,典型代表是 Bryan Caplan,
另一种语速很慢,经常停顿,卡住,或把一句没理顺的话换个方式再说一遍,你能感觉到他在整个对话过程中一直在思考,哪怕被问到的不是什么新问题,也或多或少会触发一些新的思考活动,典型代表是 Freeman Dyson,我听到几次他被提问后沉默了十几秒钟,然后说 I don't know.
这两种人还有个区别,前者无论被问到什么问题,好像都会冒出一串话,感觉就像被摁了一个按钮,储存在相应位置的语句流就跳出来了,后者对问题的反应则长短差异很大,可能短到只有一个词,而这往往不符合询问者的期待,因为访谈者问问题其实不是只想听你的答案,而是想用问题勾引你多说一点,碰到这种情况,他只好像挤牙膏那样再一点点追问,
我发现我喜欢的受访者大多是第二种
辉格
@ 2021-04-18 20:03
阅读(1,553)
评论
分类:未分类
【2021-04-18】
@同声翻译樱桃羊 我特马最烦一件事:给我留言或私信说“你们这个行业迟早被机器取代”云云。
@tertio: 即使是文本的机器翻译,bug也多得很,哪怕99%都翻译得很好,最后的1%才是大Boss
@whigzhou: 翻译困难的关键是,最佳翻译实际上需要掌握两个文化的全部公共知识(甚至还有一些不那么公共的知识),这是个浩大工程,哪怕AI有着最完美的学习机制,向它饲喂恰当材料也是个艰巨而漫长的任务
@whigzhou: 这一困难可帮助我们理解奎因的整体主义
@whigzhou: 而且语言演变(more...)
8554
【2021-04-18】
@同声翻译樱桃羊 我特马最烦一件事:给我留言或私信说“你们这个行业迟早被机器取代”云云。
@tertio: 即使是文本的机器翻译,bug也多得很,哪怕99%都翻译得很好,最后的1%才是大Boss
@whigzhou: 翻译困难的关键是,最佳翻译实际上需要掌握两个文化的全部公共知识(甚至还有一些不那么公共的知识),这是个浩大工程,哪怕AI有着最完美的学习机制,向它饲喂恰当材料也是个艰巨而漫长的任务
@whigzhou: 这一困难可帮助我们理解奎因的整体主义
@whigzhou: 而且语言演变非常快,要跟上时代,这部机器必须始终*生活*在这两种文化中,持续获得有效输入
@whigzhou: 而且这两种文化都分衍出了很多次级文化,有着不同的公共知识集,同一句话,收银员对顾客说,和物理学家对另一位物理学家说,意思可能完全不同
@whigzhou: DeepL 算是我见过最佳翻译软件了,可是翻译稍微偏门一点的东西还是不行,不忍卒读,我猜原因也不复杂,就是如果目标语种里与原文所谈论主题相关的语料太少,就不可能译的好,想想看,如果某个学科对中文世界是全新的,当一位肉人翻译尝试该学科的第一本书时,很多表达方式都需要他从头发明,要做好这件事所需要的知识量,远远超出我们通常对一位翻译所持的期待
@tertio:如果有好的模型,获取数据倒是不难,目前的难点还是基本模型有问题。
@whigzhou: 当前的模型肯定是偷懒走捷径的,但获取数据也不容易,问题不在量,而是切题性,最好的获取方法是让机器伪装成一个肉人,有着肉人一样的欲望和本能,过肉人一样的生活,像肉人那样与肉人交流
@whigzhou: 本能,欲望,地位,个体经历,关系史,社会情境,都构成了上下文的一部分,都会影响一条输入的含义
@tertio:这就触及到根本问题了,机器和人没有真实的互动只靠观察能否真正学会一门语言。
@whigzhou: 我看不能
辉格
@ 2021-03-29 17:55
阅读(1,508)
评论
分类:未分类
【2021-03-29】
塔斯马尼亚(当时还叫 Van Diemen’s Land )副总督 George Arthur 在1830年向当地土著发出的告示,画在木板上,制作了很多份,悬挂于各地,是殖民者与无文字土著沟通的一个有趣案例

@蘸盐: 然而塔斯马尼亚人最后还是被澳大利亚白人给杀光了。连20世纪的希特勒都没实现的、对一个种族的彻底的灭绝,19世纪的澳大利亚人做到了[思考]武装白人组成阵列线横扫全岛,搜山括海捕猎塔斯马尼亚人,总督还设立了名为“Black catching”的奖金,
@whigzhou: 将白人视为同质群体,得到的就是这种叙事(more...)
标签:伦理 | 历史 | 文字 | 殖民 | 澳洲 | 语言
8511
【2021-03-29】
塔斯马尼亚(当时还叫 Van Diemen's Land )副总督 George Arthur 在1830年向当地土著发出的告示,画在木板上,制作了很多份,悬挂于各地,是殖民者与无文字土著沟通的一个有趣案例

@蘸盐: 然而塔斯马尼亚人最后还是被澳大利亚白人给杀光了。连20世纪的希特勒都没实现的、对一个种族的彻底的灭绝,19世纪的澳大利亚人做到了[思考]武装白人组成阵列线横扫全岛,搜山括海捕猎塔斯马尼亚人,总督还设立了名为“Black catching”的奖金,
@whigzhou: 将白人视为同质群体,得到的就是这种叙事
@whigzhou: 杀土著的主要是逃亡流犯,他们逃到野外只能靠打袋鼠生存,与土著形成同生态位竞争,其次是拓殖前线的农场主,与土著频繁冲突,而殖民当局花了很大力气遏制这些冲突,避免土著被消灭
@whigzhou: 塔斯马尼亚适合拓殖的其实只有南北走向的那条中央谷地,面积不到全岛的1/3,剩下的2/3本来足够人口只有几千的土著过日子,而且当局也有意将这2/3留作他们的保留地,问题是这事情没法落实,因为塔斯马尼亚土著(和整个澳洲的土著一样,而不像北美土著)没有比游团更大的社会结构,你既找不到人谈判,也没有政治领袖能约束土著行为,当局也曾试图将土著从中央谷地驱赶到拟议中的保留地,但很难有成效,因为牧场对土著的吸引力太大,这也不难理解,毕竟抓羊比打袋鼠容易多了,而且羊肉也比袋鼠肉肥的多,
塔斯马尼亚土著的灭绝是不是当局政策的后果,对比一下新西兰毛利人的情况就容易理解,毛利人(和其他波利尼西亚人一样)是有复杂社会结构的,时而还能建立起酋邦这样的大型政体,所以毛利人的土地权得到了相当完整的认可,拓殖者都是通过正式条约和买卖契约来获得土地的,毛利人和殖民者的关系相当不错,一战二战时都主动要求组建毛利军团参战
@蒋培锋:难道不是因为有一定的武力吗?
@whigzhou: 1)欧洲殖民者中有没有罪恶或不义行为?
当然有,而且不少,
2)那么,基于何种伦理标准,说这些行为是不义的?
基于过去几百年中逐渐确立并取得主流地位的西方伦理,特别是盎格鲁伦理,
在这套价值观未被接受的社会,灭个异族根本不算事儿,
3)所以,当你大声谴责(1)中那些不义之举时,最好先想想清楚,你是不是准备大力弘扬西方价值观?
如果你回答*是*,那我们倒可以讨论一下这些不义究竟有多普遍多严重