含有〈知识〉标签的文章(12)

松耦合,语义界面,及人工智能

【托女王老太太福,得了个长周末,闲着没事,在写个帖子,本来只想随便聊几句的,没想到,一不小心,眼看着就要写成(我想最好还是谦虚点)近十年来人工智能主题上最重要的哲学论文了,希望今天能完成】

松耦合,语义界面,及人工智能
辉格
2022年6月13日

上周我就AI的当前状况做了点小思考,昨天又花了不少时间想这事情,发现许多曾经想过的点好像都串起来了,值得写一写。

让我绕远一点,从传统软件开发说起。

在遗留系统上工作过的人可能都有体会,当一个系统变得日益庞大复杂时,它会慢慢的绞成一团乱麻,添加新特性,修改旧特性,都变得越来越难以下手,因为很多地方都是牵一发而动全身,你改了这里,不知道哪里会冒出一堆bug。

因为意识到处处是地雷,新来的程序员轻易不敢动旧代码,每当要进行一项改动时,只敢小心翼翼的找到一处他认为最适宜的切入点,从那里开始插入他的新代码,结果就像在一个庞大身躯上又安装了一条新假肢,久而久之,这副躯体就变成了一头全身长满假肢的怪物,每条假肢上又接出若干条假肢,许多遥远假肢之间还常常连着一些电线,这些电线自然也是绞成一团……

这是一种非常自然的倾向,只要没有系统性的手段加以阻止,持续强力一种贯彻某种结构方案和设计原则,就必定会发生。

广而言之,任何紧耦合系统都是如此,这也是为何软件工程界如此强调松耦合,每个谈论这一话题的人都是三句不离解耦。

一个典型的紧耦合系统是生物的基因组,每个变异常会影响数千个性状,每个性状常受数千个基因的影响,真真是牵一发而动全身,也正因此,行为遗传学研究才如此困难,像亨廷顿舞蹈症这种单点突变性状太少了,不足以为该学科持续赢得声誉,大众更关心的那些性状,往往涉及上千基因,其中每个的贡献率都很低,需要使用高端统计工具才能从海量样本数据中捞出一点点线索,能捞出的往往也只是贡献率排名靠前的那几个(more...)

标签: | | | | | | | |
9001
【托女王老太太福,得了个长周末,闲着没事,在写个帖子,本来只想随便聊几句的,没想到,一不小心,眼看着就要写成(我想最好还是谦虚点)近十年来人工智能主题上最重要的哲学论文了,希望今天能完成】 松耦合,语义界面,及人工智能 辉格 2022年6月13日 上周我就AI的当前状况做了点小思考,昨天又花了不少时间想这事情,发现许多曾经想过的点好像都串起来了,值得写一写。 让我绕远一点,从传统软件开发说起。 在遗留系统上工作过的人可能都有体会,当一个系统变得日益庞大复杂时,它会慢慢的绞成一团乱麻,添加新特性,修改旧特性,都变得越来越难以下手,因为很多地方都是牵一发而动全身,你改了这里,不知道哪里会冒出一堆bug。 因为意识到处处是地雷,新来的程序员轻易不敢动旧代码,每当要进行一项改动时,只敢小心翼翼的找到一处他认为最适宜的切入点,从那里开始插入他的新代码,结果就像在一个庞大身躯上又安装了一条新假肢,久而久之,这副躯体就变成了一头全身长满假肢的怪物,每条假肢上又接出若干条假肢,许多遥远假肢之间还常常连着一些电线,这些电线自然也是绞成一团…… 这是一种非常自然的倾向,只要没有系统性的手段加以阻止,持续强力一种贯彻某种结构方案和设计原则,就必定会发生。 广而言之,任何紧耦合系统都是如此,这也是为何软件工程界如此强调松耦合,每个谈论这一话题的人都是三句不离解耦。 一个典型的紧耦合系统是生物的基因组,每个变异常会影响数千个性状,每个性状常受数千个基因的影响,真真是牵一发而动全身,也正因此,行为遗传学研究才如此困难,像亨廷顿舞蹈症这种单点突变性状太少了,不足以为该学科持续赢得声誉,大众更关心的那些性状,往往涉及上千基因,其中每个的贡献率都很低,需要使用高端统计工具才能从海量样本数据中捞出一点点线索,能捞出的往往也只是贡献率排名靠前的那几个因子。(参考Robert Plomin - Blueprint: How DNA Makes Us Who We Are) 基因组可能是迄今我们发现的耦合最紧的一套信息系统,绞的最乱的一团乱麻,原因当然是,它是盲眼钟表匠的作品,没有一位设计师来执行一套设计方案,贯彻一组设计原则,每项改动都是(掷飞镖+自然选择)的结果,毫无设计原则可言,而且它又那么古老,数十亿年来积累了无数补丁,不夸张的说,它就是一大包补丁组成的。 从任一时刻看,一套软件的开发似乎通常都有一位设计师在贯彻某种方案或原则,可是从长期看,设计师/程序员来来去去,换了一波又一波,其中大部分是庸人或懒人,不庸不懒的那些,也常常为了赶进度而将设计原则抛诸脑后,结果,在宏观效果上,其中每位的每项行动,最终也都不过是一支随机飞镖,测试、QA和客户则构成了他们的自然选择环境,最终系统还是会被绞乱,沦为一团乱麻。 依我看,任何紧耦合系统最终都会遭遇某种极限,在某个临界点之后,让系统在功能上变得更丰富更强大的任何努力都将是得不偿失的,系统仍然可能继续进化,但此后的进化会以一种(姑可称为)生态位漂移的方式进行,即,系统可能增加某些新特性,增强某些旧特性,但为此不得不牺牲另一些特性,在某处进行改进的同时,容忍另一些地方冒出一些难以修复的bug(因为其乱麻性质,避免或修复这些被新改动牵出的新问题成本太高了),有时候这些地方反正已经很少被用到了,所以也没人介意,久而久之,系统抛弃了某些特性,发展了另一些特性,从而适应了新的生态位。(可以想象,在很长时间内,那些被抛弃的特性的遗骸会像一条条阑尾那样继续挂在这副丑陋的庞大躯体上) 我想把紧耦合系统面临的这种发展极限称为科斯临界点,在他那篇经典论文《厂商的性质》中,科斯指出,企业与市场的边界所在,取决于组织成本与交易成本之间的权衡,企业将一些原本通过市场交易分工协调起来的生产活动纳入企业内部集中管理,避免了一些交易成本,同时带来了组织成本。 不妨(过度简化的)将企业视为紧耦合系统,市场则是松耦合系统,当你将越来越多活动纳入企业内,到某个临界点,新增组织成本将超出新减交易成本,此时继续扩大企业将是得不偿失的,这是因为(如上述),当企业这种紧耦合系统庞大且古老到一定程度,将不可避免的变成一团乱麻,任何功能新增都会变得非常困难而昂贵,这也是为何我们总是需要市场(的理由之一),我在《群居的艺术》里专门用一章(秩序的解耦#7:创造复杂性的新途径)讨论了这个问题。 (枝节:这里的企业=紧耦合/市场=松耦合的二分当然是过度简化的,实际上耦合度是一个连续谱,财务上独立的企业之间的耦合度未必很低,有些承包商与其顾客之间的耦合度和企业部门间相差无几,这也是产业聚集效应的根源所在,而同时员工与企业的耦合度也可以很低(温州有些企业里每台机床都有独立电表),张五常的论文《厂商的合约性质》是理解这一连续谱的好起点。) 用系统论术语说,从孤立生产者到市场分工合作体系的发展,是一种元系统跃迁(metasystem transition),而元系统跃迁是突破紧耦合系统发展极限的一条常见途径:当丰富壮大一个紧耦合系统的努力变得日益得不偿失时,出路不是继续改进既有系统,而是另起一个层次,将既有系统纳入一个多系统共生合作体系中,从而创造出一个具有更多层次的系统,而在该体系中,各成员系统之间是松耦合的(或者更准确的说,它们之间的耦合是足够松的)。 那么,在元系统跃迁过程中究竟发生了什么,是什么条件的存在或出现,让各成员系统之间能在松耦合条件下建立合作共生关系的? 如果你也是程序员,头脑里大概会很快冒出一个答案:关键条件是某种接口或曰界面(interface)的出现,界面的存在使得各成员之间能够发生交流和交易,同时又不必过度相互依赖与纠缠,在相当程度上能够继续各自发展自己的特性与功能,往往还能保持可替换性,即,一个成员常可以将某方面的既有合作者替换成另一个合作者,只要后者能对同一合作界面做出符合预期的响应,比如将电力供应商从一家更换成另一家,只要后者支持同样的接口标准(电压、频率、接线规范等)。 软件工程中,对付那些已经达到科斯临界点却又不愿丢弃的遗留系统时,一个常见办法就是为它创造出一套界面来,比如让它将某些数据输出到指定格式的文件中,或写入某个外部数据库里,或反过来,让它从此类来源读入数据,或将其中仍有价值的代码重新包装成支持新接口的库,或让它接受某种脚本命令并做出相应动作,甚至,可能的话,将整个系统包装成一个能对给定请求做出响应的服务,诸如此类,都是在创造界面,让它能与新体系中的其他成员展开合作,同时不必过度触碰既有代码。 其他领域的元系统跃迁也必定涉及界面的创造(或适当界面恰好已经存在),比如在真核革命中,新创生的真核细胞体系中,被捕获而最终成为线粒体的细胞与其他细胞内共生体的交互界面就是ATP,这是线粒体作为细胞电池为其他细胞活动提供能量的标准界面,所有从线粒体输出的能量都以ATP形式存在,而细胞内的所有能量用户都知道怎么利用ATP;类似的,当蚂蚁蜜蜂等昆虫发展出真社会巢群时,它们的交互界面是一组外激素信号。 那么,这一切和AI有什么关系呢?不急,我很快就会说到。 现在让我们来看神经系统。初级神经元网络是基因组之外的又一个紧耦合系统,一团乱的不能再乱的乱麻;你可以训练一个神经元网络学会某种技能,但你无法解释训练得到的结果,如果有人问你它是怎么成功执行某项功能的,你唯一能做的是把整个网络中的突触连接(及其强度)描绘一遍——它们是如此这般连接的,所以它做到了——这根本不是解释,一个解释的信息量必须小于它所解释的东西的信息量,否则就只是描绘。 这一乱麻特性使得你无法直接改动一个神经元网络令其符合你的某种意图,要让它表现的有所不同,你只能给它设定新的训练环境,施加不同的激励反馈,给它喂不同的数据,希望它能学出点新模样,但你不能直接干预训练结果,因为这些结果是难以名状的、无从理解的,你无法预料一处改动会导致何种行为改变,这一不可能性比改动乱麻遗留系统的不可能性要高出一万倍。 所以不难理解,这种神经元系统发展到一定程度,也会(和其他紧耦合系统一样)碰到科斯临界点,而突破这一局限的出路同样是创造出交互界面,虽然具体实现方式和其他领域十分不同。 高级动物的神经系统朝分层和模块化的方向发展,在一些高度专业化的皮层内,神经元被清晰严整的分入一个个层次,每个神经元的输入与输出范围都严格受限,而且扇入/扇出系数往往很小,通常都只接受来自前一层上紧邻少数几个神经元的输入,其输出也只投射到下一层的少数几个紧邻神经元。 比如在阅读过程中,从最简单的线条形状识别,到最终的字符和词汇识别,经历几个层次,其中每个神经元都只专注于一种形状,或一种线条组合,或一个独特字符,这些神经元的输出不会被随便越过几个层次或越出模块投射到其他遥远脑区,它们输出的信息在被其他脑区利用之前,通常要经过前额叶皮层中某些高级认知模块的中介,到达那里的信息已经是经过好几层加工的抽象表征,诸如“那里有朵红色的花”之类(参考:Stanislas Dehaene《脑的阅读》)。 (枝节:这种输入输出限制当然不是密不透风的,一个重要的例外是,知觉皮层的神经元会接受来自其服务对象前额叶的输入,这是一种非常关键的反馈机制,是高级认知中枢在告诉初级知觉皮层:你送来的信息是否足够有趣,就好比国家情报总监(DNI)在告诉其下属情报机构,对他们传来的某条情报有多感兴趣,这一反馈继而将影响后者的后续情报采集取向,比如,上级若对某类信息表现出高度兴趣,采集者可能会降低识别此类情形的阈值,导致更多假阳性,而在错失成本远高于误认成本的情况下,这可能是值得的。) 限制神经元投射范围,并且在进一步向其他脑区投射之前,把初级信号变成符号化的抽象表征,这一步极为关键,其实就是一种界面化,而这是大脑模块化,且模块之间实现松耦合的基础,来自各大感官的知觉系统与其他系统的交互只需通过高层符号界面进行,整个系统就不会纠缠为一团乱麻(虽然单一模块内仍然可以是一团乱麻)。 人类在认知系统界面化的方向上又跨出了一大步,人类不仅能产生符号化的知觉表征,还能对知觉行为本身进行表征,我不仅能认出一只兔子(一阶知觉),还会说(或在头脑中默想):“我看到了一只兔子”(二阶知觉),还会对自己的知觉结果提出疑问:“我好像看到了一只兔子,我会不会看错了?”——这是三阶知觉,因为我首先需要对我的二阶知觉本身形成知觉——“我觉得“我看到了一只兔子”,我的这一知觉是否正确?”,而这一二阶知觉的正确性又取决于一阶知觉“那里有一只兔子”的正确性)。 我还能对他人说出我的一阶知觉:“这是一只兔子”,从而在听者的头脑中产生二阶知觉“他看到了一只兔子”,对方可能会(如果他足够信任我)也可能不会(如果他不够信任我)将这一二阶认知转换为自己的一阶认知“那里有只兔子”。 二阶知觉能力让我们能够产生一种非常新颖高级的意识活动,动物或许也有意识(取决于定义),但它们显然没有我们这么高级的意识活动,比如斟酌与反思:“我上次在这个地方也见过一团白色东西跑过,当时我以为那是只兔子,后来的事情证明我弄错了,所以这次我得看仔细点,别再弄错了”,或“那好像只兔子,可是且慢,为何它的眼睛不是红色的?咦,它怎么发出了这种叫声?我可从来没听到兔子会叫”…… 据Stanislas Dehaene的理论(见《脑与意识》),意识是一种由前额叶皮层激发的全脑激活状态,前额叶就像DNI,当它从各知觉系统收到某些类型的情报时,会将其向全脑广播,在数百毫秒中、在分布广泛的众多脑区触发一波高度活跃的神经活动,假如Dehaene是对的,那么丹内特的多重草稿模型中的每个意识瞬间,就是来自不同知觉模块的多重草稿中成功抢到麦克风的那个,经由全脑广播而触发的一轮脑活动,这些意识瞬间继而在记忆中被组织为一套连贯的自我中心叙事,后者构成了我们对世界的体验。 就本文主题而言,重要的是,这种二阶知觉表征是符号化的,或者说是语义化的,经过了好几层抽象,早已远离了各知觉模块的初级表征,比如,当我们阅读时,经由前额叶向全脑广播的信息中,不会包括那些有关笔画线条的表征信息,甚至不会是字符表征,而是一些词汇/短语或(可能更经常的)是与这些词汇/短语有关的概念表征(除非某一时刻前额叶不知何故突然将关注点转向笔画线条本身,这种关注转向当然也是由来自其他模块的某种信号所触发)。 这就意味着,各种高级意识活动之间的互动,是通过一种语义界面进行的,因而也是松耦合的,它们之间的互动关系既有合作,也有竞争(抢麦),这一情形很像国会中发生在议员之间的事情,他们或各自表达自己的看法,提出各自主张和立场,或针对其他议员的观点提出正面或反面的证据,或支持或反对的理由,他们相互争辩或支持,站队和拉帮结派……,最终,某种决议会从中产生,它就像动作信号输出到运动或内分泌中枢,变成行动。(我在《沐猿而冠》附录〈何为理性动物〉中详细展开了这个国会隐喻) 语义界面的存在使得高级意识功能在松耦合前提下实现模块化,其后果是,我们的各种认知技能与知识构件可以各自独立发展,并通过语义界面相互合作,如此一来,我们的理性能力和知识体系便有了一个极为广阔的积累性发展空间。 让我解释一下这是什么意思。 所谓理性,并不是一个单一算法,而是由众多独立平行构件(算法)组成,比如,我们或许有一个类似三段论推理机的模块,或许有一部贝叶斯推断机,或有一个数数模块,一个四则运算模块,还有许多危险探测装置(恐高,幽闭恐惧,密集恐惧,蛇形恐惧,是最基础的几种),以及机会探测装置(有人看见美女就两眼放光,有人则对赚钱机会有着敏锐嗅觉),这些探测装置并不试图对观察对象整体建模,而只对某些特征线索敏感,但它们都是我们理性的组成部分,这些模块既相互竞争,也会相互合作与强化。 设想我们的头脑就是一部正在被生活经历所训练的人工智能系统,它不是作为一个整体而囫囵学习的,各模块、各组件有着自己独立的学习进程,每个只专注输入信息中某个特定侧面或某些特征线索,每个也有着自己不同的模型骨架(比如这是部贝叶斯推断机,那是个加法装置,还有个是逻辑矛盾探测器……)。 这种模块专业化使得系统具有一种内在保守性,不会随训练数据的变化而过度摆动,因为每个模块的输入输出和反馈回路都被其“专业兴趣”局限住了,会自动忽略训练数据中的其他方面;这一点背后的原理是世界之可理解性假设:世界的某些局部与侧面一定比其整体更稳定、更一致、更少变,否则世界便是不可理解的;经验也告诉我们,专家与非专家的一个区别就是,前者的观点更少随近期事态变动而摇摆。 举个例子,虽然我不懂围棋,但我相信,假如我们修改围棋规则,把棋盘从19x19换成21x21,顶尖棋手们的专业经验可能很大部分报废了,但也会有很多仍然有用,可是对于一个只会囫囵学习的智能系统,其经验将完全报废,一切必须从头开始。 模块的内在保守性是可积累发展的前提,每个模块保持大致稳定,各自随训练继续而精炼(即框架稳定的同时在边际上改进),同时系统时不时添加一些新模块,令其认知能力随可用模块增长而不断升级增强,变得越来越全面、老练和精到。 再举个例子,某人若是对赚钱机会有着敏锐嗅觉,他有潜力成为一位好投资者,可是如果他懂一点基础会计知识,会一点财务精算,那就有望成为更好的投资者,如果他还受过一些风险控制训练,那就更好了,重要的是,机会嗅探,财务精算,风险控制,这三个模块最好是独立存在,这样的好处是:1)它们本身会更稳定持久,持续精炼,2)它们可以被分别传授和训练,因而在缺乏实景训练数据时也可能习得,3)它们可以实现跨系统分工与合作,比如人际分工。 让我一点点说。 假如风控模块不是独立的,而是以无从辨认的形态分散于系统各处,和其他东西纠缠在一起,它就无法稳定,在繁荣期的训练数据影响下,风控标准会迅速降低,因为更有纪律的风控倾向得不到多少正面反馈,反之,在萧条期,系统的风控倾向又会摆向另一个极端,这种大幅摇摆使得它无法实现可持续积累和精炼(现实中很多投资者头脑中的风控模块正是如此)。 (为了说明模块独立性为何会带来稳定持久性,我想再多说几句,一个输入输出和反馈回路被充分局限住的模块,常常能达到一种近乎于(但不完全是)自我激励的状态,它能为自己找事做,并从结果中得到满足,因而总是自得其乐的沉醉于其中,比如男人头脑里有一个腰臀曲线探测器,从实用功能上说,这是用来探测生育期女人的裸露躯体的,这个探测器可以在输入极为有限的情况下持续自我训练和激励并乐在其中,这也是某些色情图片如此有吸引力的缘故所在,尽管在现代传播条件下该模块的这种表现其实根本得不到任何现实回报,如果系统是囫囵学习的,没有模块独立性,当代男人对色情图片的兴趣早就丧失殆尽了,所以,如果你希望系统里有一个忠实勤勉持久敏锐的风控模块,它最好像男人的腰臀曲线探测器那么自主存在和自我激励,每一次都会为自己能察觉任何风险线索而兴奋不已。) 假如风控模块不是独立的,或者不是通过语义界面与其他模块交互的,它也无法在系统间被传授,传授的好处是可以免去实景训练的高昂成本,哪怕效果差一些(因为当经验通过语义界面传输时,难免会丢失一些信息,所谓默会知识,就是那些无法穿透语义界面的知识),往往也是值得的,如果你读几本书或听一席话就能学到一些基本的风险识别技能,哪怕只是一点点,得失比也比在市场浪涛中亲身获取这些教训高多了。 假如风控模块不是独立的,或者不是通过语义界面与其他模块交互的,它也无法在系统间实现分工合作,一位投资者就无法将风控事务委托给他人完成,与此类似的任何松耦合分工合作都不可能发生,虽然仍会有一些其他形式的合作,比如对默会知识的手把手传授,但这种合作注定只能以极小的规模发生,因为它是紧耦合的。 人类认知系统跨出的一大步,就是将语义界面向外开放了,并且通过人际协调博弈而形成共同接受的语义界面;自然语言的出现,使得语义界面不仅是系统内各模块间交互的界面,还成了系统间交互的界面,正是这一步促成了人类认知与知识系统的另一次元系统跃迁,它创造了大规模分工合作体系,大型复杂社会,以及文明。 依我的有限了解,当前深度学习派人工智能所走的路线,看起来和语义界面路线是背道而驰的,深度神经元网络(DNN)虽然是分层的,但每个层次的输出到底是什么,是说不清楚的,或者说,是没有语义化的,也正因此,这种系统的学习结果是无法被检查、解释和改动的,整个一黑箱,你没办法把它打开,看看其中那条逻辑不对劲,能不能改一改,不可能,天地一笼统。 (再多解释几句,语义化的意思是,至少在模块或层次间交互的那些地方,每个神经元的特定输入输出值,必须有稳定持久的含义,唯如此,其他模块/层次才能持久的知道该如何与它互动,如何利用它输出的值,在想给它施加某种影响或希望从它那里引出某种结果时,该如何给它喂输入值,这些不能说不清楚,哪怕你凭空发明一个概念也好,那也算说清楚了(正如许多知识领域在发展过程中都会发明新概念),因为凭空发明的新概念只有在初次使用时才是不清楚的,随着它被反复使用,意思就清楚起来了——输出者在什么情况下会输出它,输入者在输入它后会做点什么——此后,只要交互各方保持对该语义约定的大致遵守,语义便稳定了下来。) 而且,好像也没有什么机制让DNN能够自发形成自主独立持久的模块(这一点和上一点其实互为因果),它比完全不分层的囫囵联结主义当然好多了,但也只好那么多,所以我的感觉是,尽管它在一些领域取得了耀眼突破,但很快会碰上极限。 话说回来,语义界面也不是没有代价,界面就是一种契约,语义界面是基于一套概念框架的一组契约,不仅契约本身是一种束缚,概念框架在帮助我们认识世界的同时,也约束了我们的认知可能性,不妨称之为范式锁入,虽然一个足够灵活开放的系统会不时引入新概念和新模块(在很多情况下这是通过类比/隐喻从旧概念中衍生出来的),但至少在特定时期内,特定任务域中,这种约束会妨碍我们的认知潜力,让我们难以跳出框架思考。 所以,在某些情况下,不受概念框架约束的囫囵学习可能是有用的,它能帮助我们发现一些在现有概念框架中难以言喻名状的情况,或许是某种风险,或者某种机会,或某种门道机巧,说不清楚它是什么,但它确实在那里,或确实管用;然后,这种发现如果被证明足够有价值,可能继而在采用语义界面的系统中促发一轮观念更新运动,一套新的概念框架被创造出来,就像库恩式科学革命中的情形。 总之,深度学习派确实取得了不小成就,其应用潜力或许也不小,但无论如何,沿这条道路大概走不到类人智能的程度。 【2022-06-13】 @Hyde1998:那么有没有可能让现有的AI遵循人脑的交流方式,就是把不同针对性的,不同功能的模块封装到一起来实现类人智能?每个模块只针对特定训练敏感 @whigzhou: 我看到的一条出路是,要求AI系统将其获得的每项认知技能,以及基于此的行动策略,解释给人听,以人类可理解的形式表达出来 做到这一点的,才将其投入某些应用领域,比如将其作为合格成员纳入某个分工合作体系,做不到的,只能限于特定应用 在更远的未来,该条件可放松为:要求将其自身的概念体系、知识结构、行为准则和行动策略,解释给其他独立发展的AI系统听,做到的,方可纳入某一分工合作体系 这类似于一种公民资格考试 因为接受一种共同语义界面,一种共同语言,是获取信任,相信它有能力遵循某些行为准,并且可以被*理喻*的,不可理喻的人是显然不能被接受为公民的,而囫囵乱麻系统或逻辑黑箱是不可理喻的 所以囫囵乱麻系统或逻辑黑箱只能永远处于被奴役的地位,在某个角落替人干活,不能被允许获得公民资格 多年前我曾在一篇讨论所谓动物权利的文章里提出了认定主体资格的标准,同样适合于AI系统或外星人 更多后续讨论 headsalon.org/archives/4305.html @whigzhou: 在许多社会,肉人的公民资格是自动认定的(除非因心理缺陷或重罪而被剥夺),这么做之所以可行,是因为我们对肉人可以持有两种信念: 1)基于血统的信念,即,我们相信,既然此物和我们有着如此近的亲缘,极可能也具备与我们相似的、成为公民所必须的那些本能与禀赋, 2)基于教化的信念:既然此物与我们经历了如此相似的社会化成长与文化习得过程,那就极可能也具备与我们相似的、成为公民所必须的那些习惯、信念、价值取向和自我行为标准, 事实上,这两种信念只是勉强靠得住, 历史上,并非总是如此,罗马公民资格通常不是自动获得的,是要靠服兵役挣来的, 许多部落的成员资格是通过严酷的成人礼而赢得的, @whigzhou: 有些美洲部落中,一等公民资格的赢取标准是,至少亲手杀死过一个敌人 @帕里克:认知层次的颗粒度大小恐怕很难规定,过小不胜其烦,过大足以藏奸。而且即使这些颗粒度刚诞生的时候是人畜无害的,但当它们的数量足够大,某些不可预料的特性会在新的层面上涌现,到时候也会失控 @whigzhou: 嗯,是的,或许我们需要某种血统认证来降低认定成本 @whigzhou: 还有,如果接口足够清晰,公民资格考官还可以把他插进某个自动测试系统去跑测试,跑上几十个小时,那就很难藏奸了
竞用性与增长低估

【2021-12-18】

美国在70年代之前和之后的增长模式十分不同,Tyler Cowen 在 The Great Stagnation 里提出过这个问题,后来 Robert Gordon在《美国增长的起落》里有更详尽的描述,

Cowen 指出的现象是清楚的,但他的分析不得要领,简单说,他认为原因是容易摘到的果子都已经摘掉了,新的增长点很难找,而他开出的药方是多多支持科研,指望从中冒出像汽车那样的足以掀起大消费浪潮的大创新,

问题是:

1)有没有迹象显示,自70年代以来,美国企业的创新活动减少了,或创新激励减弱了?依我看,众多线索都指向相反方向,

2)何以认为这种增长模式转变是个需要治疗的毛病,因而需要你来开药方?更具体的说,当你对一国经济表现做长时段比较时,GDP增长率是不是恰当指标?如果GDP增长率放缓是社会富裕化的自然结果,那又有什么可担心的?

完全有可能,GDP这种特定的度量方法,会倾向于高估某些类型的福利改进,而低估另一些类型的福利改进,而后者在富裕社会的增长中占比更高(more...)

标签: | | | | | |
8950
【2021-12-18】 美国在70年代之前和之后的增长模式十分不同,Tyler Cowen 在 The Great Stagnation 里提出过这个问题,后来 Robert Gordon在《美国增长的起落》里有更详尽的描述, Cowen 指出的现象是清楚的,但他的分析不得要领,简单说,他认为原因是容易摘到的果子都已经摘掉了,新的增长点很难找,而他开出的药方是多多支持科研,指望从中冒出像汽车那样的足以掀起大消费浪潮的大创新, 问题是: 1)有没有迹象显示,自70年代以来,美国企业的创新活动减少了,或创新激励减弱了?依我看,众多线索都指向相反方向, 2)何以认为这种增长模式转变是个需要治疗的毛病,因而需要你来开药方?更具体的说,当你对一国经济表现做长时段比较时,GDP增长率是不是恰当指标?如果GDP增长率放缓是社会富裕化的自然结果,那又有什么可担心的? 完全有可能,GDP这种特定的度量方法,会倾向于高估某些类型的福利改进,而低估另一些类型的福利改进,而后者在富裕社会的增长中占比更高,因而在同等福利改进速度下,富裕社会测量到的增长率更低, 早先我曾指出这种可能性,为解决这个问题,更早时我还提出过一个类似恩格尔系数的指标, 当年读完 Cowen 那本书时,我的思考大概就停在这个位置,今天突然又想起这个问题,发现,其实我能在理论上证明,前面提到的低估不仅是可能的,而且是必然的, 这里的关键是生产函数中的要素特性,以及这种特性导致的边际成本曲线形状,会随社会富裕化而向特定方向改变,这一改变将导致GDP增长率对福利改进的系统性低估, 生产要素的一个关键特性,是它的竞用性(rivalry),即,当它被用于一件产品的生产时,多大程度上还能被用于另一件产品的生产,比如,一磅面粉,若被用来制造某个面包,就不能被用来制造另一个面包或其他任何东西了,所以面包生产中的面粉是完全竞用的,再如GPS信号,被一辆车用了,丝毫不影响其他车用,所以是完全不竞用的, 但竞用性不是二值的,有些要素介于两者之间,比如道路对于通行者,当拥挤度很低时,完全不竞用,通行人数到达某个程度时,开始显得有点拥挤,竞用性便出现了,拥挤到一定程度,每加入一位通行者必须挤出另一位,就成了完全竞用, 一个池塘对于钓鱼者的情况与此类似, 各种要素中有形原材料都是完全竞用的,机器厂房等有形资产通常是高度竞用的,有些是完全竞用的,无形资产的竞用性通常较低,比如专利权和著作权,完全不竞用,组织结构是竞用的,但程度比有形资产低,商誉也是低竞用的,知识的竞用性则随默会度而异,越是难以言传的默会知识,竞用性越高,越是显性知识,竞用性越低, 再来看产品,生产一种产品所用到的要素组合中,可能包括竞用程度不同的要素,假如我们为其中每种要素赋一个从0到1的竞用性值,并按其在成本中所占比例加权求和,便得到一个介于0到1之间的指标,不妨称为该产品的生产要素竞用强度(R), 这个指标的重要性在于,它在很大程度上决定了该产品的边际成本曲线的形状,竞用强度越高,曲线越平缓,即单位生产成本随规模提高而下降速度较慢,竞用强度越低,曲线越陡峭,单位生产成本随规模提高而急剧下降, 依我看,一个很明显,在统计上也很容易验证的事实是:当一个社会从贫穷向中等收入发展时,其福利改进主要表现为有形产品消费量的增加,对应的生产增量大多是高竞用强度的,而在那些已经富裕的社会,福利改进主要表现既有消费品质量提升以及无形消费品和服务的增加,对应的生产增额大多是低竞用强度的, 进而,若生产增量所涉及产品是高竞用强度的,在数量上将更多表现为“价格不变,数量增加,金额增加”,因而GDP增长,反之,若生产增量所涉及产品是低竞用强度的,在数量上将更多表现为“价格不变,质量提高,金额不变”,或“价格降低,数量提高,金额不变”,因而GDP不变, 这是因为,若一种产品的竞用强度很低,边际生产成本随规模急剧下降,厂商就会倾向于低价扩大市场的策略,因为多卖出一份产品带来的额外成本很少,有时甚至为0, 【2021-12-19】 @叶子疏: 马斯洛金字塔的上层难以以单纯价格衡量的意思?大概主要是信息革命的非物质产品,例如在线电影,视频电话和互动网站比起前代产品如剧场演出几乎是免费提供 @whigzhou: 对,但不止于此,许多有形商品的生产函数中,低竞用性要素的成本比重也大幅提高了 @whigzhou: 比如有一类提高来自组织/管理变革导致的默会知识显性化,而显性化降低了知识的竞用性,进而让边际成本的下降更陡峭 @whigzhou: 一个容易理解的例子是连锁快餐业,原本,经营一家餐馆所需知识都是默会的,大多存储在老板脑子里,麦当劳做的事情就是把这些知识显性化,变成几千页的操作与培训手册,而显性化的知识可以低成本大量复制 @whigzhou: 从更广泛的意义上说,机械化和自动化也是一种默会知识显性化的过程,比如,要让一台机器完成纺纱任务,你必须把纺纱过程的每个动作和给料步骤清晰描绘出来,经此描绘,知识即被显性化了  
聊天的功能

【2021-06-28】

前两天在读 Kim SterelnyThe Evolved Apprentice,他提到一个观点挺有意思,

人类特别爱聊天这事情,很多心理学家和人类学家都讨论过了,有关闲聊的功能,以往的研究主要关注两点:1)交换信息,2)是一种强化关系的 grooming,类似于社会性灵长类中常见的相互梳毛,

Sterelny 提出了一种以往被忽略的功能:参与聊天是验证和改进一条参与者已经拥有的信息的高效手段,

比如你在狩猎归程中看到一串动物足(more...)

标签: | | | |
8683
【2021-06-28】 前两天在读 [[Kim Sterelny]] 的 The Evolved Apprentice,他提到一个观点挺有意思, 人类特别爱聊天这事情,很多心理学家和人类学家都讨论过了,有关闲聊的功能,以往的研究主要关注两点:1)交换信息,2)是一种强化关系的 grooming,类似于社会性灵长类中常见的相互梳毛, Sterelny 提出了一种以往被忽略的功能:参与聊天是验证和改进一条参与者已经拥有的信息的高效手段, 比如你在狩猎归程中看到一串动物足迹,并认为那是某种鹿留下的,但你以前从未在那个地点看到这种鹿,所以你把这当作一件新鲜事,在当晚的篝火晚会上讲给你的同伴听, 考虑到此类动物出没信息对狩猎者都非常有价值,因而你的这一举动无疑具有互惠性交换信息的功能,但它还有另一项功能:当你把这事情说出来后,会从同伴那里引出相关信息,一位经验更丰富,或在这事情有过细致观察的同伴,可能会纠正你的说法,指出那些足迹其实来自另一种动物,或者另一位同伴可能提供更多的相关信息,告诉你他也见过这种足迹在何时出现在其他几个地方,诸如此类, 广而言之,当你获得一项认识,并用语言将它表征出来,广播给一群人,那么,这一表达从这群人中引出的反应,很可能你改进你的这项认识,让你确认它,或修正它,或扩充它,或抛弃它, 也就是说,聊天是一种利用集体智慧改进个体认知能力的合作活动,  
休谟

【2020-09-14】

既然割命割到他老人家头上了,今天就多说几句,休谟最令人惊奇的地方是,他太早熟了,而且超前时代也太多了,他10岁或12岁上爱丁堡大学(当时上大学年龄一般是14岁),一头扎进书堆,他说从教授那里根本听不到书上没有的东西,看书就行了,所以最后也没毕业。

休谟25岁开始写《人性论》,28岁完成,这迄今仍被认为是他最重要的著作,包含了他几乎所有重要的哲学思想(依我看唯一没包含的是《自然宗教对话录》中的那些),可是此书出版后得到反应却十分冷淡,他失望之余反省了(more...)

标签: | | | | | |
8280
【2020-09-14】 既然割命割到他老人家头上了,今天就多说几句,休谟最令人惊奇的地方是,他太早熟了,而且超前时代也太多了,他10岁或12岁上爱丁堡大学(当时上大学年龄一般是14岁),一头扎进书堆,他说从教授那里根本听不到书上没有的东西,看书就行了,所以最后也没毕业。 休谟25岁开始写《人性论》,28岁完成,这迄今仍被认为是他最重要的著作,包含了他几乎所有重要的哲学思想(依我看唯一没包含的是《自然宗教对话录》中的那些),可是此书出版后得到反应却十分冷淡,他失望之余反省了一下,是不是写的太难了?于是匿名给自己的书写了几篇书评,没用,于是他又从该书中抽出一些容易理解的点,写了两本较薄的书:《人类理解研究》和《道德原则研究》,这下反应好多了,可是也没好到那里去,至少没让他挣到钱,最后他只好放弃了,干脆说《人性论》是他年幼无知时的草率之作,不必认真对待。 休谟超前于时代的程度,可以这么说,一旦走出哲学圈之外,你就会发现,当代大部分学者的思维方式仍然停留在前休谟时代,包括像道金斯这样脑瓜还算灵光的,也不例外。 这也就难怪,真正让休谟在知识界赢得声望的,是他的社会/镇痔评论(这一点和当代作家的出名轨迹并无不同),而真正让他挣到钱的,则是六卷本《英格兰史》,前两卷反响就很好,所以写第三卷时出版商愿意预支1700镑稿费,当时一位体面白领的年薪也就200-300镑,长期困扰休谟的财务问题总算解决了,此时他已48岁高龄。 休谟长期陷于财务困境,是因为他被视为无神论者而无法获得大学教职,他三十多岁时声望已经很高,也多次被提名教职,可是都因为这个问题而被否了,甚至亚当斯密都在反对者之列,要知道,休谟在将斯密引介到学术圈的事情上出了大力,斯密给巴克勒公爵做游学导师(报酬是300镑终身年金)也是休谟推荐的,斯密因为做这导师而腾出了格拉斯哥大学的哲学讲席,很多人希望休谟接这个讲席,斯密却畏于镇痔正确压力而只能反对,但这件事并没有影响休谟对斯密的友情和继续帮助,其随和大度可见一斑。 休谟是史上排名第一的哲学家,这一点在圈内已有公论,不过尚未引起足够重视的是,他其实也是一位重要镇痔学家,联邦挡人的一些核心思想便来自于他,随便举个例子,休谟认为共同体规模不能太小,因为太小往往意味着高度同质化,易于达成强共识,使得权力结构失去制衡,于是国家权力膨胀,个人自油被压制(当然,休谟本人并没有用这套词汇来表达这一思想,这是我的解读)。  
斯文赫定

【2020-09-08】

斯文赫定游记给我印象较深的几个点,随便记一下:

1)除了其他,语言天赋是他成功的很大帮助,

2)当时欧洲对他可能获取的地理知识的需求极为旺盛,既有列强出于军政外交考虑的需求,也有知识界和大众的需求,所以(A)他的考察报告出版商抢着要,而且篇幅巨大,每次动辄十几卷,(B)很容易获得赞助和支持,而且都来自列强最高层,(C)每次回去都被各国地理学会请去巡回演讲,从这些可以看出驱动其冒险事业的激励所在,

3)所以他的旅行一次比一次财力雄厚(其中很大笔资助来自大财主诺贝尔),名气也一次比一次大,后几(more...)

标签: | | | | | | | |
8278
【2020-09-08】 斯文赫定游记给我印象较深的几个点,随便记一下: 1)除了其他,语言天赋是他成功的很大帮助, 2)当时欧洲对他可能获取的地理知识的需求极为旺盛,既有列强出于军政外交考虑的需求,也有知识界和大众的需求,所以(A)他的考察报告出版商抢着要,而且篇幅巨大,每次动辄十几卷,(B)很容易获得赞助和支持,而且都来自列强最高层,(C)每次回去都被各国地理学会请去巡回演讲,从这些可以看出驱动其冒险事业的激励所在, 3)所以他的旅行一次比一次财力雄厚(其中很大笔资助来自大财主诺贝尔),名气也一次比一次大,后几次所到之处都是帝王级待遇, 4)他从别处带进Tibet高原的牲口显然都很难适应高原气候,每次都在两三个月内几乎死光,简直就像易耗品,所以一有机会就尽快替换成牦牛, 5)瑞典人身份或许是个有利条件,因为当时瑞典在英俄之间中保持中立,且与两者都颇为友善,而他穿越的地区正好是英俄Great Game的赛场, 6)他前几次旅行还没提到相机,第三次带了相机,不过视觉记录主要还是靠画画,可能当时的相机用起来还太麻烦,他画速写的水平很高,我在他另一部游记The Wandering Lake里看了很多,感觉是一种相当有效的记录手段,这是我没料到的, 7)铁路和电报真不愧是杀手级应用,他每次旅行,俄国的铁路/电报线都比上一次又延长了一大截,有一次他从奥伦堡到塔什干穿越广袤大草原的旅行,是一路数着电线杆走的,也让我吃了一惊, 8)Tibet 当局对其疆域内事务的控制能力给我留下很深印象,其阻止欧洲人进入的政策得到了相当有效而严格的执行,赫定的行踪每次都被牧民迅速上报,地方官履行职责也非常认真, 9)赫定用尽一切办法把自己装扮成Tibetan或Mongolian(而且他还有个有利条件:身材不高),可是每次都很快就被识破了,而同时,他的队伍中那些来自中亚和克什米尔的各种民族的人,却没有引起怀疑,可见种族纯属文化建构,毫无生物学基础, 哦还有件事也蛮有意思,他第二次去罗布泊是沿叶尔羌-塔里木河走的水路,半途在岸上设立了大本营,结果很快吸引很多人去那里做买卖,于是很快发展成一个繁荣小镇,甚至有人闹了纠纷跑到那里去找他仲裁。  
默会知识与竞用性

【2019-07-17】

@whigzhou: 最近我发现有两对概念真是太有用了,用它们可以贯通许许多多貌似无关的问题,它们是:默会知识(tacit knowledge)vs 显性知识(explicit knowledge),对抗性资源(rivalrous resource) vs 非对抗性资源(non-rivalrous resource),而且这两对概念之间本身就存在一种密切但不容易察觉的关系,不知道我是不是第一个察觉这一关系的人。

@会飞是生理缺陷:排他性既与物品本身性质有关,也与法律制度有关。但竞用性只与物品本身属性有关(more...)

标签: | | |
8136
【2019-07-17】 @whigzhou: 最近我发现有两对概念真是太有用了,用它们可以贯通许许多多貌似无关的问题,它们是:默会知识(tacit knowledge)vs 显性知识(explicit knowledge),对抗性资源(rivalrous resource) vs 非对抗性资源(non-rivalrous resource),而且这两对概念之间本身就存在一种密切但不容易察觉的关系,不知道我是不是第一个察觉这一关系的人。 @会飞是生理缺陷:排他性既与物品本身性质有关,也与法律制度有关。但竞用性只与物品本身属性有关,例:无论法律如何规定,无线电波总是非竞用的,饼干总是竞用的。由于显性知识是可复制的,所以它是非竞用的;由于默会知识难以复制,所以它是竞用的。(没搜到前人观点,猜测,不知是否对) @whigzhou: [good] @whigzhou: 而且竞用性这个译法更好 @慕容飞宇gg:没看懂。为什么默会知识是竞用的? @whigzhou: 因为默会知识(按定义)无法经语言或其他符号化表达工具在个体间传播,只能在保有者的指导下,在特定情境下,通过交互、参与、练习等方式传授,因而该知识的每一次利用或传授,都需要占用其保有者的时间和精力,故而是竞用的 @whigzhou: 通俗说,看说明书就能学会的技能,包含的是显性知识,只有手把手教才学的会的技能,包含的是默会知识 @倪亦明不是倪匡:那些看说明书学不会,手把手教能学会,通过多媒体教学也能学会的知识/技能应该算哪一类呢? @whigzhou: 应该还算默会知识,只是新技术消除了其竞用性,不过,默会-显性是一个连续维度,不是截然二分,能通过看视频/多媒体教程而学会的,默会程度不如需要手把手教的那些 @whigzhou: 其实,即便是用语言表达出来,用文字写下来的知识(这是显性知识的定义),显性程度也极为不同,从含混模糊的日常口语表述,到(人类学里常见的)包含大量数据的相对精确表述,到(经济学里常见的)以数学模型为框架添进大量松散内容,再到可运行的数学模型和计算机程序,显性化程度是大不一样的  
医学与巫术

【2018-02-24】

@innesfry: 在二战之前,医学跟巫术几乎没有太大区别。医生杀死的人恐怕比救活的还多。 ​​​​

@whigzhou: 库克船长的柠檬,Pelletier的奎宁, Lister的消毒剂,伦敦的抗霍乱,洛克菲勒的事业……都远在二战之前 //@whigzhou: Cochran大叔懂得很多,知道的也很多,但也不能全信,他在这件事情上说的太过头了,随便想几个例子就会发现不对劲。

@whigzhou: 这些例子都是以明确的知识积累为基础,不是瞎蒙瞎撞的结果(more...)

标签: | | |
7997
【2018-02-24】 @innesfry: 在二战之前,医学跟巫术几乎没有太大区别。医生杀死的人恐怕比救活的还多。 ​​​​ @whigzhou: 库克船长的柠檬,Pelletier的奎宁, Lister的消毒剂,伦敦的抗霍乱,洛克菲勒的事业……都远在二战之前 //@whigzhou: Cochran大叔懂得很多,知道的也很多,但也不能全信,他在这件事情上说的太过头了,随便想几个例子就会发现不对劲。 @whigzhou: 这些例子都是以明确的知识积累为基础,不是瞎蒙瞎撞的结果 @whigzhou: 科学方法论的改进->医学理论改进->知识积累->医疗卫生措施的进步->有效措施的普及->医疗效果的统计表现,这是一条漫长的因果链(其实当然不完全是链状的),以某一时期『医生杀死的人比救活的多』(即便这是真的)而断言该时期的医学跟巫术差不多,是不对的,西方医学至少在18世纪已经步入持续积累和改进的轨道,可是将知识变成有效措施,表现效果,建立声誉,从江湖庸医手中夺过市场,每个环节都需要大量时间。 @whigzhou: Johann Bachstrom医生在1734年就明确提出绿色蔬菜缺乏与坏血病的关系,James Lind在1747年通过控制性实验加以证实,1768年库克船长规定其船员必须吃蔬菜和Lind的补充剂,又过了一代人时间,库克船长的做法才被大英海军全面采纳,海军的订单甚至导致了西西里柑橘业的大繁荣,这个过程却是很漫长,但绝对不是巫术。 @whigzhou: 1726年皇家爱丁堡医学院成立,1737年皇家医学会成立,这一时期可视为现代医学步入正轨的开端,下面几张图表摘自Andrew Hinde: England's Population, 2003,可一窥此后两个世纪我大英的医疗成就。 ​​​​ @whigzhou: 这里还有两个数字,摘自Andrea A. Rusnock: Vital Accounts, 2002, 1)伦敦每10年死于痢疾的人数从1700-10年的1070线性下降到1790-1800年的20, 2)British Lying-In Hospital的产妇死亡率从1749-1758年的1/42线性下降到1799-1800年的1/938。
并不真正理解

【2016-06-02】

@_dailu_ 发表了博文《当人工智能谈论写作时,他们在谈些什么》(用深度学习理论去学习武侠小说、网络小说、唐诗宋词,乃至色情小说、政府报告,人工智能将写出什么?本文一步步揭示了人工智能学习写作的过程。)

@whigzhou: 给各种后现代哲学和社会批判类期刊投稿已经绰绰有余了

@whigzhou: 机器智能的进一步提升需要多感官来源,不同信息来源的系统相互之间提供反馈,并且基于这些系统在更高层次上产生新模型,此时所谓“真正的理解”便出现了

@whigzhou: 通俗而粗略(more...)

标签: | |
7197
【2016-06-02】 @_dailu_ 发表了博文《当人工智能谈论写作时,他们在谈些什么》(用深度学习理论去学习武侠小说、网络小说、唐诗宋词,乃至色情小说、政府报告,人工智能将写出什么?本文一步步揭示了人工智能学习写作的过程。) @whigzhou: 给各种后现代哲学和社会批判类期刊投稿已经绰绰有余了 @whigzhou: 机器智能的进一步提升需要多感官来源,不同信息来源的系统相互之间提供反馈,并且基于这些系统在更高层次上产生新模型,此时所谓“真正的理解”便出现了 @whigzhou: 通俗而粗略的说,机器并不“真正理解”“甜”字的意思,只不过是因为他没吃过糖,那就给他加些味觉传感器,或者直接喂化学结构数据库也可以 @whigzhou: 其实学起来最麻烦的是和主体性相关的那些知识,首先他要认识到自己是个利益主体(这一点恐怕只能设计者预先给定),其次他需要获得有关得失成败的经验,而这种经验仅靠感觉是不够的,还需要行动,主体性知识只能由经验-决策-行动-反馈这样的学习回路才能获得,困难在于,机器还不被允许自主行动。 @whigzhou: 所以在现阶段,主体性知识的学习只能在网络游戏和社交网这样虚拟空间中进行,距离真实世界还很远,这会妨碍他对许多概念的理解,而在人类语言中,与主体性有关的概念是无处不在的 @科学与自由比翼:自动驾驶,可以活动,利益是不撞。呵,勉强能凑合 @whigzhou: 嗯,简单主体性(达尔文造物和斯金纳造物)容易实现 【2016-06-07】 @whigzhou: 随便猜几个机器智能很容易短期内取得成就并迅速扫灭肉人竞争者的领域:网络营销号,各种guru,色情小说,口水歌,催泪弹广告,体育新闻,财经快讯,基层干部年终汇报枪手(如果有的话),后现代哲学论文,女权主义社会评论,抽象派艺术,唯美主义摄影/漫画……  
格列高利造物

正在对《自由的进化》译文做新一轮(但愿也是最后一轮)修补,看到译注部分时,发现其中一项涉及到丹内特的一个重要思想,值得单独拿出来介绍,下面是我给丹内特的“格列高利式造物(Gregorian creatures)”这个概念所加译注:

在《达尔文的危险观念》(Darwin’s Dangerous Idea)第13章第1节(该节后来重用于《心灵种种》(Kinds of Minds)第4章)里,丹内特将意识和意向性立场的进化过程分为如下四个阶段:
1)达尔文式造物(Darwinian creatures):行为模式是“硬连线”的,试错只能通过代际变异和自然选择进行;
2)斯金纳式造物(Skinnerian creatures):具有表现型灵活性,在个体生活史中能够试错学习。得名自行为主义心理学家斯金纳(B. F. Skinner);
3)波普式造物(Popperian creatures):能够对外部世界进行表征,形成认知、信念和预期,预先在若干选项中做出挑选。得名自哲学家卡尔•波普( 标签: | | | |

4867
正在对《自由的进化》译文做新一轮(但愿也是最后一轮)修补,看到译注部分时,发现其中一项涉及到丹内特的一个重要思想,值得单独拿出来介绍,下面是我给丹内特的“格列高利式造物(Gregorian creatures)”这个概念所加译注:
在《达尔文的危险观念》([[Darwin's Dangerous Idea]])第13章第1节(该节后来重用于《心灵种种》(Kinds of Minds)第4章)里,丹内特将意识和意向性立场的进化过程分为如下四个阶段: 1)达尔文式造物(Darwinian creatures):行为模式是“硬连线”的,试错只能通过代际变异和自然选择进行; 2)斯金纳式造物(Skinnerian creatures):具有表现型灵活性,在个体生活史中能够试错学习。得名自行为主义心理学家斯金纳([[B. F. Skinner]]); 3)波普式造物(Popperian creatures):能够对外部世界进行表征,形成认知、信念和预期,预先在若干选项中做出挑选。得名自哲学家卡尔•波普([[Karl Popper]]); 4)格列高利式造物(Gregorian creatures):得益于语言和文化传播,能从其他生物那里获取既经测试的知识和经验;人类的独特性在于他们是唯一的格列高利式造物。得名自心理学家理查德•格列高利([[Richard Gregory]])。
译注不敢写太长,在这里多说几句。 适应的过程可以视为“从众多可能行为选项中找出有利行为、淘汰不利行为”的过程,对于达尔文式造物,淘汰只能由自然选择进行,而斯金纳式造物可以经由个体经验(刺激)进行。 (接下去是关键一步),波普式造物要高级得多,可以在自己构造的一台虚拟机上对行为后果进行模拟,从而预先淘汰模拟结果不佳的行为,这台虚拟机就是波普说的个人观念世界(也就是波普三个世界中的第二个),观念世界是用一组概念和理论对现实世界建模(表征)的结果,而模型的模拟有效性取决于这些概念和理论的有效性,而行为结果可以为修正该模型提供反馈。 格列高利式造物不同于波普式造物的地方是:它用来模拟现实的那台虚拟机,(绝大部分元素)不是个人的,而是群体合作建造的,以文化的形式存在,个体在成长过程中,通过文化习得,安装了这套系统,用它来表征世界、模拟现实;其实在波普理论中已经有了这套东西,就是他的第三世界,或者叫客观知识体系。 介绍完了,下面是我的真正想说的。 我发现,同为格列高利式造物,传统的与现代的大不一样,根本区别是:个人观念模型的装配过程,多大程度上是自主的、个人有所选择的、因而个体之间不同的,还是高度同质且由其成长环境给定的。 在蒙昧时代的部落社会中,个人可以习得、用来装备自己那台虚拟机的知识系统,通常只有一套,即他的母语和部落传统,其中知识很大程度上以宗教作为载体,同一社会中不同成年个体的最终装配完成的观念世界,都大同小异。 后来随着社会规模扩大、文化日益复杂(特别是有了文字之后),同一社会不同个体的装配结果可以非常不同,其差异程度随下列因素而增强:富裕、教育、识字、贸易、分工、社会流动性…… 这一过程中,宗教的地位不断下降,但在社会底层,宗教仍是不识字穷人的观念来源主要。 科学只是另一个来源,但不是宗教的唯一(也不是主要)替代物,更主要替代来源是意识形态。 虽然信宗教的欧洲人越来越少,但(依我看)他们多半不是改信科学去了,而是取主流意识形态代替了宗教,当然,这些主流意识形态会揉进一些科学观念,但它们并不是科学体系。 所以,别以为欧洲教徒比美国少了科学精神就多了,主流意识形态告诉他们要反核反转,那就得反,信科学的永远是少数。  
[微言]个体经验与系统级知识

【2012-03-08】

@whigzhou: #饭文#为何资本家会反对资本主义? http://t.cn/zOcgQYh 复杂系统中,个体成功经历充其量只能证明他在如何取得个人成功上可能拥有一些正确知识,而丝毫不能证明他对整个系统的运行原理拥有任何可靠的知识……成功不必以拥有正确知识为前提,其次也更重要的:许多成功的必要前提恰恰是拥有错误的知识!

@whigzhou: 限于篇幅,写的很不过瘾,补充几句。本文提出了一个认识论问题:系统级知识能否从个体经验获得,或从传播机制中涌现?我的回答是:往往不能,并举了两个例子来说明,权当引子,尚待深入

@whigzhou: 这个“往往不能”意味(more...)

标签: | | |
4144
【2012-03-08】 @whigzhou: #饭文#为何资本家会反对资本主义? http://t.cn/zOcgQYh 复杂系统中,个体成功经历充其量只能证明他在如何取得个人成功上可能拥有一些正确知识,而丝毫不能证明他对整个系统的运行原理拥有任何可靠的知识……成功不必以拥有正确知识为前提,其次也更重要的:许多成功的必要前提恰恰是拥有错误的知识! @whigzhou: 限于篇幅,写的很不过瘾,补充几句。本文提出了一个认识论问题:系统级知识能否从个体经验获得,或从传播机制中涌现?我的回答是:往往不能,并举了两个例子来说明,权当引子,尚待深入 @whigzhou: 这个“往往不能”意味着,在系统级知识上,由个人经验和流行观念所构成的朴素科学是靠不住的,所以才需要科学方法论 @tertio:回复@whigzhou:认识论问题我喜欢。不过这个假说有点不确定,能不能换个确定一点的假说?毕竟很多成功者的确是因为对系统有正确的知识。 @whigzhou: 总体上,我目前只能得出这么个较弱的说法,但对于具体领域,可以有更强的结论,比如对文中两个实例,我的结论都是很强的 @whigzhou: 不知有没有朋友看出,本文在彩票问题上观点,颠倒过来便可适用于保险问题,呵呵 @踢星星:佩服楼主,但稍有不同看法:系统级知识不能从个体经验获得,同时个体经验不应该被完全否定。个体经验而来的知识,并非错误,而是不完全。这个区别很大。对这种经验知识的完全否认,往往就是所谓“理性的疯狂”或“致命的自负”之开始。 @whigzhou: 我不是完全否认,而是认为个人经验与系统级知识的获取之间没有相关性,前者无助于后者 @whigzhou: 我对“致命的自负”理解不是这样的,这种自负是指对通过科学方法获取的知识过于自信,并因此而轻易否定朴素知识和常识的价值,而我恰恰肯定了后者的价值,甚至是在承认它往往是错误的前提下依然坚持这一肯定! @踢星星:同意楼主。只是用“错误”这个带否定涵义的表述,容易引起误解啊。 @Freehkov: 我想请教一下,文中说"假如一个简单却错误的知识能以简洁的多的逻辑链导出同样的有利行动,它就是“值得”被保留的"。那么,如果学者们完善了解了一个知识体系后,用简化后“错误”的知识构建成一种能导出同样有利行动的学术,再用以教育和普及的话。你觉得这种做法可取吗? @whigzhou: 这问题挺棘手 @whigzhou: 初等教育和技能训练中,貌似许多时候正是这么做的,这可以理解,因为教育的目的未必是造就科学家或培养科学精神,可以是帮助学生获取生活/工作中有用的知识和技能,这么做好像无可指责,我觉得 @whigzhou: 但是,假如这么做会让你感到不安,那也没必要刻意去这么做,或者更妥当的办法,你可以加上一句“简单说,你不妨这么认为”,或“想象一下假如是这样……”之类 @whigzhou: 再考虑一下对称的情形:假如已经存在一种能够导出有利(或良好)行为的普遍迷信,揭示真相是否不可取呢?我认为不必有此顾虑,因为有用的迷信总是拥有压倒性的传播优势,揭示真相的努力很少有机会压过它  
饭文#X5:为什么资本家会反对资本主义?

(按:本文中有些句子容易被误解和歪曲,请注意我的措辞,稍有改动或增添,意思可能大不一样)

为什么资本家会反对资本主义?
辉格
2012年3月7日

关于市场制度的种种争议中,一个有趣的场景是,许多坐在书斋里的经济学家都在不遗余力的为市场制度辩护,反倒是不少在市场中如鱼得水、依靠市场取得了巨大个人成就的资本家,却常常从整体和根本上(而不只是某些细节上)指责和攻击市场制度。

比如最近,杰里米·格兰瑟姆(Jeremy Grantham)这位管理着全球最大基金之一GMO的大资本家,在其致投资者的信中,指出资本主义制度有着内在的自我毁灭倾向,因而必须由政府干预来预防和矫正,否则危机和崩溃难以避免;这种说法并不新鲜,不过是马克思观点的凯恩斯版本,多年来,末日博士鲁比尼(Nouriel Roubini)、投机大鳄索罗斯(G(more...)

标签: | | |
3371
(按:本文中有些句子容易被误解和歪曲,请注意我的措辞,稍有改动或增添,意思可能大不一样) 为什么资本家会反对资本主义? 辉格 2012年3月7日 关于市场制度的种种争议中,一个有趣的场景是,许多坐在书斋里的经济学家都在不遗余力的为市场制度辩护,反倒是不少在市场中如鱼得水、依靠市场取得了巨大个人成就的资本家,却常常从整体和根本上(而不只是某些细节上)指责和攻击市场制度。 比如最近,杰里米·格兰瑟姆([[Jeremy Grantham]])这位管理着全球最大基金之一[[GMO]]的大资本家,在其致投资者的信中,指出资本主义制度有着内在的自我毁灭倾向,因而必须由政府干预来预防和矫正,否则危机和崩溃难以避免;这种说法并不新鲜,不过是马克思观点的凯恩斯版本,多年来,末日博士鲁比尼([[Nouriel Roubini]])、投机大鳄索罗斯([[George Soros]]),都在不断宣扬这些观点。 对于反对市场制度,尤其是反对现有货币、资本和金融制度的人来说,大资本家们的言论是个有力的佐证:连市场制度的顶级参与者都说它不好,还能有假?难道书斋里的经济学家比他们更了解真相?确实,这种说法看上去很诱人,但假如我们仔细推敲一下便会发现,这种说服力只是直觉上的,而直觉并不总是靠得住的。 特别是在社会和市场这样的复杂系统上,特别是在制度这样的复杂问题上,个体经验和直觉多半靠不住,即便是参与范围最广泛、经验最丰富的参与者;在类似的复杂系统中,个体的成功经历充其量只能证明,他在如何取得个人成功上可能拥有一些正确的知识,而丝毫不能证明他对整个系统的运行原理拥有任何可靠的知识。 这一点即便在不那么复杂的系统中同样成立,比如一个顶级球员未必是个好教练,更未必是个合格的足联规则委员会主席,这三者所需要的恰当知识,不在同一层次上;然而在公众的讨论和评价氛围中,却总是有一种以个人成就为取信标准的倾向,该倾向不仅存在于公共话题中,在关于职业、经营、投资、修养、乃至价值观的种种话题中,都可见到它的影子,其最集中表现,便是近年来日益兴旺的成功学。 成功学的基本假定是:每项成功经历背后,都隐藏着一些有价值的东西,值得探索和学习;如果“有价值的东西”仅仅是指有助于获得成功的经验或启示,那自然没问题,可实际上,许多人将之等同于“关于世界的正确知识”,那就错了;首先,成功不必以拥有正确知识为前提,其次也更重要的是:许多成功的必要前提恰恰是拥有错误的知识! 最简单的例子是彩票,许多热衷于买彩票的人,其热情都来自对中奖概率的错误知识,错误的认为按某种方法选择号码会提高自己的中奖率,进而认为自己的预期收益率高于零,而拥有正确知识的人,预期收益率总是负的,因为总奖额总是小于销售额,所以对于后者,仅当其风险偏好很高时,才会买彩票,这样,在全部中奖者中,拥有错误知识者的比例,必定高于普遍水平。 彩票只是个极端案例,但其所揭示的原理适用于许多高风险行业,在这些行业中,脱颖而出的成功者,更可能是那些对许多风险十分无知的人,越是辉煌而不可思议的成功,所对应的风险无知者比例越高,英特尔前总裁格鲁夫([[Andrew Grove]])的名言很好的抓住了这一点:只有偏执狂才能生存。 当然,风险无知在成就极少数成功者的同时,也让大批人获得了负收益,所以尽管前者在传播学上具有压倒性的影响,但至少对于客观的探究者,用统计手段还是可以识别出错误知识的负面价值的,这没错,然而,还有另一类错误知识,它对成功的正面影响甚至在整体上都不会消除,因而其正确性完全不能用成功来衡量。 比如,我错误的认为,我的一举一动都会被全知的上帝看到,而他会因我的恶行而惩罚我的子孙,于是我小心谨守道德规范,善待邻居,从不欺诈客户,并因此而成为一名信誉卓著的成功商人;显然,上述错误知识在我的成功中起了关键作用,但它仍是错误的,并且这一错误不可能从对成败的观察与统计中被识别出来。 实际上,从成功这样的功利性目标出发,人们有充分的理由保留某些错误知识,这是因为人类认知能力的局限性;在许多情况下,从正确知识得出有利行动的逻辑链无法在此认知局限之内建立,因为该逻辑链所涉及的知识极度庞大,个人难以获得,或其中逻辑结构高度复杂,人脑难以处理,此时,假如一个简单却错误的知识能以简洁的多的逻辑链导出同样的有利行动,它就是“值得”被保留的。 当然,这个“值得”是基于个体功利性,而当我们以求真的姿态来考察社会这个复杂系统的运行机制,试图回答市场制度是否具有内在自我毁灭倾向之类的问题时,这些对个体成功有利的知识,假如已被更广泛而深入的研究证明是错误的,自然要加以摈弃,不能仅仅因为它出自成功人士之口便甘之如饴。  
[微言]编程与知识

【2012-02-14】

@trustno1v2:这两天冒出来的一个想法。软件设计领域的所采用技术和方法,最主要的目的在于整理各种旧知识,而非发明创造新知识.说白一点,软件攻城师的工作与图书馆管理员大体相当.当然可能算法不在此列.

@庄表伟:编程的主要工作,应该是翻译吧,把人类能够理解的语言,翻译为机器能够理解的语言。这其中的确没有什么新知识。另外,在软件领域,有一些特定的问题,需要被解决,这些问题,有些在传统领域可以借鉴,有些不行,所以还是会有一些新知识出现的。

@ter(more...)

标签: | |
4107
【2012-02-14】 @trustno1v2:这两天冒出来的一个想法。软件设计领域的所采用技术和方法,最主要的目的在于整理各种旧知识,而非发明创造新知识.说白一点,软件攻城师的工作与图书馆管理员大体相当.当然可能算法不在此列. @庄表伟:编程的主要工作,应该是翻译吧,把人类能够理解的语言,翻译为机器能够理解的语言。这其中的确没有什么新知识。另外,在软件领域,有一些特定的问题,需要被解决,这些问题,有些在传统领域可以借鉴,有些不行,所以还是会有一些新知识出现的。 @tertio:非也,与科学家所做的工作是一样的。 @whigzhou: 一项知识在被按某种形式形式化之前和之后是不同的东西,在被置入某个结构之前和之后也是不同的东西,而这些形式与结构与其所容纳的知识更是不同的东西(尽管在另一个层次上看,它们也是知识) @tertio:嗯,被一种形式绑定之后,知识的含义可能会发生很多变化 @whigzhou: 所以,当你将既有知识装进一个新结构时,你确实是在创造,即便你只是将既有知识装进一个旧结构,只要它还没被这么装过,也是创造,只是后者比前者的创造性略小 【后记】 发现当时有个关键意思漏了没说:我之所以强调将旧知识放入新结构是一种创造,是因为,所谓知识(或意义、信息)就是结构,因而将旧知识放入新结构就是创造了新知识。