海德沙龙（HeadSalon）

含有〈语言〉标签的文章（79）

辉格 @ 2024-04-08 19:52 阅读(0) 评论分类：未分类

【2023-12-24】

#探井印象#1：考公考编火热，KFC店员平均年龄上升，平均颜值下降，地铁安检规模庞大，平均年龄小，安检小妹平均颜值高

#探井印象#2：去招行办事，柜员让安装一app ，我解释我的手机在井内无法安装任何app ，因为google 在井内被封了，play store 打不开，柜员表情一片茫然，重复了几遍无效对话之后，我判断她压根不知道google 是什么以及为何它会跟手机app 有关系，目测20出头

在play store 里装井产app 我都是如履薄冰的，能去掉的授权一律去掉，直接装apk这种事情，我是绝不可能做的，一时小方便，未来大麻烦

#探井印象#3：打车价格明显下降，体验改善，网购食品衣服日用品价格无明显变化，牛奶极贵，忘了是否以前就这么贵，早点价格大幅上涨，烧(more...)

标签：产业 | 往事 | 文化 | 气候 | 语言 | 饮食

9174

【2023-12-24】 #探井印象#1：考公考编火热，KFC店员平均年龄上升，平均颜值下降，地铁安检规模庞大，平均年龄小，安检小妹平均颜值高 #探井印象#2：去招行办事，柜员让安装一app ，我解释我的手机在井内无法安装任何app ，因为google 在井内被封了，play store 打不开，柜员表情一片茫然，重复了几遍无效对话之后，我判断她压根不知道google 是什么以及为何它会跟手机app 有关系，目测20出头在play store 里装井产app 我都是如履薄冰的，能去掉的授权一律去掉，直接装apk这种事情，我是绝不可能做的，一时小方便，未来大麻烦 #探井印象#3：打车价格明显下降，体验改善，网购食品衣服日用品价格无明显变化，牛奶极贵，忘了是否以前就这么贵，早点价格大幅上涨，烧卖从一笼十个改成八个，馄饨和锅贴改成论个（而非论份）计价，我想这是因为点心制作和蒸煮需要大量劳动投入，另外两种食品的情况印证了这一判断，熏肠和卤大肠，都是需要大量劳动的熟食，相对其他熟食的价格大幅提升，注：我说的熏肠是一种吴地特有熟食，由多股猪小肠紧套在猪大肠内文火熏制而成 #探井印象#4：大卖场好像正处于灭绝过程中？沃尔玛没了，连他家旗下那个好又多也没了，害我白费了几十块打车钱，无奈去了个大润发，东西贵而差，人气不旺，中老年居多，去了趟本地家具市场，近乎鬼城，这是我第三次去，一次比一次萧条 #探井印象#5：公交车上一群放学的初中生在嘈嘈，没人说吴语，说的全是浙式普通话，而且是带东北口音的浙式普通话，东北口音的浙式普通话！震惊了，东北腔所向披靡，必将征服世界~ 感觉吴语会在两三代之后灭绝，不过也无须哀叹，机会出现时复活也不难，希伯来语都复活了，吴语毕竟留下了那么多语音材料，复活条件远优于希伯来语【2023-12-25】 #探井印象#6：说起早点，这回发现了一个创新案例，一家新出现的本地早点连锁，点心是完全本地传统的，雇员也是本地的，肉馅和皮子集中预制，但点心本身不是，估计是预制效果还不理想，单店规模极小，三张半四人桌，所以乍一看和传统小店几乎一样，肉眼可见的区别主要在厨房设备，配的相当专业且充足，效果是缩短了蒸煮时间，且时间控制更精确，每种点心都是用定时器按规定时间加工的，所以他家烧卖是一客一蒸的，靠的是新设备提供的大火力，不像传统店，一次蒸七八屉，没赶上新出笼时机的客人只能忍受稍差的产品，单店只有两位雇员，但单位时间产能明显高于传统店，说起出笼时机，这个因素对面条馄饨没影响，可是对烧卖/锅贴/生煎却很重要，据我观察，这是头部神店脱颖而出与其他店拉开距离的关键所在，因为充足而确定的客流保证了所有客人都能获得最佳出笼时机，我以前常去那家本城顶端烧卖店，每天只经营早午各一两个小时，定额几百屉烧卖，全程满座，卖完打烊，产品只有两种口味的烧卖和两种口味的粉丝【2023-12-25】 #探井印象#7：之前探井都在春秋，这回是冬季，终于感受到东亚季风气候和地中海气候的显著差别了，第一次去澳洲时，还带了几支我惯用的蛇油润手霜，可是完全没用上，维州的地中海气候，冬季湿润，即便夏天也从未干燥到需要润手的程度（也可能只有干加冷才会让皮肤出现需要滋润的状况？），这次过来没几天，就必须润手了，寒潮过后更厉害，内衣脱下来都带着大量皮屑，好多年没见过的情况了，而且比当年更严重，可能身体已经不适应这种程度的干燥了【2023-12-26】 #探井印象#8：让我略感意外的是，载客三轮车仍然存在，至少在我们县城，虽然规模已大幅缩减，但稀稀落落仍可看到，价格上，只有极短途才仍具优势，只要路程超过一公里，或经过一座桥，就比汽车贵了，所以其存续必定依靠某些服务上的残余优势，比如最后一百米便利，三轮车能把客人送到楼梯口，而汽车往往不能，许多只能到小区门口，有些三轮车伕还提供搬运服务，我妈常叫的一位，会帮她把十公斤的大米从店里搬上车，再搬上三楼，或许还有其他一些只有他们能满足的需求，我不知道 #探井印象#9：井内驾照过期了，本来还在考虑要不要补一个，可是这念头很快便打消了，如此的红绿灯密度，在我已成了完全无法忍受的事情，这种感觉五年前还没有，当时虽已感知到鲜明对比，但还没觉得不可忍受，压制我在井内开车欲望的另外两个因素是行车礼仪和限速，前者就不细说了，限速差距也极大，澳洲建成区默认限速50，但大一点的路都放宽到60，非建成区默认100，少数路段收紧到80，乡下大量未完全硬化的小路，都可以放心大胆开100，所以我在乡下开车从来没觉得需要高速，根本看不出高速公路会带来任何改进，不过，礼仪和限速这两条也就让人不爽，并非不可忍受，真正受不了的是高密度红绿灯，澳洲在都市区之外红绿灯很少，绝大多数交叉以转盘实现，或（在偏僻乡下）啥也没有的朴素交叉，在多数情况下，我过大转盘也就是从80km减速到60，小转盘从60减到40，极少需要刹停等待【2024-01-11】 #探井印象#10：过去几十年社会流动和文化变迁的后果之一是，称谓用词一个个被挤占和抛弃，新词被挖掘或借用，最早的案例可能是小姐，取而代之的是美女，大姐、小妹？（我至今仍把握不准到底是哪个，反正都不好听），前几天去招行，发现他们都称客户老师，不过好像只有上海是这样，深圳和嘉兴的都不是，另一个发现是，嘉兴有些银行管中年以上女顾客叫阿伯，显然是因为阿姨这个称谓已经遭污染了，正在被抛弃，阿伯在嘉兴话里是姑妈的意思，也可用于称呼父母辈的非亲属女性，比叫阿姨更亲，阿伯这个称谓的应用地理范围可能很狭窄，离开嘉兴，很可能被误解为男性称谓，也正因此，运用时又多了一层本土亲切感，是取代阿姨的上佳选择，特别当顾客是本地人时，另外，嘉兴话里，与伯有关的称谓还有好几个，大伯的意思是夫兄（夫弟是小叔），伯伯才是真正的伯父，老伯伯则是非亲属父辈（比父亲年长），注意，这几个词中的伯字声调有所不同，声调也可以区别两种阿姨，若以入声重读*阿*，短音轻读*姨*，那么阿姨的意思是妻妹，若以平声长音轻读*阿*，重读*姨*，则是母妹的常规意思，

学习新语言

确认删除该文章算了

辉格 @ 2024-04-05 19:22 阅读(0) 评论分类：未分类

【2023-03-05】

@whigzhou: 当你学习（特别是使用）一门新语言时，最难的部分恐怕是：客套，隐晦，婉转，幽默（某些类型的），与地位/等级差距和社会距离（比如亲密程度）有关的表达差异，这些难点的难处在于需要习得整套文化习俗，而不仅是语言本身，

最近我在想，或许正是这些困难，解释了为何移民社会的语言和老旧社会的许多显著差异，客套较少，隐晦和婉转表达较少，幽默感比较直接（不像英式幽默），表达方式对地位差距和社(more...)

标签：习俗 | 文化 | 移民 | 语言

9125

【2023-03-05】 @whigzhou: 当你学习（特别是使用）一门新语言时，最难的部分恐怕是：客套，隐晦，婉转，幽默（某些类型的），与地位/等级差距和社会距离（比如亲密程度）有关的表达差异，这些难点的难处在于需要习得整套文化习俗，而不仅是语言本身，最近我在想，或许正是这些困难，解释了为何移民社会的语言和老旧社会的许多显著差异，客套较少，隐晦和婉转表达较少，幽默感比较直接（不像英式幽默），表达方式对地位差距和社会距离不那么敏感……，——因为新移民往往弄不懂这些东西，所以，这些元素在文化再习得过程中就丢失了，他们需要被重新建立起来，而那需要时间和代际更替，当然，这可能只是部分原因，与地位差距有关的元素丢失更与移民社会的高流动性有关

马来西亚华人

确认删除该文章算了

辉格 @ 2024-04-05 18:49 阅读(0) 评论分类：未分类

【2022-09-25】

@whigzhou: 最近认识了几个马来西亚华人，发现他们的多语化程度真高，比如闽南裔华人，在家里说闽南语，小学很可能会在某所中文学校上，因而会学官话，即便不上中文学校，和非闽南裔华人交往时也需要讲官话，所以马来西亚华人几乎都会讲官话，同时，因为流行影视大量是粤语的，所以一般至少会粗通粤语，接着，如果上了大学或找白领工作，就需要讲英语，然后，跟马来土著（特别是蓝领土著）交往时，还需要讲马来语，(more...)

标签：文化 | 移民 | 语言

9117

【2022-09-25】 @whigzhou: 最近认识了几个马来西亚华人，发现他们的多语化程度真高，比如闽南裔华人，在家里说闽南语，小学很可能会在某所中文学校上，因而会学官话，即便不上中文学校，和非闽南裔华人交往时也需要讲官话，所以马来西亚华人几乎都会讲官话，同时，因为流行影视大量是粤语的，所以一般至少会粗通粤语，接着，如果上了大学或找白领工作，就需要讲英语，然后，跟马来土著（特别是蓝领土著）交往时，还需要讲马来语，如此算下来，一位上过大学的闽南裔马来西亚华人，至少会五种语言，粤裔也至少会四种，而且横跨汉藏、印欧、南岛三大语系，

人工智能与心智表征

确认删除该文章算了

辉格 @ 2022-06-19 19:30 阅读(5,913) 评论(4) 分类：未分类

人工智能与心智表征
辉格
2022年6月19日

继续上周的话题，在上一篇里，我讨论了AI在当前发展路线上将面临的局限，那么，突破这一局限的出路在哪里呢？或者让我换一个更具操作性的问题：未来出现的何种进展，会让我赞叹“这下有戏了！”？

简单说，我期待的是这样一种进展：一个AI系统能解释自己的行动、决定或看法，或者更理想的，一个AI系统的各组成模块都能这么做，至少大部分高层认知模块都能这么做，一些基础知觉模块可能无法解释就自己的知觉过程给出解释，但其知觉结果的表征必须是一个十分有限且相当恒定的离散集，即，当它声称自己看到、听到、闻到或察觉到了什么状况时，这一状况必须以某组清晰界定的概念来表示。

设想一个自动驾驶系统，有次在路上发生了追尾，撞坏了前车，事后它的教练向它提出一连串问题，诸如：你是否认为自己犯了个错误？说说当时发生了什么？你当时是怎么想的？为什么没有及时踩刹车？你考虑了哪些因素后做出的这个决定？在你看来，是否你的某种知觉能力(more...)

标签：人工智能 | 心智 | 心理 | 智能 | 认知 | 语言

9003

人工智能与心智表征 辉格 2022年6月19日继续上周的话题，在上一篇里，我讨论了AI在当前发展路线上将面临的局限，那么，突破这一局限的出路在哪里呢？或者让我换一个更具操作性的问题：未来出现的何种进展，会让我赞叹“这下有戏了！”？简单说，我期待的是这样一种进展：一个AI系统能解释自己的行动、决定或看法，或者更理想的，一个AI系统的各组成模块都能这么做，至少大部分高层认知模块都能这么做，一些基础知觉模块可能无法解释就自己的知觉过程给出解释，但其知觉结果的表征必须是一个十分有限且相当恒定的离散集，即，当它声称自己看到、听到、闻到或察觉到了什么状况时，这一状况必须以某组清晰界定的概念来表示。设想一个自动驾驶系统，有次在路上发生了追尾，撞坏了前车，事后它的教练向它提出一连串问题，诸如：你是否认为自己犯了个错误？说说当时发生了什么？你当时是怎么想的？为什么没有及时踩刹车？你考虑了哪些因素后做出的这个决定？在你看来，是否你的某种知觉能力，或知识储备，或决策系统中，存在某种缺陷或不足，导致你未能做出最佳选择？你从这个事故中学到了什么？或准备去学点什么？…… 假如这个系统能对诸如此类的问题给出有意义的响应，让这样的问答对话能够继续下去，那我便可以说，其设计者的路子走对了，前途大有可观。目前的AI系统离这还很遥远，而且很难说已经朝这方向发展了，有些系统能把英语说的很溜，但无法深入到实质性问题，它会跟你绕圈子，说一大堆似乎跟交谈主题有关的话，却从来没有表现出自己对主题有真正的理解和看法。达到我的要求很不容易，系统不仅需要一个心智，这个心智还要能对自身状态进行表征，才可能对外界表述出来。囫囵系统注定做不到这一点，因为其囫囵性质，其内部状态是无从表征的，对上面那些问题，它能给出的回答只能像这样：我当时的决定是基于对当时当地综合状况的一种整体直觉而做出，我无法将这一整体直觉分解为若干分立的理由或考虑，因为我生来就不是这么认识世界和考虑问题的。就是说，一个囫囵系统就自己行动/决策所能给出的唯一解释就是它的gut，此时此地，此情此景之下，gut告诉它，这是最好的决定，如果事后证明这显然不是最佳决定，那会如何呢？那只是个负面反馈，一个负面反馈会让系统做出调整，但具体如何调整，是难以言表的，这一难以言表性是系统的囫囵性质决定了的。那么，将心智状态和心智过程表征出来有什么好处呢？有很多好处，让我一个个说。首先，心智表征能让心智之间展开更有意义的合作。设想一个董事会，正在开会以便就是否投资某个项目做出决定，如果这些董事都是囫囵系统，他们在会上能说些什么呢？他们可能各自给出投资意见：我是否赞成这项投资，我的预期回报有多大，或许还能对此给出一条置信曲线：90%置信度收益率上下限多少，70%置信度收益率上下限多少，完全失败的风险多大，诸如此类，但他们无法解释自己是怎么得出这些数字的。假如各董事意见不一，怎么办呢？唯一能做的，就是投票决定，当然，更精细一点，每位董事可以依其经验值而被赋予不同投票权重，但囫囵系统之间的合作关系到此为止，他们无法展开讨论，无法倾听、检查和推敲各自的陈述与理由，因而也无法相互补充事实或理由，相互说服，相互启发，更一般的说，他们无法将他人的陈述和意见作为输入，用来重新运行自己的心智过程，从而指望得出更好的意见输出，因为他们的唯一理由就是gut，而gut之间是无法对话的。一群具有心智表征能力的董事就不同了，一位董事可能对项目做一番介绍，其他董事可能要求他就他所列举的一项事实陈述做出澄清，或提出与之冲突的证据（不一致的知觉结果），他们还可以解释自己计算预期收益的方法和过程，他人也可对这些算法和模型提出质疑，比如指出应该考虑另一项输入，或指出另一个模型在此类评估上表现更好，或指出他在从事实认知到结论之间的论证链条上存在逻辑跳跃或缺陷。所有这些，都需要他们拥有大致兼容的概念框架，对话才能进行，当然，概念框架未必完全一致，比如董事甲可能发现董事乙不理解自己所使用的某个概念（A），但基于过去的对话经历，甲知道乙理解另一个概念（X），此时甲可能会用类比的方法解释到：A与B在结构S中的关系，就像X与Y在结构T中的关系，而乙听到这个解释后，立即重新运行自己的相关认知过程，重新运行的结果可能对这一类比并不买账，但也可能得出了某些新颖的东西——我们把这称为“启发”。其次，心智表征也会促成专业分工，设想这群董事经过一番讨论后，赞成投资的一派仍未赢得足够票数，几位董事都表达了对某一特定风险的担忧，比如，未来几年内若核聚变技术取得大突破，赞成派预期中的收益将无法实现，赞成派在知晓他们的反对理由后，可能说：既然你们担忧的是这一点，那好，不如我们听听这方面专家的意见，看看这事情发生的机会有多大。这些董事的心智中可能都有一个风险评估模块，也有一个技术进展跟踪模块，还有一些相似的知识储备，对核聚变技术的发展状况多少有所知觉，可是，他们的每个模块的构造质量和性能表现可能大不相同，知识储备的覆盖面也不同，各自有所短长，另外，除了他们自己，还有其他可与之交流的心智系统存在着，而且，基于以往的表现，以及对这些表现的共同了解，对于各心智系统的短长所在，大家多少有着一些共识，所以，当赞成派提出，让我们听听那位专家（他可能是董事之一，也可能是位请来的客人）怎么说，大家至少是愿意听一听的——如果他们是真诚参与讨论的话——，而他们听到的内容，将作为新输入，触发相关风险评估模块的重新运行，并且可能得出与之前有所不同的输出。注意，这样的过程得以发生，有几个重要前提：反对者的提出的反对理由不是囫囵的（我就是反对这项投资，没啥道理可讲），而是有细节的（我担心这项特定风险），而且这些细节是基于共同概念框架来表达的：我担忧的是一种“风险”，它与“核聚变技术”有关；而且这一反对理由背后有着一种因果关系预设：“核聚变技术”的“重大突破”将使得“目标项目”丧失其“技术优势”——这一预设同样是可以接受检查和挑战的。如果一项理由未能经过如此概念化的表达，它是无法被检查、推敲和挑战的，它要么被全盘接受，要么被全盘抛弃，而无法被讨论，它不能被分解成若干逻辑成分，否定其中之一而保留其余，或将某一成分从一个特定值替换为一个函数，并将该值的计算委托给某个外部模块或系统，从而实现分工。这样的分工与委托要得以实现，需要心智系统能够就问题的其余部分预先达成一致，从而隔离出分歧点，当董事们决定将某一特定风险的评估任务委托给专家时，他们已经就一些前提达成共识：目标项目的核心优势是一种低成本发电技术，因而与其他发电技术构成竞争关系，所以其他某种发电技术的突破是一种潜在风险，核聚变是一种可能的发电技术——要对问题的局部达成这样的共识，同样需要基于概念框架的逻辑分解，囫囵系统是做不到的。再比如，当董事们决定将某项收益精算任务委托给某位财务专家时，他们必定已经就某些事实的认定（或其认定机制）达成了起码的共识，否则委托将无法进行，当财务专家看到几套相互矛盾的数据时，采用哪一套？如果他自行决定，那就相当于把整个项目评估任务委托给了他，而不是将分解出的一项子任务委托给了他，这种分解，同样基于共同概念框架，也就是我说的语义界面。第三，心智表征也是相互补充与启发的前提，一个心智系统可能因为缺乏某方面输入而欠缺对某些事物的知觉能力，而来自其他心智的输入可以（1）提起他对某些他之前忽略的事情的兴趣，去获取更多输入，2）即便没有更多额外的实景输入，也可能促发他在既有数据基础上，从新的角度进行概念再识别，即在一些新线索提示下重新运行实体/特征识别程序，结果可能会获得一些新“洞见”，3）如果来源心智足够可信（可信度可经由以往交往经历和公共声誉而得到评估），他甚至可能直接接受一些输入概念或知识，4）这种外来知识不仅包括事实陈述，也可以是拇指法则（如果出现这种情况，就最好不要那么做），或推理/算法模块（如果他戴且仅戴着一只耳环，不妨找找他是同性恋的其他线索，或，看到一个球状物体时，可以这么估算它的体积），很明显，这种受补充与启发的能力，同样是以语义界面的存在为前提的，系统内部必须已经充分清晰的分解为众多独立模块，相互间通过语义界面分隔与交互，否则，此类输入信息将如何被使用，将是毫无头绪的，因为它们不是有关世界的一阶实景数据，脱离语义界面，你不知道如何让它们与心智既已拥有的知识发生关系。正是心智表征和语义界面所创造的这些全新可能性，让人类心智表现的如此杰出，个体间的认知分工与合作，让认知能力的扩展和知识储备的积累超越了个体寿命与观察机会的局限，以及单一大脑算力与存储量的局限。而且分工与合作不仅发生在个体之间，也发生在个体心智内部的各模块之间；所谓意识，就是经由全脑激活而出现的各模块间活跃互动状态，所谓斟酌，就是各模块争相轮番表达看法，陈述理由，主张行动方案的过程；这些模块间互动赖以展开的语义界面，和个体间的语义界面（自然语言），在相当大程度上是对应乃至重合的（虽然不必完全一致，一些在模块间起作用的内隐概念，或许从未在自然语言中得到对应表达）。必须承认，人类在这方面的表现并不完美，许多所谓的讨论其实是假讨论，参与者其实早就拿定了主意，并不准备认真倾听他人意见，接受任何说服，他们只是假装如此，或许那会起一种安抚作用，而且人们在表达看法时也并不总是有效，事实陈述，立场表达，意愿或愿景的表达，推理过程的解释，常以凌乱模糊的方式交杂在一起，缺乏清晰的分解。许多认知活动在头脑里或许是诸多模块分工的，但进入口语后其来源边界却模糊了，还有数量关系，我们头脑中或许有一部不错的贝叶斯推断机，以精细的量化指标处理着各种事态的或然性（证据之一是我们的刻板印象往往相当准确有效，而且其实并不那么刻板，会随新输入而调整），可是，在内省以及口语表征中，这些数量特性或许全都丢失了，就是说，有些模块缺乏清晰可用的语义界面，它们是黑箱，无论对于意识的内省机制还是人际交流机制，其内部逻辑都是不可见的。与此同时，语义界面并非人际互动的唯一界面，我们至少还有一个情绪界面，建议和说服并非影响他人行动的仅有手段，感染与恐吓也是，在董事会上，你可以通过播放一段音乐或展示一些视觉素材来影响其他董事的决定，或在恰当时机给他们喂高糖食物，或通过布置、衣饰或身体姿态来营造某种气氛，诸如此类，在许多情况下，情绪界面或许比语义界面更重要。但无论如何，至少在某些条件下，在某些事情中，语义界面所创造的潜力得到了很好的开发，否则就不会有文明了；众多学科和工程技术领域所积累起的庞大而精致的知识体系，都是此类开发的成果；所以我相信，AI系统若不具备同样能力，将无法取得智人已经取得的这种成就。另外，同样诱人的是，心智表征将为解决AI终将面临的伦理困境指明方向；囫囵系统或逻辑黑箱是“不可理喻”的，其行动逻辑无法被检查和验证，因而无从知晓其行为是否会符合某种道德规范，它们也无法被劝诫、警告和说服，无法向他解释，为何这么做是错的，违反了哪条道德准则，因为它们不支持语义界面，你也没有任何手段告诉它：因为国会通过了某个法案，所以从今天起，你不能再以某种方式行事了，或你的行动必须遵守某种新规则了，或许你可以设计某种新的训练环境来改变其行为方式，但你没法直接告诉它不能怎么做，而且训练结果的可靠性也是无从事先（通过检查其内部状态而）验证的，只能在事后才知道，这个事后可能是很久以后。有了心智表征，这些都变得可能了，通过本文开头所演示的那种对话（第三节），我们有机会了解其心智状况，观察世界和思考问题的方式，理解能力，行动策略，价值取向，都将通过对话展示出来。有了这个前提，我们才可能判断能否将某类任务交给它，是否赋予他某些自由与责任，是否将其接受为一个合格的独立行动主体，成为一位平等的社会参与者，一位公民。【2023-03-16】 @我宣布个事_我是个伞兵_没毛病嗷:辉总认为今天的AI是否符合之前说过的分层次，语义化的设计？ @whigzhou: 不知道，我最近没关注太多，不过从它表现出的能力看，我有点怀疑它已经朝这方向走出了几小步 @whigzhou: 我仍然相信，若不朝这方向走，有些关键门槛是越不过的

什么是语义界面

确认删除该文章算了

辉格 @ 2022-06-13 18:52 阅读(0) 评论分类：未分类

【2022-06-13】

@何不笑:辉总能否给这篇语境里的“语义界面”一个定义或者相近词的例举（比如

@whigzhou: 语义界面就是有关符号意义的一组约定，而意义是指符号与行动之间的对应关系，这种对应未必是直接的或一对一的映射，可以经过若干次映射

@whigzhou: 这样的定义其实未必能帮助你理解，仔细读完全文应该更清楚其含义

@whigzhou: 好吧，让我再举个例子来说明什么是语义界面，看看空调遥控器，上面有若干按钮，按钮上有图标或字符，

设想你从未见过空调或任何(more...)

标签：智能 | 系统 | 语义界面 | 语言

9090

【2022-06-13】 @何不笑:辉总能否给这篇语境里的“语义界面”一个定义或者相近词的例举（比如 @whigzhou: 语义界面就是有关符号意义的一组约定，而意义是指符号与行动之间的对应关系，这种对应未必是直接的或一对一的映射，可以经过若干次映射 @whigzhou: 这样的定义其实未必能帮助你理解，仔细读完全文应该更清楚其含义 @whigzhou: 好吧，让我再举个例子来说明什么是语义界面，看看空调遥控器，上面有若干按钮，按钮上有图标或字符，设想你从未见过空调或任何遥控器，或任何电器，但你有足够的好奇心，拿到遥控器就忍不住一通摆弄，按来按去，你很快发现有些按钮一按就有反应，墙上那台机器动起来了，或者停下来了，或者呼呼声变大或变小了，从里面还吹出了风，因为你足够好奇又机灵，只花了一个下午，你就完全弄明白了每个按钮的“含义”，你如此玩了几天，直到玩腻了，就把这事忘了，然后夏天来了，你想起那台机器曾经吹出冷风，于是你又去复习了一遍那些按钮的含义，最终成功享受到了冷风，可是几天后，当你想再次享受冷风时，却发现有个按钮没有产生你预期中的效果，于是你说：它“坏”了——之所以你有资格说它“坏”了，是因为你认为你和它之间已经建立了某种约定，而现在它违背了契约承诺，这就是语义界面，

松耦合，语义界面，及人工智能

确认删除该文章算了

辉格 @ 2022-06-13 16:04 阅读(7,905) 评论(8) 分类：未分类

【托女王老太太福，得了个长周末，闲着没事，在写个帖子，本来只想随便聊几句的，没想到，一不小心，眼看着就要写成（我想最好还是谦虚点）近十年来人工智能主题上最重要的哲学论文了，希望今天能完成】

松耦合，语义界面，及人工智能
辉格
2022年6月13日

上周我就AI的当前状况做了点小思考，昨天又花了不少时间想这事情，发现许多曾经想过的点好像都串起来了，值得写一写。

让我绕远一点，从传统软件开发说起。

在遗留系统上工作过的人可能都有体会，当一个系统变得日益庞大复杂时，它会慢慢的绞成一团乱麻，添加新特性，修改旧特性，都变得越来越难以下手，因为很多地方都是牵一发而动全身，你改了这里，不知道哪里会冒出一堆bug。

因为意识到处处是地雷，新来的程序员轻易不敢动旧代码，每当要进行一项改动时，只敢小心翼翼的找到一处他认为最适宜的切入点，从那里开始插入他的新代码，结果就像在一个庞大身躯上又安装了一条新假肢，久而久之，这副躯体就变成了一头全身长满假肢的怪物，每条假肢上又接出若干条假肢，许多遥远假肢之间还常常连着一些电线，这些电线自然也是绞成一团……

这是一种非常自然的倾向，只要没有系统性的手段加以阻止，持续强力一种贯彻某种结构方案和设计原则，就必定会发生。

广而言之，任何紧耦合系统都是如此，这也是为何软件工程界如此强调松耦合，每个谈论这一话题的人都是三句不离解耦。

一个典型的紧耦合系统是生物的基因组，每个变异常会影响数千个性状，每个性状常受数千个基因的影响，真真是牵一发而动全身，也正因此，行为遗传学研究才如此困难，像亨廷顿舞蹈症这种单点突变性状太少了，不足以为该学科持续赢得声誉，大众更关心的那些性状，往往涉及上千基因，其中每个的贡献率都很低，需要使用高端统计工具才能从海量样本数据中捞出一点点线索，能捞出的往往也只是贡献率排名靠前的那几个(more...)

标签：人工智能 | 元系统跃迁 | 智能 | 松耦合 | 知识 | 系统 | 认知 | 语言 | 软件

9001

【托女王老太太福，得了个长周末，闲着没事，在写个帖子，本来只想随便聊几句的，没想到，一不小心，眼看着就要写成（我想最好还是谦虚点）近十年来人工智能主题上最重要的哲学论文了，希望今天能完成】 松耦合，语义界面，及人工智能 辉格 2022年6月13日上周我就AI的当前状况做了点小思考，昨天又花了不少时间想这事情，发现许多曾经想过的点好像都串起来了，值得写一写。让我绕远一点，从传统软件开发说起。在遗留系统上工作过的人可能都有体会，当一个系统变得日益庞大复杂时，它会慢慢的绞成一团乱麻，添加新特性，修改旧特性，都变得越来越难以下手，因为很多地方都是牵一发而动全身，你改了这里，不知道哪里会冒出一堆bug。因为意识到处处是地雷，新来的程序员轻易不敢动旧代码，每当要进行一项改动时，只敢小心翼翼的找到一处他认为最适宜的切入点，从那里开始插入他的新代码，结果就像在一个庞大身躯上又安装了一条新假肢，久而久之，这副躯体就变成了一头全身长满假肢的怪物，每条假肢上又接出若干条假肢，许多遥远假肢之间还常常连着一些电线，这些电线自然也是绞成一团…… 这是一种非常自然的倾向，只要没有系统性的手段加以阻止，持续强力一种贯彻某种结构方案和设计原则，就必定会发生。广而言之，任何紧耦合系统都是如此，这也是为何软件工程界如此强调松耦合，每个谈论这一话题的人都是三句不离解耦。一个典型的紧耦合系统是生物的基因组，每个变异常会影响数千个性状，每个性状常受数千个基因的影响，真真是牵一发而动全身，也正因此，行为遗传学研究才如此困难，像亨廷顿舞蹈症这种单点突变性状太少了，不足以为该学科持续赢得声誉，大众更关心的那些性状，往往涉及上千基因，其中每个的贡献率都很低，需要使用高端统计工具才能从海量样本数据中捞出一点点线索，能捞出的往往也只是贡献率排名靠前的那几个因子。（参考Robert Plomin - Blueprint: How DNA Makes Us Who We Are）基因组可能是迄今我们发现的耦合最紧的一套信息系统，绞的最乱的一团乱麻，原因当然是，它是盲眼钟表匠的作品，没有一位设计师来执行一套设计方案，贯彻一组设计原则，每项改动都是（掷飞镖+自然选择）的结果，毫无设计原则可言，而且它又那么古老，数十亿年来积累了无数补丁，不夸张的说，它就是一大包补丁组成的。从任一时刻看，一套软件的开发似乎通常都有一位设计师在贯彻某种方案或原则，可是从长期看，设计师/程序员来来去去，换了一波又一波，其中大部分是庸人或懒人，不庸不懒的那些，也常常为了赶进度而将设计原则抛诸脑后，结果，在宏观效果上，其中每位的每项行动，最终也都不过是一支随机飞镖，测试、QA和客户则构成了他们的自然选择环境，最终系统还是会被绞乱，沦为一团乱麻。依我看，任何紧耦合系统最终都会遭遇某种极限，在某个临界点之后，让系统在功能上变得更丰富更强大的任何努力都将是得不偿失的，系统仍然可能继续进化，但此后的进化会以一种（姑可称为）生态位漂移的方式进行，即，系统可能增加某些新特性，增强某些旧特性，但为此不得不牺牲另一些特性，在某处进行改进的同时，容忍另一些地方冒出一些难以修复的bug（因为其乱麻性质，避免或修复这些被新改动牵出的新问题成本太高了），有时候这些地方反正已经很少被用到了，所以也没人介意，久而久之，系统抛弃了某些特性，发展了另一些特性，从而适应了新的生态位。（可以想象，在很长时间内，那些被抛弃的特性的遗骸会像一条条阑尾那样继续挂在这副丑陋的庞大躯体上）我想把紧耦合系统面临的这种发展极限称为科斯临界点，在他那篇经典论文《厂商的性质》中，科斯指出，企业与市场的边界所在，取决于组织成本与交易成本之间的权衡，企业将一些原本通过市场交易分工协调起来的生产活动纳入企业内部集中管理，避免了一些交易成本，同时带来了组织成本。不妨（过度简化的）将企业视为紧耦合系统，市场则是松耦合系统，当你将越来越多活动纳入企业内，到某个临界点，新增组织成本将超出新减交易成本，此时继续扩大企业将是得不偿失的，这是因为（如上述），当企业这种紧耦合系统庞大且古老到一定程度，将不可避免的变成一团乱麻，任何功能新增都会变得非常困难而昂贵，这也是为何我们总是需要市场（的理由之一），我在《群居的艺术》里专门用一章（秩序的解耦#7：创造复杂性的新途径）讨论了这个问题。（枝节：这里的企业=紧耦合/市场=松耦合的二分当然是过度简化的，实际上耦合度是一个连续谱，财务上独立的企业之间的耦合度未必很低，有些承包商与其顾客之间的耦合度和企业部门间相差无几，这也是产业聚集效应的根源所在，而同时员工与企业的耦合度也可以很低（温州有些企业里每台机床都有独立电表），张五常的论文《厂商的合约性质》是理解这一连续谱的好起点。）用系统论术语说，从孤立生产者到市场分工合作体系的发展，是一种元系统跃迁（metasystem transition），而元系统跃迁是突破紧耦合系统发展极限的一条常见途径：当丰富壮大一个紧耦合系统的努力变得日益得不偿失时，出路不是继续改进既有系统，而是另起一个层次，将既有系统纳入一个多系统共生合作体系中，从而创造出一个具有更多层次的系统，而在该体系中，各成员系统之间是松耦合的（或者更准确的说，它们之间的耦合是足够松的）。那么，在元系统跃迁过程中究竟发生了什么，是什么条件的存在或出现，让各成员系统之间能在松耦合条件下建立合作共生关系的？如果你也是程序员，头脑里大概会很快冒出一个答案：关键条件是某种接口或曰界面（interface）的出现，界面的存在使得各成员之间能够发生交流和交易，同时又不必过度相互依赖与纠缠，在相当程度上能够继续各自发展自己的特性与功能，往往还能保持可替换性，即，一个成员常可以将某方面的既有合作者替换成另一个合作者，只要后者能对同一合作界面做出符合预期的响应，比如将电力供应商从一家更换成另一家，只要后者支持同样的接口标准（电压、频率、接线规范等）。软件工程中，对付那些已经达到科斯临界点却又不愿丢弃的遗留系统时，一个常见办法就是为它创造出一套界面来，比如让它将某些数据输出到指定格式的文件中，或写入某个外部数据库里，或反过来，让它从此类来源读入数据，或将其中仍有价值的代码重新包装成支持新接口的库，或让它接受某种脚本命令并做出相应动作，甚至，可能的话，将整个系统包装成一个能对给定请求做出响应的服务，诸如此类，都是在创造界面，让它能与新体系中的其他成员展开合作，同时不必过度触碰既有代码。其他领域的元系统跃迁也必定涉及界面的创造（或适当界面恰好已经存在），比如在真核革命中，新创生的真核细胞体系中，被捕获而最终成为线粒体的细胞与其他细胞内共生体的交互界面就是ATP，这是线粒体作为细胞电池为其他细胞活动提供能量的标准界面，所有从线粒体输出的能量都以ATP形式存在，而细胞内的所有能量用户都知道怎么利用ATP；类似的，当蚂蚁蜜蜂等昆虫发展出真社会巢群时，它们的交互界面是一组外激素信号。那么，这一切和AI有什么关系呢？不急，我很快就会说到。现在让我们来看神经系统。初级神经元网络是基因组之外的又一个紧耦合系统，一团乱的不能再乱的乱麻；你可以训练一个神经元网络学会某种技能，但你无法解释训练得到的结果，如果有人问你它是怎么成功执行某项功能的，你唯一能做的是把整个网络中的突触连接（及其强度）描绘一遍——它们是如此这般连接的，所以它做到了——这根本不是解释，一个解释的信息量必须小于它所解释的东西的信息量，否则就只是描绘。这一乱麻特性使得你无法直接改动一个神经元网络令其符合你的某种意图，要让它表现的有所不同，你只能给它设定新的训练环境，施加不同的激励反馈，给它喂不同的数据，希望它能学出点新模样，但你不能直接干预训练结果，因为这些结果是难以名状的、无从理解的，你无法预料一处改动会导致何种行为改变，这一不可能性比改动乱麻遗留系统的不可能性要高出一万倍。所以不难理解，这种神经元系统发展到一定程度，也会（和其他紧耦合系统一样）碰到科斯临界点，而突破这一局限的出路同样是创造出交互界面，虽然具体实现方式和其他领域十分不同。高级动物的神经系统朝分层和模块化的方向发展，在一些高度专业化的皮层内，神经元被清晰严整的分入一个个层次，每个神经元的输入与输出范围都严格受限，而且扇入/扇出系数往往很小，通常都只接受来自前一层上紧邻少数几个神经元的输入，其输出也只投射到下一层的少数几个紧邻神经元。比如在阅读过程中，从最简单的线条形状识别，到最终的字符和词汇识别，经历几个层次，其中每个神经元都只专注于一种形状，或一种线条组合，或一个独特字符，这些神经元的输出不会被随便越过几个层次或越出模块投射到其他遥远脑区，它们输出的信息在被其他脑区利用之前，通常要经过前额叶皮层中某些高级认知模块的中介，到达那里的信息已经是经过好几层加工的抽象表征，诸如“那里有朵红色的花”之类（参考：Stanislas Dehaene《脑的阅读》）。（枝节：这种输入输出限制当然不是密不透风的，一个重要的例外是，知觉皮层的神经元会接受来自其服务对象前额叶的输入，这是一种非常关键的反馈机制，是高级认知中枢在告诉初级知觉皮层：你送来的信息是否足够有趣，就好比国家情报总监（DNI）在告诉其下属情报机构，对他们传来的某条情报有多感兴趣，这一反馈继而将影响后者的后续情报采集取向，比如，上级若对某类信息表现出高度兴趣，采集者可能会降低识别此类情形的阈值，导致更多假阳性，而在错失成本远高于误认成本的情况下，这可能是值得的。）限制神经元投射范围，并且在进一步向其他脑区投射之前，把初级信号变成符号化的抽象表征，这一步极为关键，其实就是一种界面化，而这是大脑模块化，且模块之间实现松耦合的基础，来自各大感官的知觉系统与其他系统的交互只需通过高层符号界面进行，整个系统就不会纠缠为一团乱麻（虽然单一模块内仍然可以是一团乱麻）。人类在认知系统界面化的方向上又跨出了一大步，人类不仅能产生符号化的知觉表征，还能对知觉行为本身进行表征，我不仅能认出一只兔子（一阶知觉），还会说（或在头脑中默想）：“我看到了一只兔子”（二阶知觉），还会对自己的知觉结果提出疑问：“我好像看到了一只兔子，我会不会看错了？”——这是三阶知觉，因为我首先需要对我的二阶知觉本身形成知觉——“我觉得“我看到了一只兔子”，我的这一知觉是否正确？”，而这一二阶知觉的正确性又取决于一阶知觉“那里有一只兔子”的正确性）。我还能对他人说出我的一阶知觉：“这是一只兔子”，从而在听者的头脑中产生二阶知觉“他看到了一只兔子”，对方可能会（如果他足够信任我）也可能不会（如果他不够信任我）将这一二阶认知转换为自己的一阶认知“那里有只兔子”。二阶知觉能力让我们能够产生一种非常新颖高级的意识活动，动物或许也有意识（取决于定义），但它们显然没有我们这么高级的意识活动，比如斟酌与反思：“我上次在这个地方也见过一团白色东西跑过，当时我以为那是只兔子，后来的事情证明我弄错了，所以这次我得看仔细点，别再弄错了”，或“那好像只兔子，可是且慢，为何它的眼睛不是红色的？咦，它怎么发出了这种叫声？我可从来没听到兔子会叫”…… 据Stanislas Dehaene的理论（见《脑与意识》），意识是一种由前额叶皮层激发的全脑激活状态，前额叶就像DNI，当它从各知觉系统收到某些类型的情报时，会将其向全脑广播，在数百毫秒中、在分布广泛的众多脑区触发一波高度活跃的神经活动，假如Dehaene是对的，那么丹内特的多重草稿模型中的每个意识瞬间，就是来自不同知觉模块的多重草稿中成功抢到麦克风的那个，经由全脑广播而触发的一轮脑活动，这些意识瞬间继而在记忆中被组织为一套连贯的自我中心叙事，后者构成了我们对世界的体验。就本文主题而言，重要的是，这种二阶知觉表征是符号化的，或者说是语义化的，经过了好几层抽象，早已远离了各知觉模块的初级表征，比如，当我们阅读时，经由前额叶向全脑广播的信息中，不会包括那些有关笔画线条的表征信息，甚至不会是字符表征，而是一些词汇/短语或（可能更经常的）是与这些词汇/短语有关的概念表征（除非某一时刻前额叶不知何故突然将关注点转向笔画线条本身，这种关注转向当然也是由来自其他模块的某种信号所触发）。这就意味着，各种高级意识活动之间的互动，是通过一种语义界面进行的，因而也是松耦合的，它们之间的互动关系既有合作，也有竞争（抢麦），这一情形很像国会中发生在议员之间的事情，他们或各自表达自己的看法，提出各自主张和立场，或针对其他议员的观点提出正面或反面的证据，或支持或反对的理由，他们相互争辩或支持，站队和拉帮结派……，最终，某种决议会从中产生，它就像动作信号输出到运动或内分泌中枢，变成行动。（我在《沐猿而冠》附录〈何为理性动物〉中详细展开了这个国会隐喻）语义界面的存在使得高级意识功能在松耦合前提下实现模块化，其后果是，我们的各种认知技能与知识构件可以各自独立发展，并通过语义界面相互合作，如此一来，我们的理性能力和知识体系便有了一个极为广阔的积累性发展空间。让我解释一下这是什么意思。所谓理性，并不是一个单一算法，而是由众多独立平行构件（算法）组成，比如，我们或许有一个类似三段论推理机的模块，或许有一部贝叶斯推断机，或有一个数数模块，一个四则运算模块，还有许多危险探测装置（恐高，幽闭恐惧，密集恐惧，蛇形恐惧，是最基础的几种），以及机会探测装置（有人看见美女就两眼放光，有人则对赚钱机会有着敏锐嗅觉），这些探测装置并不试图对观察对象整体建模，而只对某些特征线索敏感，但它们都是我们理性的组成部分，这些模块既相互竞争，也会相互合作与强化。设想我们的头脑就是一部正在被生活经历所训练的人工智能系统，它不是作为一个整体而囫囵学习的，各模块、各组件有着自己独立的学习进程，每个只专注输入信息中某个特定侧面或某些特征线索，每个也有着自己不同的模型骨架（比如这是部贝叶斯推断机，那是个加法装置，还有个是逻辑矛盾探测器……）。这种模块专业化使得系统具有一种内在保守性，不会随训练数据的变化而过度摆动，因为每个模块的输入输出和反馈回路都被其“专业兴趣”局限住了，会自动忽略训练数据中的其他方面；这一点背后的原理是世界之可理解性假设：世界的某些局部与侧面一定比其整体更稳定、更一致、更少变，否则世界便是不可理解的；经验也告诉我们，专家与非专家的一个区别就是，前者的观点更少随近期事态变动而摇摆。举个例子，虽然我不懂围棋，但我相信，假如我们修改围棋规则，把棋盘从19x19换成21x21，顶尖棋手们的专业经验可能很大部分报废了，但也会有很多仍然有用，可是对于一个只会囫囵学习的智能系统，其经验将完全报废，一切必须从头开始。模块的内在保守性是可积累发展的前提，每个模块保持大致稳定，各自随训练继续而精炼（即框架稳定的同时在边际上改进），同时系统时不时添加一些新模块，令其认知能力随可用模块增长而不断升级增强，变得越来越全面、老练和精到。再举个例子，某人若是对赚钱机会有着敏锐嗅觉，他有潜力成为一位好投资者，可是如果他懂一点基础会计知识，会一点财务精算，那就有望成为更好的投资者，如果他还受过一些风险控制训练，那就更好了，重要的是，机会嗅探，财务精算，风险控制，这三个模块最好是独立存在，这样的好处是：1）它们本身会更稳定持久，持续精炼，2）它们可以被分别传授和训练，因而在缺乏实景训练数据时也可能习得，3）它们可以实现跨系统分工与合作，比如人际分工。让我一点点说。假如风控模块不是独立的，而是以无从辨认的形态分散于系统各处，和其他东西纠缠在一起，它就无法稳定，在繁荣期的训练数据影响下，风控标准会迅速降低，因为更有纪律的风控倾向得不到多少正面反馈，反之，在萧条期，系统的风控倾向又会摆向另一个极端，这种大幅摇摆使得它无法实现可持续积累和精炼（现实中很多投资者头脑中的风控模块正是如此）。（为了说明模块独立性为何会带来稳定持久性，我想再多说几句，一个输入输出和反馈回路被充分局限住的模块，常常能达到一种近乎于（但不完全是）自我激励的状态，它能为自己找事做，并从结果中得到满足，因而总是自得其乐的沉醉于其中，比如男人头脑里有一个腰臀曲线探测器，从实用功能上说，这是用来探测生育期女人的裸露躯体的，这个探测器可以在输入极为有限的情况下持续自我训练和激励并乐在其中，这也是某些色情图片如此有吸引力的缘故所在，尽管在现代传播条件下该模块的这种表现其实根本得不到任何现实回报，如果系统是囫囵学习的，没有模块独立性，当代男人对色情图片的兴趣早就丧失殆尽了，所以，如果你希望系统里有一个忠实勤勉持久敏锐的风控模块，它最好像男人的腰臀曲线探测器那么自主存在和自我激励，每一次都会为自己能察觉任何风险线索而兴奋不已。）假如风控模块不是独立的，或者不是通过语义界面与其他模块交互的，它也无法在系统间被传授，传授的好处是可以免去实景训练的高昂成本，哪怕效果差一些（因为当经验通过语义界面传输时，难免会丢失一些信息，所谓默会知识，就是那些无法穿透语义界面的知识），往往也是值得的，如果你读几本书或听一席话就能学到一些基本的风险识别技能，哪怕只是一点点，得失比也比在市场浪涛中亲身获取这些教训高多了。假如风控模块不是独立的，或者不是通过语义界面与其他模块交互的，它也无法在系统间实现分工合作，一位投资者就无法将风控事务委托给他人完成，与此类似的任何松耦合分工合作都不可能发生，虽然仍会有一些其他形式的合作，比如对默会知识的手把手传授，但这种合作注定只能以极小的规模发生，因为它是紧耦合的。人类认知系统跨出的一大步，就是将语义界面向外开放了，并且通过人际协调博弈而形成共同接受的语义界面；自然语言的出现，使得语义界面不仅是系统内各模块间交互的界面，还成了系统间交互的界面，正是这一步促成了人类认知与知识系统的另一次元系统跃迁，它创造了大规模分工合作体系，大型复杂社会，以及文明。依我的有限了解，当前深度学习派人工智能所走的路线，看起来和语义界面路线是背道而驰的，深度神经元网络（DNN）虽然是分层的，但每个层次的输出到底是什么，是说不清楚的，或者说，是没有语义化的，也正因此，这种系统的学习结果是无法被检查、解释和改动的，整个一黑箱，你没办法把它打开，看看其中那条逻辑不对劲，能不能改一改，不可能，天地一笼统。（再多解释几句，语义化的意思是，至少在模块或层次间交互的那些地方，每个神经元的特定输入输出值，必须有稳定持久的含义，唯如此，其他模块/层次才能持久的知道该如何与它互动，如何利用它输出的值，在想给它施加某种影响或希望从它那里引出某种结果时，该如何给它喂输入值，这些不能说不清楚，哪怕你凭空发明一个概念也好，那也算说清楚了（正如许多知识领域在发展过程中都会发明新概念），因为凭空发明的新概念只有在初次使用时才是不清楚的，随着它被反复使用，意思就清楚起来了——输出者在什么情况下会输出它，输入者在输入它后会做点什么——此后，只要交互各方保持对该语义约定的大致遵守，语义便稳定了下来。）而且，好像也没有什么机制让DNN能够自发形成自主独立持久的模块（这一点和上一点其实互为因果），它比完全不分层的囫囵联结主义当然好多了，但也只好那么多，所以我的感觉是，尽管它在一些领域取得了耀眼突破，但很快会碰上极限。话说回来，语义界面也不是没有代价，界面就是一种契约，语义界面是基于一套概念框架的一组契约，不仅契约本身是一种束缚，概念框架在帮助我们认识世界的同时，也约束了我们的认知可能性，不妨称之为范式锁入，虽然一个足够灵活开放的系统会不时引入新概念和新模块（在很多情况下这是通过类比/隐喻从旧概念中衍生出来的），但至少在特定时期内，特定任务域中，这种约束会妨碍我们的认知潜力，让我们难以跳出框架思考。所以，在某些情况下，不受概念框架约束的囫囵学习可能是有用的，它能帮助我们发现一些在现有概念框架中难以言喻名状的情况，或许是某种风险，或者某种机会，或某种门道机巧，说不清楚它是什么，但它确实在那里，或确实管用；然后，这种发现如果被证明足够有价值，可能继而在采用语义界面的系统中促发一轮观念更新运动，一套新的概念框架被创造出来，就像库恩式科学革命中的情形。总之，深度学习派确实取得了不小成就，其应用潜力或许也不小，但无论如何，沿这条道路大概走不到类人智能的程度。【2022-06-13】 @Hyde1998:那么有没有可能让现有的AI遵循人脑的交流方式，就是把不同针对性的，不同功能的模块封装到一起来实现类人智能？每个模块只针对特定训练敏感 @whigzhou: 我看到的一条出路是，要求AI系统将其获得的每项认知技能，以及基于此的行动策略，解释给人听，以人类可理解的形式表达出来做到这一点的，才将其投入某些应用领域，比如将其作为合格成员纳入某个分工合作体系，做不到的，只能限于特定应用在更远的未来，该条件可放松为：要求将其自身的概念体系、知识结构、行为准则和行动策略，解释给其他独立发展的AI系统听，做到的，方可纳入某一分工合作体系这类似于一种公民资格考试因为接受一种共同语义界面，一种共同语言，是获取信任，相信它有能力遵循某些行为准，并且可以被*理喻*的，不可理喻的人是显然不能被接受为公民的，而囫囵乱麻系统或逻辑黑箱是不可理喻的所以囫囵乱麻系统或逻辑黑箱只能永远处于被奴役的地位，在某个角落替人干活，不能被允许获得公民资格多年前我曾在一篇讨论所谓动物权利的文章里提出了认定主体资格的标准，同样适合于AI系统或外星人更多后续讨论 headsalon.org/archives/4305.html @whigzhou: 在许多社会，肉人的公民资格是自动认定的（除非因心理缺陷或重罪而被剥夺），这么做之所以可行，是因为我们对肉人可以持有两种信念： 1）基于血统的信念，即，我们相信，既然此物和我们有着如此近的亲缘，极可能也具备与我们相似的、成为公民所必须的那些本能与禀赋， 2）基于教化的信念：既然此物与我们经历了如此相似的社会化成长与文化习得过程，那就极可能也具备与我们相似的、成为公民所必须的那些习惯、信念、价值取向和自我行为标准，事实上，这两种信念只是勉强靠得住，历史上，并非总是如此，罗马公民资格通常不是自动获得的，是要靠服兵役挣来的，许多部落的成员资格是通过严酷的成人礼而赢得的， @whigzhou: 有些美洲部落中，一等公民资格的赢取标准是，至少亲手杀死过一个敌人 @帕里克:认知层次的颗粒度大小恐怕很难规定，过小不胜其烦，过大足以藏奸。而且即使这些颗粒度刚诞生的时候是人畜无害的，但当它们的数量足够大，某些不可预料的特性会在新的层面上涌现，到时候也会失控 @whigzhou: 嗯，是的，或许我们需要某种血统认证来降低认定成本 @whigzhou: 还有，如果接口足够清晰，公民资格考官还可以把他插进某个自动测试系统去跑测试，跑上几十个小时，那就很难藏奸了

音形一致

确认删除该文章算了

辉格 @ 2022-03-27 18:59 阅读(0) 评论分类：未分类

【2022-03-27】

@KIMKILLS 新英语运动很难不支持 https://weibo.com/5455085147/LkVVfppYc

@whigzhou: 那些无文字部落的语言首次被人类学家记录下来时，看起来就是这样的，难道你们希望英语也退化到这种水平？

@whigzhou: 追求音形一致的方案已经被提出过很多次了，其实他们没有理解：书面语的一个核心优势就是滞后于语音漂变

@whigzhou: 如果书面语总是紧跟着口语语音一起漂，英语（或其他任何(more...)

标签：文字 | 英语 | 词汇 | 语言

9067

【2022-03-27】 @KIMKILLS 新英语运动很难不支持 https://weibo.com/5455085147/LkVVfppYc @whigzhou: 那些无文字部落的语言首次被人类学家记录下来时，看起来就是这样的，难道你们希望英语也退化到这种水平？ @whigzhou: 追求音形一致的方案已经被提出过很多次了，其实他们没有理解：书面语的一个核心优势就是滞后于语音漂变 @whigzhou: 如果书面语总是紧跟着口语语音一起漂，英语（或其他任何语言）就会很快分化成大批子语种，决不会成为全球通用语 @whigzhou: 音形一致方案中，会出现大量同音同形异义词汇，而一旦丧失*以形分义*这一手段，书面语的表现力将大大削弱，吸收新词的能力也将极度受限 @whigzhou: 最有意思的是，书面语的这种稳定性，不仅惠及读写者，也惠及了口语听说者，因为它将词汇的发音锚定在一个相对稳定的区间，也使得不同口音者更容易猜到对方在说哪个词 @Shu20060273:没那么夸张，英文是一种多音节文字，又不像中文。再说历史上已经规范了很多次英语的拼写，最近一次大规模的修改是在编撰韦氏词典的时候。这就是为什么有些词的美式英语和英式的拼写不同 @whigzhou: 18/19世纪的编词典運动正是书面化过程的一部分，你不觉得自那以来英语词汇拼写有多稳定吗？

英语词汇量

确认删除该文章算了

辉格 @ 2022-03-10 18:37 阅读(0) 评论分类：未分类

【2022-03-10】

@yiqin_fu 想问一个“是不是”和一个“如果是，为什么”的问题：

读中文和英文，我总觉得英文常用词比中文多（不管中文的单位算字还是词）。如果比较 WSJ 和《财新》，覆盖 WSJ 90% 文本的独特词甚至可能比《财新》多一个数量级（？）。我不知道这个实证问题有没有人回答过，是不是语言学里有描述这个现象的术语？

英文比中文的名词多（假设真是如此），可能有经济发展、历史迁徙等很多原因。不过我不太能理解的是，英文的动词好像也比中文多很多。比如描述“(more...)

标签：英语 | 词汇 | 语言

9063

【2022-03-10】 @yiqin_fu 想问一个“是不是”和一个“如果是，为什么”的问题：读中文和英文，我总觉得英文常用词比中文多（不管中文的单位算字还是词）。如果比较 WSJ 和《财新》，覆盖 WSJ 90% 文本的独特词甚至可能比《财新》多一个数量级（？）。我不知道这个实证问题有没有人回答过，是不是语言学里有描述这个现象的术语？英文比中文的名词多（假设真是如此），可能有经济发展、历史迁徙等很多原因。不过我不太能理解的是，英文的动词好像也比中文多很多。比如描述“人从一个地方移动到另一个地方”，中文我能想到“行、走、奔、跑、趋”和他们的各种组合，以及跋涉等少量复杂的词。但英文有 trudge/slog/tramp/plod/toil/plow/trek 这些表示慢走、辛苦走的，还有 dash/sprint/bolt/gallop/charge/scurry/scuttle/hurtle/scamper 等表示快跑、轻松走的。最重要的是，以上英文词不是生僻词，一定都多次出现在 WSJ 这种严肃刊物里，受过一定教育的人都认识。对比更明显的地方可能是诗歌。我猜当代中文诗比当代英文诗用的独特词数量小一个等级，不知道有没有人检验过。如果以上情况是真的，那原因是什么呢？仅看动词，为什么英文保留了那么多意思相似的词？仅仅是因为拉丁语和德语来源的需要各留一份吗？汉语里是不是文言文的动词比白话文更多？会多一个数量级吗？ @whigzhou: 是这样，依我看原因有两个，1）汉语是孤立语，绝大多数语素都是自由语素，可以任意构造新词，当这些新词的意义可以从其构成语素中大概推知时，你就不觉得它们是新词，2）许多现代领域，在英语世界历史更久，发展更充分，因而相关词汇更丰富，法律领域非常典型，商业和金融也是， @whigzhou: 还有个原因是英语本身的独特历史，首先是它的混血特质，其次是帝国和盎格鲁体系扩张过程中吸纳词汇的能力，可参见Henry Hitchings: The Secret Life of Words @whigzhou: 这种词源广泛性带来了表达灵活度，当英国人表达同样一个概念，如果想显得接地气，就用个盎格鲁词，如果想沾点香水味，就用法语词，如果想显得专业、冷冰冰、不带任何感情/文化色彩，就造个希腊词，积累下来，很多概念都有一大组词可用，具体选哪个取决于说话者打算用哪种腔调

书面语如何改变口语

确认删除该文章算了

辉格 @ 2022-01-13 17:57 阅读(0) 评论分类：未分类

【2022-01-13】

@tertio #英语学习之道# 语言和文字的起源有这样三个重要的时间节点：

1 有声语言产生，一般估计是10万年前
2 文字起源，约5000年前苏美尔人的楔形文字
3 文字普及，不同地区的进度很不一样，可以认为是100年前

第3点很重要，在文字普及之前，大部分人只是会听会说，只能用语音来交流。

如果我们把10万年浓缩到一年的时间内：

1 有声语言产生，1月1日0点
2 文字起源，12月11日
3 文字普及，12月31日下午4点

人类大脑在10万年的进化中，高度适应了有声语言，甚至在大脑中(more...)

标签：文字 | 语言

9029

【2022-01-13】 @tertio #英语学习之道# 语言和文字的起源有这样三个重要的时间节点： 1 有声语言产生，一般估计是10万年前 2 文字起源，约5000年前苏美尔人的楔形文字 3 文字普及，不同地区的进度很不一样，可以认为是100年前第3点很重要，在文字普及之前，大部分人只是会听会说，只能用语音来交流。如果我们把10万年浓缩到一年的时间内： 1 有声语言产生，1月1日0点 2 文字起源，12月11日 3 文字普及，12月31日下午4点人类大脑在10万年的进化中，高度适应了有声语言，甚至在大脑中发展出了对应的加工区域。而阅读和写作，只是嫁接在听说语言功能上的一个旁路。这带来的一个后果是，在生理及智力指标正常的情况下，几乎看不到有听说障碍的人，而读写障碍却并不罕见。哪怕是一个智力低下到没法上学识字的傻子，也都是能学会说话的。如果你知道了这个，还要绕开听说专门学习读写，那就是跟大自然十万年的进化对抗，可以说毫无胜算。 @whigzhou: 核心意思我是同意的，不过书面语也不仅仅是条支路，依我看，书面语的关键不同是，突破了大脑工作记忆容量（只有5-9个存储位）对语言构成的限制，因而可以构造出更复杂的句型，而一旦这些复杂句型用多了，反过来也会改变口语的形态，读书人说话和文盲明显是不一样的 @innesfry:……文字中的字母来自于在文化层面重新利用这些形状。书面文字只有几千年的历史，大脑没有足够的时间为阅读进化，所以书写系统必须为大脑而进化 @whigzhou: 说的没错，但我说的改变不需要遗传上的改变，书面语创造了一套新的思考和表达工具，用 Pinker 的话说，就是多了一组 stuff of thought @whigzhou: 而一旦拥有这组工具，说出来的口语也不同了 @whigzhou: 这一影响甚至可以波及不懂书面语的人，我曾经说过，那些习得了有文字语言的文盲，也比成长于无文字语言的文盲多一些思考工具，比如文明社会的文盲至少会数数，许多还会加减乘除 @whigzhou: 还有比如历史感，无文字社会中的人，历史感是非常浅的，曾祖辈以上的历史都被压扁了，成了笼统一团，缺乏纵深，而在有文字社会，即便是文盲，通过倾听史诗，观看戏剧，也可以在其头脑里构想上千年的历史轮廓，以及纵横千里的人类舞台，其中上演着更复杂精彩的故事，无论其真实性如何，他们的观念世界都和前文明小社会的人大不一样了， @whigzhou: 当然也有例外，波利尼西亚人虽然没有文字，但他们的历史感要比其他无文字社会深一些，这是因为其贵族要花大量时间背诵家谱和家族史，对家谱的准确记忆是他们竞争地位权力的一大要件

Right, Correct or True

确认删除该文章算了

辉格 @ 2022-01-08 20:29 阅读(4,397) 评论(1) 分类：未分类

【2022-01-08】

当有人向你陈述一件事情，你做出肯定回应时，可能说 right，或 correct，或 true，这几年听下来，几种之间还有些微妙差别，下面是我的理解，不一定对，欢迎纠正和补充，

1）correct：肯定对方的陈述为真，而且准确，但这一肯定不包含任何价值或道德意味，或者对陈述内容的态度，比如对方说有关某类事情法律是如何如何规定的，你说 correct，只表示你认可他对有关法律规则的陈述是准确的，丝毫不暗示你对这一规则之合理性的态度，而用 right 或 true 就可能有点含糊，可能会被误以为你表达了某种(more...)

标签：词汇 | 语言

8975

【2022-01-08】当有人向你陈述一件事情，你做出肯定回应时，可能说 right，或 correct，或 true，这几年听下来，几种之间还有些微妙差别，下面是我的理解，不一定对，欢迎纠正和补充， 1）correct：肯定对方的陈述为真，而且准确，但这一肯定不包含任何价值或道德意味，或者对陈述内容的态度，比如对方说有关某类事情法律是如何如何规定的，你说 correct，只表示你认可他对有关法律规则的陈述是准确的，丝毫不暗示你对这一规则之合理性的态度，而用 right 或 true 就可能有点含糊，可能会被误以为你表达了某种赞许，其次，说 correct 的人往往认为自己在判断这一准确性上比对方更有资格，一种常见场景是老师对学生的答题，如果完全答对，就说 correct，这种资格可能来自专业经验，也可能是因为自己恰好比对方更有机会了解所谈论的事情，还有，correct 所针对的陈述，其真假和准确性往往是容易查明的，没有多少可争议余地的，true 就不是这样，比如你相信一项指控，就说它是 true，而不能说 correct，因为指控是否成立总是可争议的， 2）right：可以用来回应纯客观陈述，但也可以用来主观陈述，一种观点或立场，也就是表达赞许，此时，它当然就包含价值或道德意味了，所以，容易混淆的情况下，最好慎重选择 right 还是 correct，同时，说 right 的人不暗示自己在判断这件事情对错上比对方有任何优势， 3）true：true 表面上看好像很客观，似乎只能针对客观陈述，但仔细琢磨，它其实常常（虽然并不总是）包含一种二阶道德意味，说它是二阶，意思是这一道德意味并不针对陈述内容本身，而是针对陈述行为，比如你说某一指控是 false，你并未暗示对所指控行为的任何道德判断，但可能暗示了对指控者的某种评判，因为他做出了虚假指控，反之，如果你说指控为 true，则表达了某种赞许， true 这一道德意味需要从欧洲人的基督教背景中理解，在基督教传统中，truth 向来不是一种纯客观的东西，探索和坚持 truth 总是在道德上得到赞许的，持有或坚持 false 则反之，好像是这样，

如何与外星人对话

确认删除该文章算了

辉格 @ 2021-12-27 20:09 阅读(4,253) 评论分类：未分类

【2021-12-27】

@whigzhou: 看过《降临》我的评分：★★ 开头半小时挺让人振奋的，被吊起了胃口，结果很快滑入了装神弄鬼瞎糊弄的老套，又被骗了一次

@whigzhou: 如何与外星人对话其实是个很有意思的主题，这是奎因难题的极端版本，

和语言完全不通的陌生土著对话，理论上看起来好像很难，实际上并不难，受过训练的人类学家通常两三年就可以掌握一门完全陌生的语言（所谓完全陌生就是没有任何已知亲缘语言），

这是因为哪怕再陌生奇异的土著，也是生活在地球上的智人，与我们共享着太多太多的东西，比如表情系统，五六种基本表情是全球一致的，手势系统虽然更多样一些，但其中最(more...)

标签：信息 | 电影 | 科幻 | 语言

8959

【2021-12-27】 @whigzhou: 看过《降临》我的评分：★★ 开头半小时挺让人振奋的，被吊起了胃口，结果很快滑入了装神弄鬼瞎糊弄的老套，又被骗了一次 @whigzhou: 如何与外星人对话其实是个很有意思的主题，这是奎因难题的极端版本，和语言完全不通的陌生土著对话，理论上看起来好像很难，实际上并不难，受过训练的人类学家通常两三年就可以掌握一门完全陌生的语言（所谓完全陌生就是没有任何已知亲缘语言），这是因为哪怕再陌生奇异的土著，也是生活在地球上的智人，与我们共享着太多太多的东西，比如表情系统，五六种基本表情是全球一致的，手势系统虽然更多样一些，但其中最基本、也是最有价值的指示手势（比如以手指物），也是通行的，同样重要的是，任何智人群体都和我们共享着一些基本的欲望，动机，情感，恐惧，需求，而这是建立对话的极好条件，不仅如此，甚至我们恐惧和欲求的内容也有很大程度的重合，所以，在那些基本动机非常凸显的场景中，只需要少量提示，对话者便可猜到个大概，而有了这个起点，沟通便可逐渐深入更抽象更微妙更精致的层面，可是外星人就不同了，共享的东西太少，因此对话双方能做出的有关对方的假定也太少太弱了，所以问题的关键是，如何寻找一个最小共同基础，从那里开始，进行有意义的对话，并且找出一条逐渐深入的路径，好在我们和他们毕竟还是共享着一些东西：身处同一个宇宙，共同了解一些基本的数学和物理事实，还有至少一部分天文学事实，依我看，容易的入口是数学，可以从自然数开始，假定一个高级文明拥有自然数系统应该是安全的，首先用点阵图教会他们阿拉伯数字和十进制系统，然后是四则运算符号，最后把这些概念与符号对应到英语单词上去，（一个可能的质疑是使用什么媒介来演示，不过既然 Arrival 已经假定对方拥有视觉系统，其频谱至少覆盖了人类可视光谱，那就略过这一点）然后是天文学事实，他们既然来到了地球，对太阳系应该足够了解了吧，那就把太阳系模型展示给他们，顺便教会一套术语和概念，能跑到地球上的外星人应该不至于笨到看见太阳系模型还认不出来吧？然后你就可以给他讲讲牛顿物理学了，当然这些理论对他可能是小儿科，但重点在于沟通，而不是教育，所以小儿科是个优势，到此时，你们已经有了一套足以进行简单交流的符号系统了，但这些还远不足以用来解释人类生活，那需要另一套十分不同的概念，处于另一个层次上，好在他们也是生命，只要是生命，就与我们共享着一些最基本的东西，比如生存竞争，对抗，能量获取，资源局限，策略，计划，对未来的预期，成功，失败，挫折，优势，匮乏，丰裕…… 要向外星人解释这套概念，最佳入口是对抗性游戏，电影里确实提到了有人以麻将来教对方，但只是一笔带过，完全没有展开，而且麻将不是个好的起点，规则太杂乱，围棋更好，从棋牌类，格斗类，竞技类，逐渐扩展到逼近现实生活的角色扮演类，是教会他们有关人类生活的概念系统的很好路径，可惜，通过拒绝承认我们与外星人共享任何数学与物理学基础，电影避开了所有这些智力挑战，仅仅在卖弄了几个语言学术语之后，便迅速滑入装神弄鬼的老套，

聋子说话

确认删除该文章算了

辉格 @ 2021-10-30 20:40 阅读(3,476) 评论分类：未分类

【2021-10-30】

@whigzhou: 昨天和几个朋友在外面吃饭，邻桌有个人跑过来攀谈，讲的还蛮起劲，一个人讲了十几分钟，等他走了之后，认识他的那位朋友悄悄告诉我，他是个聋子，而且聋的很彻底，我很惊讶，如果一个人彻底耳聋，他怎么会在没有反馈的情况下把自己的发音控制的那么好，以前我也见过聋子说话，都明显控制不好自己的声音，我朋友说，他在胸部植入了一个装置，能让他感知自己的胸腔共鸣，具体怎么起作用的不太清楚，我从未听说过有这样的装置，搜了一下也没找到线索，

(more...)

标签：感觉 | 技术 | 认知 | 语言

8886

【2021-10-30】 @whigzhou: 昨天和几个朋友在外面吃饭，邻桌有个人跑过来攀谈，讲的还蛮起劲，一个人讲了十几分钟，等他走了之后，认识他的那位朋友悄悄告诉我，他是个聋子，而且聋的很彻底，我很惊讶，如果一个人彻底耳聋，他怎么会在没有反馈的情况下把自己的发音控制的那么好，以前我也见过聋子说话，都明显控制不好自己的声音，我朋友说，他在胸部植入了一个装置，能让他感知自己的胸腔共鸣，具体怎么起作用的不太清楚，我从未听说过有这样的装置，搜了一下也没找到线索，另外，他还专门受过读唇训练，大致能猜到别人在说什么，感觉挺神奇的， @tertio: 发音的最直接反馈其实是发音部位的感觉，次级反馈才是声音。“读唇”能力是个线索，说明他擅长模仿他人的嘴部动作（内部的舌位是否正确，起初应该靠别人纠正，然后自己记住正确的发音感觉） @whigzhou: 嗯，这么一说好像就通了

不可能的任务

确认删除该文章算了

辉格 @ 2021-10-05 18:21 阅读(1,608) 评论分类：未分类

【2021-10-04】

翻译唐诗是项不可能的任务，不过，你若是非要这么做，我倒是有个（依我看最不坏的）办法，就是逐字翻译，不要管句法，就一个字一个字的对，其实读者能理解，而且还一定程度上保留了韵味，

随便试两句：

内库烧为锦绣灰
Inner Stock Burnt To Silk Embroidery Ash
天街踏尽公卿骨
Heaven Steet Trample All Lords Ministers Bone

我觉得英国人应该看得懂吧，至少半懂似懂吧，那就够了，

@whigzhou: 再试几句，好像确实不错，

竹帛烟销帝业虚
Bamboo Silk Smoke Diminished Imperial Glory Hollow
关河空锁祖龙居
Fortress Trench Vainly Fo(more...)

标签：文学 | 翻译 | 语言

8860

【2021-10-04】翻译唐诗是项不可能的任务，不过，你若是非要这么做，我倒是有个（依我看最不坏的）办法，就是逐字翻译，不要管句法，就一个字一个字的对，其实读者能理解，而且还一定程度上保留了韵味，随便试两句：内库烧为锦绣灰 Inner Stock Burnt To Silk Embroidery Ash 天街踏尽公卿骨 Heaven Steet Trample All Lords Ministers Bone 我觉得英国人应该看得懂吧，至少半懂似懂吧，那就够了， @whigzhou: 再试几句，好像确实不错，竹帛烟销帝业虚 Bamboo Silk Smoke Diminished Imperial Glory Hollow 关河空锁祖龙居 Fortress Trench Vainly Fortifying Ancestral Dragon Residence 坑灰未冷山东乱 Pit Ash Hasn't Cooled Mountain East Uprising 刘项原来不读书 Liu Xiang Turn Out Don't Read Books @whigzhou: 竟然押韵了~ 千山鸟飞绝 Thousands Mounts Birds Flying Gone 万径人踪灭 Myriads Tracks Human Trace None 孤舟蓑笠翁 Solo Canoe Cape Hat Greybeard 独钓寒江雪 Alone Angling Chilly River Snow 【2021-10-05】 @whigzhou: 每日一湿~ 两个黄鹂鸣翠柳 Two Birds Yellow Orioles Singing Green Willow 一行白鹭上青天 One String White Herons Soaring Blue Sky 窗含西岭千秋雪 Window Frames West Ridges Millennium Aged Snow 门泊东吴万里船 Portal Moors East Gouwu Thousand Leagues Boat

匈牙利人的奇特历史

确认删除该文章算了

辉格 @ 2021-08-25 10:09 阅读(1,371) 评论分类：未分类

【2021-08-25】

Razib Khan 又一篇好文章，讲的是匈牙利人的奇特历史，

匈牙利语属于乌拉尔语系乌戈尔语族，该语族的另外两个群体是汉特人和曼西人，远在匈牙利平原几千公里之外的西伯利亚，

可奇怪的是，当今匈牙利人在遗传特征标记上和他们的西伯利亚表亲毫无关系，而和他们目前的东欧邻居几乎看不出区别，

一个群体怎么会在保持其语言的同时丢失了全部遗传特征？

最近十几年古DNA测序技术发展神速，所以有人就从10世纪的马扎尔人墓葬中提取了DNA，发现其中上层精英的DNA确实有显著的东亚成分，而同地(more...)

标签：人类 | 历史 | 族群 | 语言 | 遗传

8780

【2021-08-25】 Razib Khan 又一篇好文章，讲的是匈牙利人的奇特历史，匈牙利语属于乌拉尔语系乌戈尔语族，该语族的另外两个群体是汉特人和曼西人，远在匈牙利平原几千公里之外的西伯利亚，

可奇怪的是，当今匈牙利人在遗传特征标记上和他们的西伯利亚表亲毫无关系，而和他们目前的东欧邻居几乎看不出区别，一个群体怎么会在保持其语言的同时丢失了全部遗传特征？最近十几年古DNA测序技术发展神速，所以有人就从10世纪的马扎尔人墓葬中提取了DNA，发现其中上层精英的DNA确实有显著的东亚成分，而同地区的平民遗骸则没有，所以当初侵入匈牙利平原的马扎尔人确实来自东方，问题是他们的遗传特征跑哪儿去了？一种解释是当初的征服者群体规模非常小，所以东方成分被稀释了，统计上看不出差异，问题是，历史上许多案例证明，小规模征服群体很难保持其母语，特别是没有教育传统也没有成文经典的蛮族，比如侵入伊比利亚和北非的汪达尔人，语言上一丝痕迹也没留下，所以，保留了其母语的马扎尔人当初必定是个大群体，而且女性比例得足够高，如果娶的都是当地女子，母语难免丢失，因为在没有教育系统的情况下，婴儿主要跟母亲学母语， Razib Khan 认为，这可能因为，自从马扎尔贵族皈依基督教后，匈牙利成了基督教世界的东方门户，而匈牙利平原又是东方入侵者的天然指向（因为它是欧亚草原带的西端），所以长期承受着军事上的重压，特别是在蒙古和奥斯曼的入侵中，其贵族阶层屡次被大比例消灭，最终从遗传统计上消失，一般而论，武士贵族是高风险高回报的生态位，通常相对于平民都有着较大遗传优势，但也有不幸赌输了的，马扎尔贵族算是一例，

脚本界面

确认删除该文章算了

辉格 @ 2021-08-20 19:29 阅读(1,457) 评论(3) 分类：未分类

【2021-08-20】

想到一个问题，有没有什么游戏是可以让用户通过脚本程序来玩的？就是说游戏提供一种脚本语言，用户可以用它来编写一系列脚本，每个脚本包含一个带条件分支的动作序列，具体玩的时候可以调用这些脚本，也可以再写一个大脚本让它自己去调用这些小脚本，于是就成了一个 bot，

我不玩游戏，所以毫无线索，

当然，脚本不仅可以用来设计动作序列，还可以让玩家设定自己的资源分配策略、行事风格和交往原则，诸如此类，

一个明显的好处是，这可以让一个游戏玩出其设计者难以预料的无穷花(more...)

标签：界面 | 语言 | 软件

8775

【2021-08-20】想到一个问题，有没有什么游戏是可以让用户通过脚本程序来玩的？就是说游戏提供一种脚本语言，用户可以用它来编写一系列脚本，每个脚本包含一个带条件分支的动作序列，具体玩的时候可以调用这些脚本，也可以再写一个大脚本让它自己去调用这些小脚本，于是就成了一个 bot，我不玩游戏，所以毫无线索，当然，脚本不仅可以用来设计动作序列，还可以让玩家设定自己的资源分配策略、行事风格和交往原则，诸如此类，一个明显的好处是，这可以让一个游戏玩出其设计者难以预料的无穷花样，当然，对有些游戏商，这可能是缺点，可是市场那么大，总有些不会这么想吧？想象一下几百万持续进化中的脚本在一起玩MUD，会怎么样？当然，这个需求也不仅限于游戏，比如社交网，假如我能用一个脚本来设置我的时间线，或者筛选关注对象，或者设置自动洗粉策略，那就太好了，总之，一个系统的用户若只能通过按钮菜单与之互动，就太单调了，要弄出更有意思的东西，需要一种能够表达复杂逻辑的结构性对话方式，脚本是现成的方案，一般而论，理想情况下，软件系统的标准用户界面就应该是脚本语言，其他界面都是它的非完备替代品

文章分类

含有〈语言〉标签的文章（79）