» 『伊讲』前传：外部语义网络的诞生

辉格 @ 2015-04-15 17:26 阅读(3,614) 评论 (1) 分类：若有所思

【前图灵时代不存在外部语义网络】

因为自然语言的语义挥发性，言语不包含语义，起初（说出口之前）与言语相关的语义结构，被串行化成了语音／文本流（这一串行化过程被我称为语法生成），所以尽管前图灵时代留下了大量文本，但并不存在一个外部语义网（所谓外部，乃指外于个体头脑），语义信息仅存在于个体头脑之中，文本仅在被个体阅读时才在阅读者头脑中再现为语义。

当然，在前文字时代，连言语本身也是挥发性的。

【外部语义网络已随图灵机而诞生】

今天，每台计算机里都存储着大量语义信息，当一部图灵机读取此类语义信息，并驱动某台设备作出动作时，便产生了“意义”；显然，存储了不同代码或连接了不同设备的各台图灵机，在读取同一条语义信息后，可能引发（或不引发）不同动作，因而在此意义上，图灵世界同样存在歧义。

图灵世界的语义经由两种途径产生，一种是程序员按某种人工语言的语法进行编码的结果，当一台通用图灵机读取这些编码并作出反应后，会在存储器中产生一个语义结构，当这些结构进而被读取以驱动设备时，便产生了意义。

在此过程中，程序员和图灵机所扮演的角色相当于自然语言中的说话者和受话者，区别在于：程序员与图灵机的对话遵循着一套精心设计的、严格且完备的语法约定，因而在图灵世界中，从言语（即程序编码）到语义的映射关系可以是无歧义的（尽管从语义到意义的映射仍是有歧义的）。

程序员和图灵机的对话，（除了产生一个语义结构）更重要的意义在于：它会在通用图灵机上创造出一部特殊图灵机（或称应用程序），以及一个相应的语义框架（即一组元语义，元语义是一种指示如何产生其他语义的特殊语义），它让其他人（用户）可以使用这部特殊图灵机做一些事，而当他们果真这么做时，机器便会按上述语义框架产生一些新语义（比如银行交易记录），这是图灵世界产生语义的第二种途径。

重要之处在于，这是在世界中产生语义信息的全新方式，它更加彻底的解耦了语义和意义：前图灵时代的个体也会通过行动创造语义，这些语义存储在他自己头脑中，而当用户在使用应用程序做事时，他可能明白自己行动的意义，但其行动所产生的语义却和他无关，也不（像他运用自然语言时所产生的语义那样）存在于他头脑之中，同时，存储了这些语义的机器，也无须了解产生这些语义的那些行动的意义。

【外部语义网络的互联和壮大】

起初的外部语义网通常是孤立的，每个系统有着自己的元语义，往往无法访问其他系统的语义信息，但在建立语义交互规范的种种努力的推动下，系统间的语义交互能力正日益增强，一个庞大的全球互联的外部语义网络正在浮现。

这个语义网，和传统意义上的文化一样，在构成人类生活条件的诸因素中，占据着重要且越来越重要的地位；但和文化不同，外部语义网在人类生活中起作用的方式更为直接：它可以绕过个体而直接产生意义，因为在一个由众多图灵机（及其存储系统）所构成的系统中，信息是直接以语义化形式存储的，因而可以直接被图灵机所利用而引发动作。

相反，文化信息由（口述传统或文本介质中的）言语构成，而言语不包含语义，只有被个体头脑解析之后才产生语义，而且每一个体有着自己独特的解析函数。

随着外部语义网的日益壮大，并且驱动着越来越多的设备，其（在决定人类生活条件方面的）地位将逐渐超越文化，或者（假如我们将文化的概念稍加扩大）可以说，它将逐渐成为文化的主要构成部分。

比如，制造系统在下一刻将制造些什么商品，传媒在下一刻将播送哪些内容，个人在下一刻将面临何种信息环境、接收到哪些信息，接触到哪些人，在商店货架上看到哪些商品，个人的某一言辞或行动将引发何种后果，学术界的研究兴趣将转向何处，人们如何使用某个词汇，如何看待某一历史事件，诸如此类的事情，将在越来越大的程度上取决于这一网络的内容构成。

【自然语言在新文化中的地位】

假如情况确实如此，那便提示着一种前景：在由外部语义网所主导的新型文化中，自然语言的地位在下降；在新文化中，个体主要以两种方式向外部语义网添加语义：程序员以对着图灵机说话的方式，但不是用自然语言，而是用人工语言，与其说话意图相关的语义将按严格约定得以精确再现；而其他人（或其他时候的程序员）则以使用各种应用程序实施行动的方式产生语义，如此产生的语义与其行动意图之间的对应关系并不明确。

无论何种方式，所使用的都不是自然语言。

诚然，在某些情况下，当用户使用应用程序实施行动时——诸如在填写某个格式表单时，在豆瓣某电影页面上点击“看过”时，在一个投票页面上点击“赞成”时——，应用程序所产生的语义，与用户的行动意图之间，是有着相当明确的映射关系的，在此意义上，我们可以说，用户和程序员一样：按其意图创造了语义。

但是，和以言语创造语义相比，以行动创造语义有着极大局限，它完全受限于应用程序所设定的语义框架，后者规定了何种语义可能经由用户行动而产生，比如在豆瓣，你只能表达“我-喜欢-某某”的语义，而不能表达“我-讨厌-某某”的语义，你只能“赞”一个帖子，却不能“踩”它，或“切”它、“嗯”它、“扯”它，因为程序员规定你不能这么做。

所以在图灵世界，只有一小撮程序员（或许可以称其为图灵时代的巫师）能够充分自由的按其意图创造语义，因为他们与图灵机对话时所用的语言是图灵完备的。

【我的焦虑】

我丝毫没有暗示一种卢德分子的姿态，哀叹技术霸权的威胁。只有一小撮人有机会按其意图以持久化方式创造语义，这一事态并不新鲜；前图灵时代，尽管人人都在说话，但只有极小部分个体的极小部分言语进入持久化介质（从而有机会跨越时空而在其他个体头脑中产生语义），而绝大部分语义，要么当即挥发了，要么随个体死亡而消失，未在文化长河中留下痕迹。

当然，言语也可以口耳相传的接力传递方式而在非持久化（或者说不那么持久化的）介质上实现持久化，但如此流传下来的言语，在总量中所占比例也是极低的，传播通道很大程度上被一小撮巫师、游吟诗人、说唱艺人所垄断，而且当它们在听众头脑中被再现为语义时，这些语义与当初的言说意图之间的相关性，往往已经非常微弱了。

所以没什么大不了的。

不过我确实有一种焦虑，因为我意识到，在持久化语义生产这个行当里，以自然语言为工具的生产者的地位正在迅速跌落，而我本人，尽管也是位程序员，但也是位作家，而且相对而言我更偏爱以自然语言为工具生产语义，所以我不希望自然语言在这个行当里的地位沦落到无关痛痒的程度。

【注：尽管按我的定义，用自然语言产生的言语（和记录它们的文本）并不包含语义，但它们有机会跨越时空而在读者头脑中产生语义，并且基于共同文化背景，这些语义与言说者当初的言说意图可以是高度相关的（究竟在多大程度上相关，还要看文化背景的共同程度和言说者运用自然语言的能力），所以我觉得仍有理由将写作视为一种持久化语义生产工作。】

这一焦虑促使我思考一个问题：如何在图灵时代的语义生产行当中挽救自然语言的命运？

标签：伊讲 | 哲学 | 语言

5533

【前图灵时代不存在外部语义网络】因为自然语言的语义挥发性，言语不包含语义，起初（说出口之前）与言语相关的语义结构，被串行化成了语音／文本流（这一串行化过程被我称为语法生成），所以尽管前图灵时代留下了大量文本，但并不存在一个外部语义网（所谓外部，乃指外于个体头脑），语义信息仅存在于个体头脑之中，文本仅在被个体阅读时才在阅读者头脑中再现为语义。当然，在前文字时代，连言语本身也是挥发性的。【外部语义网络已随图灵机而诞生】今天，每台计算机里都存储着大量语义信息，当一部图灵机读取此类语义信息，并驱动某台设备作出动作时，便产生了“意义”；显然，存储了不同代码或连接了不同设备的各台图灵机，在读取同一条语义信息后，可能引发（或不引发）不同动作，因而在此意义上，图灵世界同样存在歧义。图灵世界的语义经由两种途径产生，一种是程序员按某种人工语言的语法进行编码的结果，当一台通用图灵机读取这些编码并作出反应后，会在存储器中产生一个语义结构，当这些结构进而被读取以驱动设备时，便产生了意义。在此过程中，程序员和图灵机所扮演的角色相当于自然语言中的说话者和受话者，区别在于：程序员与图灵机的对话遵循着一套精心设计的、严格且完备的语法约定，因而在图灵世界中，从言语（即程序编码）到语义的映射关系可以是无歧义的（尽管从语义到意义的映射仍是有歧义的）。程序员和图灵机的对话，（除了产生一个语义结构）更重要的意义在于：它会在通用图灵机上创造出一部特殊图灵机（或称应用程序），以及一个相应的语义框架（即一组元语义，元语义是一种指示如何产生其他语义的特殊语义），它让其他人（用户）可以使用这部特殊图灵机做一些事，而当他们果真这么做时，机器便会按上述语义框架产生一些新语义（比如银行交易记录），这是图灵世界产生语义的第二种途径。重要之处在于，这是在世界中产生语义信息的全新方式，它更加彻底的解耦了语义和意义：前图灵时代的个体也会通过行动创造语义，这些语义存储在他自己头脑中，而当用户在使用应用程序做事时，他可能明白自己行动的意义，但其行动所产生的语义却和他无关，也不（像他运用自然语言时所产生的语义那样）存在于他头脑之中，同时，存储了这些语义的机器，也无须了解产生这些语义的那些行动的意义。【外部语义网络的互联和壮大】起初的外部语义网通常是孤立的，每个系统有着自己的元语义，往往无法访问其他系统的语义信息，但在建立语义交互规范的种种努力的推动下，系统间的语义交互能力正日益增强，一个庞大的全球互联的外部语义网络正在浮现。这个语义网，和传统意义上的文化一样，在构成人类生活条件的诸因素中，占据着重要且越来越重要的地位；但和文化不同，外部语义网在人类生活中起作用的方式更为直接：它可以绕过个体而直接产生意义，因为在一个由众多图灵机（及其存储系统）所构成的系统中，信息是直接以语义化形式存储的，因而可以直接被图灵机所利用而引发动作。相反，文化信息由（口述传统或文本介质中的）言语构成，而言语不包含语义，只有被个体头脑解析之后才产生语义，而且每一个体有着自己独特的解析函数。随着外部语义网的日益壮大，并且驱动着越来越多的设备，其（在决定人类生活条件方面的）地位将逐渐超越文化，或者（假如我们将文化的概念稍加扩大）可以说，它将逐渐成为文化的主要构成部分。比如，制造系统在下一刻将制造些什么商品，传媒在下一刻将播送哪些内容，个人在下一刻将面临何种信息环境、接收到哪些信息，接触到哪些人，在商店货架上看到哪些商品，个人的某一言辞或行动将引发何种后果，学术界的研究兴趣将转向何处，人们如何使用某个词汇，如何看待某一历史事件，诸如此类的事情，将在越来越大的程度上取决于这一网络的内容构成。【自然语言在新文化中的地位】假如情况确实如此，那便提示着一种前景：在由外部语义网所主导的新型文化中，自然语言的地位在下降；在新文化中，个体主要以两种方式向外部语义网添加语义：程序员以对着图灵机说话的方式，但不是用自然语言，而是用人工语言，与其说话意图相关的语义将按严格约定得以精确再现；而其他人（或其他时候的程序员）则以使用各种应用程序实施行动的方式产生语义，如此产生的语义与其行动意图之间的对应关系并不明确。无论何种方式，所使用的都不是自然语言。诚然，在某些情况下，当用户使用应用程序实施行动时——诸如在填写某个格式表单时，在豆瓣某电影页面上点击“看过”时，在一个投票页面上点击“赞成”时——，应用程序所产生的语义，与用户的行动意图之间，是有着相当明确的映射关系的，在此意义上，我们可以说，用户和程序员一样：按其意图创造了语义。但是，和以言语创造语义相比，以行动创造语义有着极大局限，它完全受限于应用程序所设定的语义框架，后者规定了何种语义可能经由用户行动而产生，比如在豆瓣，你只能表达“我-喜欢-某某”的语义，而不能表达“我-讨厌-某某”的语义，你只能“赞”一个帖子，却不能“踩”它，或“切”它、“嗯”它、“扯”它，因为程序员规定你不能这么做。所以在图灵世界，只有一小撮程序员（或许可以称其为图灵时代的巫师）能够充分自由的按其意图创造语义，因为他们与图灵机对话时所用的语言是图灵完备的。【我的焦虑】我丝毫没有暗示一种卢德分子的姿态，哀叹技术霸权的威胁。只有一小撮人有机会按其意图以持久化方式创造语义，这一事态并不新鲜；前图灵时代，尽管人人都在说话，但只有极小部分个体的极小部分言语进入持久化介质（从而有机会跨越时空而在其他个体头脑中产生语义），而绝大部分语义，要么当即挥发了，要么随个体死亡而消失，未在文化长河中留下痕迹。当然，言语也可以口耳相传的接力传递方式而在非持久化（或者说不那么持久化的）介质上实现持久化，但如此流传下来的言语，在总量中所占比例也是极低的，传播通道很大程度上被一小撮巫师、游吟诗人、说唱艺人所垄断，而且当它们在听众头脑中被再现为语义时，这些语义与当初的言说意图之间的相关性，往往已经非常微弱了。所以没什么大不了的。不过我确实有一种焦虑，因为我意识到，在持久化语义生产这个行当里，以自然语言为工具的生产者的地位正在迅速跌落，而我本人，尽管也是位程序员，但也是位作家，而且相对而言我更偏爱以自然语言为工具生产语义，所以我不希望自然语言在这个行当里的地位沦落到无关痛痒的程度。【注：尽管按我的定义，用自然语言产生的言语（和记录它们的文本）并不包含语义，但它们有机会跨越时空而在读者头脑中产生语义，并且基于共同文化背景，这些语义与言说者当初的言说意图可以是高度相关的（究竟在多大程度上相关，还要看文化背景的共同程度和言说者运用自然语言的能力），所以我觉得仍有理由将写作视为一种持久化语义生产工作。】这一焦虑促使我思考一个问题：如何在图灵时代的语义生产行当中挽救自然语言的命运？

已有1条评论

Bright @ 2015-04-15, 20:02

辉格老师您的新书什么时候出版呀？

[回复]
辉格回复:
4月 15th, 2015 at 23:22
连编辑都说不出，我更不知道了

[回复]

参考资料

相关文章

给文章评分

分享

相关文章

已有1条评论

Bright @ 2015-04-15, 20:02

发表评论