『伊讲』前传:外部语义网络的诞生

【前图灵时代不存在外部语义网络】

因为自然语言的语义挥发性,言语不包含语义,起初(说出口之前)与言语相关的语义结构,被串行化成了语音/文本流(这一串行化过程被我称为语法生成),所以尽管前图灵时代留下了大量文本,但并不存在一个外部语义网(所谓外部,乃指外于个体头脑),语义信息仅存在于个体头脑之中,文本仅在被个体阅读时才在阅读者头脑中再现为语义。

当然,在前文字时代,连言语本身也是挥发性的。

【外部语义网络已随图灵机而诞生】

今天,每台计算机里都存储着大量语义信息,当一部图灵机读取此类语义信息,并驱动某台设备作出动作时,便产生了“意义”;显然,存储了不同代码或连接了不同设备的各台图灵机,在读取同一条语义信息后,可能引发(或不引发)不同动作,因而在此意义上,图灵世界同样存在歧义。

图灵世界的语义经由两种途径产生,一种是程序员按某种人工语言的语法进行编码的结果,当一台通用图灵机读取这些编码并作出反应后,会在存储器中产生一个语义结构,当这些结构进而被读取以驱动设备时,便产生了意义。

在此过程中,程序员和图灵机所扮演的角色相当于自然语言中的说话者和受话者,区别在于:程序员与图灵机的对话遵循着一套精心设计的、严格且完备的语法约定,因而在图灵世界中,从言语(即程序编码)到语义的映射关系可以是无歧义的(尽管从语义到意义的映射仍是有歧义的)。

程序员和图灵机的对话,(除了产生一个语义结构)更重要的意义在于:它会在通用图灵机上创造出一部特殊图灵机(或称应用程序),以及一个相应的语义框架(即一组元语义,元语义是一种指示如何产生其他语义的特殊语义),它让其他人(用户)可以使用这部特殊图灵机做一些事,而当他们果真这么做时,机器便会按上述语义框架产生一些新语义(比如银行交易记录),这是图灵世界产生语义的第二种途径。

重要之处在于,这是在世界中产生语义信息的全新方式,它更加彻底的解耦了语义和意义:前图灵时代的个体也会通过行动创造语义,这些语义存储在他自己头脑中,而当用户在使用应用程序做事时,他可能明白自己行动的意义,但其行动所产生的语义却和他无关,也不(像他运用自然语言时所产生的语义那样)存在于他头脑之中,同时,存储了这些语义的机器,也无须了解产生这些语义的那些行动的意义。

【外部语义网络的互联和壮大】

起初的外部语义网通常是孤立的,每个系统有着自己的元语义,往往无法访问其他系统的语义信息,但在建立语义交互规范的种种努力的推动下,系统间的语义交互能力正日益增强,一个庞大的全球互联的外部语义网络正在浮现。

这个语义网,和传统意义上的文化一样,在构成人类生活条件的诸因素中,占据着重要且越来越重要的地位;但和文化不同,外部语义网在人类生活中起作用的方式更为直接:它可以绕过个体而直接产生意义,因为在一个由众多图灵机(及其存储系统)所构成的系统中,信息是直接以语义化形式存储的,因而可以直接被图灵机所利用而引发动作。

相反,文化信息由(口述传统或文本介质中的)言语构成,而言语不包含语义,只有被个体头脑解析之后才产生语义,而且每一个体有着自己独特的解析函数。

随着外部语义网的日益壮大,并且驱动着越来越多的设备,其(在决定人类生活条件方面的)地位将逐渐超越文化,或者(假如我们将文化的概念稍加扩大)可以说,它将逐渐成为文化的主要构成部分。

比如,制造系统在下一刻将制造些什么商品,传媒在下一刻将播送哪些内容,个人在下一刻将面临何种信息环境、接收到哪些信息,接触到哪些人,在商店货架上看到哪些商品,个人的某一言辞或行动将引发何种后果,学术界的研究兴趣将转向何处,人们如何使用某个词汇,如何看待某一历史事件,诸如此类的事情,将在越来越大的程度上取决于这一网络的内容构成。

【自然语言在新文化中的地位】

假如情况确实如此,那便提示着一种前景:在由外部语义网所主导的新型文化中,自然语言的地位在下降;在新文化中,个体主要以两种方式向外部语义网添加语义:程序员以对着图灵机说话的方式,但不是用自然语言,而是用人工语言,与其说话意图相关的语义将按严格约定得以精确再现;而其他人(或其他时候的程序员)则以使用各种应用程序实施行动的方式产生语义,如此产生的语义与其行动意图之间的对应关系并不明确。

无论何种方式,所使用的都不是自然语言。

诚然,在某些情况下,当用户使用应用程序实施行动时——诸如在填写某个格式表单时,在豆瓣某电影页面上点击“看过”时,在一个投票页面上点击“赞成”时——,应用程序所产生的语义,与用户的行动意图之间,是有着相当明确的映射关系的,在此意义上,我们可以说,用户和程序员一样:按其意图创造了语义。

但是,和以言语创造语义相比,以行动创造语义有着极大局限,它完全受限于应用程序所设定的语义框架,后者规定了何种语义可能经由用户行动而产生,比如在豆瓣,你只能表达“我-喜欢-某某”的语义,而不能表达“我-讨厌-某某”的语义,你只能“赞”一个帖子,却不能“踩”它,或“切”它、“嗯”它、“扯”它,因为程序员规定你不能这么做。

所以在图灵世界,只有一小撮程序员(或许可以称其为图灵时代的巫师)能够充分自由的按其意图创造语义,因为他们与图灵机对话时所用的语言是图灵完备的。

【我的焦虑】

我丝毫没有暗示一种卢德分子的姿态,哀叹技术霸权的威胁。只有一小撮人有机会按其意图以持久化方式创造语义,这一事态并不新鲜;前图灵时代,尽管人人都在说话,但只有极小部分个体的极小部分言语进入持久化介质(从而有机会跨越时空而在其他个体头脑中产生语义),而绝大部分语义,要么当即挥发了,要么随个体死亡而消失,未在文化长河中留下痕迹。

当然,言语也可以口耳相传的接力传递方式而在非持久化(或者说不那么持久化的)介质上实现持久化,但如此流传下来的言语,在总量中所占比例也是极低的,传播通道很大程度上被一小撮巫师、游吟诗人、说唱艺人所垄断,而且当它们在听众头脑中被再现为语义时,这些语义与当初的言说意图之间的相关性,往往已经非常微弱了。

所以没什么大不了的。

不过我确实有一种焦虑,因为我意识到,在持久化语义生产这个行当里,以自然语言为工具的生产者的地位正在迅速跌落,而我本人,尽管也是位程序员,但也是位作家,而且相对而言我更偏爱以自然语言为工具生产语义,所以我不希望自然语言在这个行当里的地位沦落到无关痛痒的程度。

【注:尽管按我的定义,用自然语言产生的言语(和记录它们的文本)并不包含语义,但它们有机会跨越时空而在读者头脑中产生语义,并且基于共同文化背景,这些语义与言说者当初的言说意图可以是高度相关的(究竟在多大程度上相关,还要看文化背景的共同程度和言说者运用自然语言的能力),所以我觉得仍有理由将写作视为一种持久化语义生产工作。】

这一焦虑促使我思考一个问题:如何在图灵时代的语义生产行当中挽救自然语言的命运?

 

相关文章

标签: | |
5533
【前图灵时代不存在外部语义网络】 因为自然语言的语义挥发性,言语不包含语义,起初(说出口之前)与言语相关的语义结构,被串行化成了语音/文本流(这一串行化过程被我称为语法生成),所以尽管前图灵时代留下了大量文本,但并不存在一个外部语义网(所谓外部,乃指外于个体头脑),语义信息仅存在于个体头脑之中,文本仅在被个体阅读时才在阅读者头脑中再现为语义。 当然,在前文字时代,连言语本身也是挥发性的。 【外部语义网络已随图灵机而诞生】 今天,每台计算机里都存储着大量语义信息,当一部图灵机读取此类语义信息,并驱动某台设备作出动作时,便产生了“意义”;显然,存储了不同代码或连接了不同设备的各台图灵机,在读取同一条语义信息后,可能引发(或不引发)不同动作,因而在此意义上,图灵世界同样存在歧义。 图灵世界的语义经由两种途径产生,一种是程序员按某种人工语言的语法进行编码的结果,当一台通用图灵机读取这些编码并作出反应后,会在存储器中产生一个语义结构,当这些结构进而被读取以驱动设备时,便产生了意义。 在此过程中,程序员和图灵机所扮演的角色相当于自然语言中的说话者和受话者,区别在于:程序员与图灵机的对话遵循着一套精心设计的、严格且完备的语法约定,因而在图灵世界中,从言语(即程序编码)到语义的映射关系可以是无歧义的(尽管从语义到意义的映射仍是有歧义的)。 程序员和图灵机的对话,(除了产生一个语义结构)更重要的意义在于:它会在通用图灵机上创造出一部特殊图灵机(或称应用程序),以及一个相应的语义框架(即一组元语义,元语义是一种指示如何产生其他语义的特殊语义),它让其他人(用户)可以使用这部特殊图灵机做一些事,而当他们果真这么做时,机器便会按上述语义框架产生一些新语义(比如银行交易记录),这是图灵世界产生语义的第二种途径。 重要之处在于,这是在世界中产生语义信息的全新方式,它更加彻底的解耦了语义和意义:前图灵时代的个体也会通过行动创造语义,这些语义存储在他自己头脑中,而当用户在使用应用程序做事时,他可能明白自己行动的意义,但其行动所产生的语义却和他无关,也不(像他运用自然语言时所产生的语义那样)存在于他头脑之中,同时,存储了这些语义的机器,也无须了解产生这些语义的那些行动的意义。 【外部语义网络的互联和壮大】 起初的外部语义网通常是孤立的,每个系统有着自己的元语义,往往无法访问其他系统的语义信息,但在建立语义交互规范的种种努力的推动下,系统间的语义交互能力正日益增强,一个庞大的全球互联的外部语义网络正在浮现。 这个语义网,和传统意义上的文化一样,在构成人类生活条件的诸因素中,占据着重要且越来越重要的地位;但和文化不同,外部语义网在人类生活中起作用的方式更为直接:它可以绕过个体而直接产生意义,因为在一个由众多图灵机(及其存储系统)所构成的系统中,信息是直接以语义化形式存储的,因而可以直接被图灵机所利用而引发动作。 相反,文化信息由(口述传统或文本介质中的)言语构成,而言语不包含语义,只有被个体头脑解析之后才产生语义,而且每一个体有着自己独特的解析函数。 随着外部语义网的日益壮大,并且驱动着越来越多的设备,其(在决定人类生活条件方面的)地位将逐渐超越文化,或者(假如我们将文化的概念稍加扩大)可以说,它将逐渐成为文化的主要构成部分。 比如,制造系统在下一刻将制造些什么商品,传媒在下一刻将播送哪些内容,个人在下一刻将面临何种信息环境、接收到哪些信息,接触到哪些人,在商店货架上看到哪些商品,个人的某一言辞或行动将引发何种后果,学术界的研究兴趣将转向何处,人们如何使用某个词汇,如何看待某一历史事件,诸如此类的事情,将在越来越大的程度上取决于这一网络的内容构成。 【自然语言在新文化中的地位】 假如情况确实如此,那便提示着一种前景:在由外部语义网所主导的新型文化中,自然语言的地位在下降;在新文化中,个体主要以两种方式向外部语义网添加语义:程序员以对着图灵机说话的方式,但不是用自然语言,而是用人工语言,与其说话意图相关的语义将按严格约定得以精确再现;而其他人(或其他时候的程序员)则以使用各种应用程序实施行动的方式产生语义,如此产生的语义与其行动意图之间的对应关系并不明确。 无论何种方式,所使用的都不是自然语言。 诚然,在某些情况下,当用户使用应用程序实施行动时——诸如在填写某个格式表单时,在豆瓣某电影页面上点击“看过”时,在一个投票页面上点击“赞成”时——,应用程序所产生的语义,与用户的行动意图之间,是有着相当明确的映射关系的,在此意义上,我们可以说,用户和程序员一样:按其意图创造了语义。 但是,和以言语创造语义相比,以行动创造语义有着极大局限,它完全受限于应用程序所设定的语义框架,后者规定了何种语义可能经由用户行动而产生,比如在豆瓣,你只能表达“我-喜欢-某某”的语义,而不能表达“我-讨厌-某某”的语义,你只能“赞”一个帖子,却不能“踩”它,或“切”它、“嗯”它、“扯”它,因为程序员规定你不能这么做。 所以在图灵世界,只有一小撮程序员(或许可以称其为图灵时代的巫师)能够充分自由的按其意图创造语义,因为他们与图灵机对话时所用的语言是图灵完备的。 【我的焦虑】 我丝毫没有暗示一种卢德分子的姿态,哀叹技术霸权的威胁。只有一小撮人有机会按其意图以持久化方式创造语义,这一事态并不新鲜;前图灵时代,尽管人人都在说话,但只有极小部分个体的极小部分言语进入持久化介质(从而有机会跨越时空而在其他个体头脑中产生语义),而绝大部分语义,要么当即挥发了,要么随个体死亡而消失,未在文化长河中留下痕迹。 当然,言语也可以口耳相传的接力传递方式而在非持久化(或者说不那么持久化的)介质上实现持久化,但如此流传下来的言语,在总量中所占比例也是极低的,传播通道很大程度上被一小撮巫师、游吟诗人、说唱艺人所垄断,而且当它们在听众头脑中被再现为语义时,这些语义与当初的言说意图之间的相关性,往往已经非常微弱了。 所以没什么大不了的。 不过我确实有一种焦虑,因为我意识到,在持久化语义生产这个行当里,以自然语言为工具的生产者的地位正在迅速跌落,而我本人,尽管也是位程序员,但也是位作家,而且相对而言我更偏爱以自然语言为工具生产语义,所以我不希望自然语言在这个行当里的地位沦落到无关痛痒的程度。 【注:尽管按我的定义,用自然语言产生的言语(和记录它们的文本)并不包含语义,但它们有机会跨越时空而在读者头脑中产生语义,并且基于共同文化背景,这些语义与言说者当初的言说意图可以是高度相关的(究竟在多大程度上相关,还要看文化背景的共同程度和言说者运用自然语言的能力),所以我觉得仍有理由将写作视为一种持久化语义生产工作。】 这一焦虑促使我思考一个问题:如何在图灵时代的语义生产行当中挽救自然语言的命运?  


已有1条评论

  1. Bright @ 2015-04-15, 20:02

    辉格老师 您的新书什么时候出版呀?

    [回复]

    辉格 回复:

    连编辑都说不出,我更不知道了

    [回复]

发表评论