『伊讲』:回归自然语言的本色

你大概已经猜到了『伊讲』大概是个什么东西,没错,把几种语义化方案中被我视为可欲的那些特性合并起来,便是『伊讲』的特性:伊是一种强语义化的、让说话者主动表达语义的、语义开放的、去中心化的、非匿名化的(因而是个人化的)、强社会性的语义化方案。

方案 言语持久化 贴标签 用行动说话 语义化言说 词汇索引 机器理解 语法标记
实例  IM/BBS  blog/MB  豆瓣  维基  Google  IBM Watson  伊讲
语义化  无  弱  强  中等  中等  强  强
语义表达  无  主动  主动  主动  被动  被动  主动
开放性  开放  开放  封闭  半开放  开放  开放  开放
匿名化  否  否  否  是  是  是  否
语义中心化    否  是  是  不必  不必  否
语义自主性  无  强  强  强  弱  弱  强
社会性  无  弱  强  无  无  无  强

在我列举的各方案中,豆瓣拥有最多我所期待的特性,但豆瓣也有两个我最痛恨的特性:她是封闭的(即语义专制的),也是语义中心化的,而同时,twitter(或其他微博客)是开放和去中心化的(当然,豆瓣同时也是微博客,但她的这两部分在语义功能上是相互孤立的,我说的是它区别于微博客的地方),但推特的语义化又太弱了,这是因为标签机制的语义功能太弱。

『伊讲』的方案,就是把twitter的标签升级为语法标记,从而让机器能够从言语文本中深度提取语义,这样一来,用户便可以像在twitter中那么说话,但同时起到了在豆瓣中实施行动深度相当的语义效果,又不会被束缚于豆瓣那种“以行动说话”的方式对词汇和句型必定施加的严格限制,我将这种方案叫做“语法标记”。

语法标记方案的一个优势是,技术实现上非常容易,让机器解析一个带有语法标记的言语文本,是要求较低的任务,存在语法标记的情况下,语法解析工作是相当机械化的;假如我们的目标语言是英语的话,即便没有语法标记,解析也不会太难。

无标记解析确实也是一个选项,不过『伊讲』的目标语言是汉语,无标记解析会比较困难(比如划词就是个大麻烦),我一个人大概啃不下来(我下决心开始做『伊讲』的前提之一是,相信自己至少能够独力完成伊的第一个版本)。

除了汉语文本的特性带来的技术障碍,我选择标记方案还有另一个理由:无标记解析需要更多的词法和句法约定,这会给说话者施加更多限制,这是我不希望看到的,因为这会妨碍自然语言历来具有的持续进化特性。

有了标记,词法上可以充分自由:你可以将任意符号组合(只要和标记本身不冲突)当作动词用,或当作其他任何语法成分用,自然语言里就是这样的,比如你可能会说“昨天我又被方滨兴了,所以没有伊讲。”

若依靠无标记解析,即便解析器非常聪明,可能也要过好久,采集了足够多言语样本之后,才明白“方滨兴”和“伊讲”都可以当作动词用,在此之前,它可能会怀疑“方滨兴”和“了”之间漏了个什么词(总不能假定用户从来不会手抖吧?),而弄不明白“伊讲”到底是个名词、形容词还是助词,而借助标记,说话者可以直接告诉解析器那就是个动词。

其实语法标记也不算是说话者的额外负担,口语带很多标记,停顿、重音、声调等等,都可以被作为语法标记附加到语音流中,只是变成文本时,这些信息要么丢失了,只能靠阅读者自己脑补,或者被替换成了标点符号等书面标记,『伊讲』的解析器仍会尽量利用这些书面标记,但因为它还不够聪明,也不想预设太多约定,所以需要用户多加些标记。

现在让我们来看看『伊讲』在图灵时代的自然语言信息模型中处于什么位置:

图:图灵时代的自然语言信息模型

图中左边的主动方案就是『伊讲』,在接收到言语文本后,伊做了两件事:对文本作语法解析,提取其中语义并写入外部语义网,然后将文本格式化为易读形式送进相应的时间线,这些被提取的语义会一直关联着说话者。

在恰当的情境下,这些语义会被机器利用并产生意义,也会(在经历一系列转换后)进入说话者自己和其他人的信息环境中,变成对后者或许有价值的信息,继而在后者头脑中产生知识;在今后的文章里,我会解释“恰当的情境”和“一系列转换”究竟是什么,简单说,就是经过两层映射,首先是社会关系映射,其次是个体知识模型的映射,最终变成个体知识。

在我看来,定义这两层映射的模型,是『伊讲』的核心价值,它具体化了哈耶克的(加上我的)知识论哲学:知识分散存在于个体头脑,并通过社会关系网络传播,这种传播平行而分散的发生于整个社会关系网的一个个局部,特定个体在特定时刻获取何种信息,取决于他处于社会关系网的什么位置,以及他从自身这个节点出发,与哪些周围节点存在何种关系。

显然,这个模型是个人主义的,去中心化的,而同时又是充分参与并利用了外部语义网的。

好了,这就是『伊讲』。

或许你仍会问:听上去很好,可这究竟有啥用?

假如你觉得豆瓣比其他SNS多一点点好处,那『伊讲』就会把这好处放大很多倍,指数式的放大,比如:

1)记录生活:其他SNS也会记录你说过的话,但未经语义化的记录上用处不大的,比如你没法方便的“看看今年我看过哪些电影”,吃过哪些餐馆,去过哪些地方,碰到过哪些人,做过哪些事,买过哪些东西,买衣服花了多少钱,喝醉过几次……

2)发展社会关系:其他SNS也会帮助你发展社会关系,但方式很单调(往往单调的让人厌烦),比如告诉你某人和你都关注谁谁谁,都被谁谁谁关注;豆瓣的方式有意思一些:会告诉你他和你都读过某某书,都喜欢某某电影,但也不过如此;伊讲的方式会有意思的多:比如伊可能告诉你,你们都在西湖里游过泳,都在大理骑过车,或都在5月35号喝醉过。

3)获得有意思的反馈:依我看,好的说话环境应该会对言语行为作出丰富而贴切的反馈,比如你说你正在读某本书,若能得到“你的某某朋友读过这本书”之类的反馈,会比较有意思,或者当你说想去某地方旅行,想吃点新鲜的,想听点新歌……,最好也会有反馈;

4)人机对话:实际上,在对言语进行反馈时,机器已经默默参与了对话,它在倾听你的言语,然后从外部语义网中提取一些它认为值得反馈给你的信息;在『伊讲』里,这种对话可以更直接的方式进行,即,你可以明确的对着机器说话,他会当即作出响应,比如你可以告诉它:我想看看明天的天气如何;给我放首新歌听听,你知道我口味的;或者,给我放首新歌听听,别管我口味……诸如此类(当然,这还是较远期的承诺,这方面的潜力会逐渐挖掘,这样的反馈需要机器真正了解词汇的“意义”,因为那需要驱动设备产生行为,我相信伊会慢慢被教会各种意义的)

……

还有许多好处,我就先不一一细述了,实际上也没法细述,语义信息的潜在价值是无穷无尽的,它有待我们一点点去挖掘,作为设计者的我,在开发测试过程中,也常常被它所展现出的潜力所打动。

 

 

相关文章

标签: | |
5537
你大概已经猜到了『伊讲』大概是个什么东西,没错,把几种语义化方案中被我视为可欲的那些特性合并起来,便是『伊讲』的特性:伊是一种强语义化的、让说话者主动表达语义的、语义开放的、去中心化的、非匿名化的(因而是个人化的)、强社会性的语义化方案。
方案 言语持久化 贴标签 用行动说话 语义化言说 词汇索引 机器理解 语法标记
实例  IM/BBS  blog/MB  豆瓣  维基  Google  IBM Watson  伊讲
语义化  无  弱  强  中等  中等  强  强
语义表达  无  主动  主动  主动  被动  被动  主动
开放性  开放  开放  封闭  半开放  开放  开放  开放
匿名化  否  否  否  是  是  是  否
语义中心化    否  是  是  不必  不必  否
语义自主性  无  强  强  强  弱  弱  强
社会性  无  弱  强  无  无  无  强
在我列举的各方案中,豆瓣拥有最多我所期待的特性,但豆瓣也有两个我最痛恨的特性:她是封闭的(即语义专制的),也是语义中心化的,而同时,twitter(或其他微博客)是开放和去中心化的(当然,豆瓣同时也是微博客,但她的这两部分在语义功能上是相互孤立的,我说的是它区别于微博客的地方),但推特的语义化又太弱了,这是因为标签机制的语义功能太弱。 『伊讲』的方案,就是把twitter的标签升级为语法标记,从而让机器能够从言语文本中深度提取语义,这样一来,用户便可以像在twitter中那么说话,但同时起到了在豆瓣中实施行动深度相当的语义效果,又不会被束缚于豆瓣那种“以行动说话”的方式对词汇和句型必定施加的严格限制,我将这种方案叫做“语法标记”。 语法标记方案的一个优势是,技术实现上非常容易,让机器解析一个带有语法标记的言语文本,是要求较低的任务,存在语法标记的情况下,语法解析工作是相当机械化的;假如我们的目标语言是英语的话,即便没有语法标记,解析也不会太难。 无标记解析确实也是一个选项,不过『伊讲』的目标语言是汉语,无标记解析会比较困难(比如划词就是个大麻烦),我一个人大概啃不下来(我下决心开始做『伊讲』的前提之一是,相信自己至少能够独力完成伊的第一个版本)。 除了汉语文本的特性带来的技术障碍,我选择标记方案还有另一个理由:无标记解析需要更多的词法和句法约定,这会给说话者施加更多限制,这是我不希望看到的,因为这会妨碍自然语言历来具有的持续进化特性。 有了标记,词法上可以充分自由:你可以将任意符号组合(只要和标记本身不冲突)当作动词用,或当作其他任何语法成分用,自然语言里就是这样的,比如你可能会说“昨天我又被方滨兴了,所以没有伊讲。” 若依靠无标记解析,即便解析器非常聪明,可能也要过好久,采集了足够多言语样本之后,才明白“方滨兴”和“伊讲”都可以当作动词用,在此之前,它可能会怀疑“方滨兴”和“了”之间漏了个什么词(总不能假定用户从来不会手抖吧?),而弄不明白“伊讲”到底是个名词、形容词还是助词,而借助标记,说话者可以直接告诉解析器那就是个动词。 其实语法标记也不算是说话者的额外负担,口语带很多标记,停顿、重音、声调等等,都可以被作为语法标记附加到语音流中,只是变成文本时,这些信息要么丢失了,只能靠阅读者自己脑补,或者被替换成了标点符号等书面标记,『伊讲』的解析器仍会尽量利用这些书面标记,但因为它还不够聪明,也不想预设太多约定,所以需要用户多加些标记。 现在让我们来看看『伊讲』在图灵时代的自然语言信息模型中处于什么位置: 图:图灵时代的自然语言信息模型 图中左边的主动方案就是『伊讲』,在接收到言语文本后,伊做了两件事:对文本作语法解析,提取其中语义并写入外部语义网,然后将文本格式化为易读形式送进相应的时间线,这些被提取的语义会一直关联着说话者。 在恰当的情境下,这些语义会被机器利用并产生意义,也会(在经历一系列转换后)进入说话者自己和其他人的信息环境中,变成对后者或许有价值的信息,继而在后者头脑中产生知识;在今后的文章里,我会解释“恰当的情境”和“一系列转换”究竟是什么,简单说,就是经过两层映射,首先是社会关系映射,其次是个体知识模型的映射,最终变成个体知识。 在我看来,定义这两层映射的模型,是『伊讲』的核心价值,它具体化了哈耶克的(加上我的)知识论哲学:知识分散存在于个体头脑,并通过社会关系网络传播,这种传播平行而分散的发生于整个社会关系网的一个个局部,特定个体在特定时刻获取何种信息,取决于他处于社会关系网的什么位置,以及他从自身这个节点出发,与哪些周围节点存在何种关系。 显然,这个模型是个人主义的,去中心化的,而同时又是充分参与并利用了外部语义网的。 好了,这就是『伊讲』。 或许你仍会问:听上去很好,可这究竟有啥用? 假如你觉得豆瓣比其他SNS多一点点好处,那『伊讲』就会把这好处放大很多倍,指数式的放大,比如: 1)记录生活:其他SNS也会记录你说过的话,但未经语义化的记录上用处不大的,比如你没法方便的“看看今年我看过哪些电影”,吃过哪些餐馆,去过哪些地方,碰到过哪些人,做过哪些事,买过哪些东西,买衣服花了多少钱,喝醉过几次…… 2)发展社会关系:其他SNS也会帮助你发展社会关系,但方式很单调(往往单调的让人厌烦),比如告诉你某人和你都关注谁谁谁,都被谁谁谁关注;豆瓣的方式有意思一些:会告诉你他和你都读过某某书,都喜欢某某电影,但也不过如此;伊讲的方式会有意思的多:比如伊可能告诉你,你们都在西湖里游过泳,都在大理骑过车,或都在5月35号喝醉过。 3)获得有意思的反馈:依我看,好的说话环境应该会对言语行为作出丰富而贴切的反馈,比如你说你正在读某本书,若能得到“你的某某朋友读过这本书”之类的反馈,会比较有意思,或者当你说想去某地方旅行,想吃点新鲜的,想听点新歌……,最好也会有反馈; 4)人机对话:实际上,在对言语进行反馈时,机器已经默默参与了对话,它在倾听你的言语,然后从外部语义网中提取一些它认为值得反馈给你的信息;在『伊讲』里,这种对话可以更直接的方式进行,即,你可以明确的对着机器说话,他会当即作出响应,比如你可以告诉它:我想看看明天的天气如何;给我放首新歌听听,你知道我口味的;或者,给我放首新歌听听,别管我口味……诸如此类(当然,这还是较远期的承诺,这方面的潜力会逐渐挖掘,这样的反馈需要机器真正了解词汇的“意义”,因为那需要驱动设备产生行为,我相信伊会慢慢被教会各种意义的) …… 还有许多好处,我就先不一一细述了,实际上也没法细述,语义信息的潜在价值是无穷无尽的,它有待我们一点点去挖掘,作为设计者的我,在开发测试过程中,也常常被它所展现出的潜力所打动。    


已有6条评论

  1. 谢东平 @ 2015-04-17, 21:52

    感觉很好玩,什么时候发内测?

    打算开源么?

    [回复]

    辉格 回复:

    估计下月底之前可以演示和内测,开源的问题没考虑过。

    [回复]

    谢东平 回复:

    那就期待了!

    [回复]

  2. heraclesh116 @ 2015-04-19, 10:18

    辉总需要运营人员吗?

    [回复]

    辉格 回复:

    离运营还早着呢

    [回复]

  3. tcya @ 2015-04-25, 16:16

    在“相关文章”里转来转去突然意识到这也是一个语义提取系统,比标签强一些(语义更丰富),比伊讲弱。这个“相关文章”是怎么生成的呢?

    [回复]

    辉格 回复:

    嗯嗯,这个“相关文章”的相关性计算还挺聪明,利用了不少信息,不过那是一个wordpress插件算的,我没细究过它的算法。

    [回复]

发表评论