“鹭岛青年哲学工作坊”第三期
发布时间:2017-11-10 浏览次数:53

2017910日,复旦大学哲学学院徐英瑾教授做客华侨大学哲学与社会发展学院,为我们带来“鹭岛青年哲学工作坊”学术系列活动的第三场讲座。

“鹭岛青年哲学工作坊”是在学院领导的支持下,由我院各学科年轻老师发起的学术系列活动。工作坊的形式是,讲者首先用半小时左右介绍其论文(一般未发表),再进行约十分钟的评议,然后进行一个小时的讨论,最后请讲者就其科研、写作经验进行交流。

徐英瑾教授是教育部长江青年学者,主要研究领域为为人工智能哲学、认知科学哲学、维特根斯坦哲学等。他至今依然是上海哲学界目前唯一的全国优秀博士论文的获得者(2006年获奖)。获奖的论文《维特根斯坦哲学转型期中的“现象学”之谜》(2006年复旦大学出版社出版,28万字)是汉语哲学界第一部(至今也是唯一一部)专门讨论维特根斯坦从其早期立场转向晚期立场之转型过程的专著。代表作《心智、语言和机器——维特根斯坦哲学与人工智能哲学的对话》(76万字,人民出版社201310月出版)是国内目前最全面深入的关于人工智能哲学的研究著作。


本场报告由王阳教授主持,并邀请了逻辑学专业的王洪光老师做评议人,哲社学院师生近四十人在F1-401讨论徐英瑾老师尚未发表的新作《人工智能研究中的“母语意识”刍议——以对于汉语量词的刻画为案例》。讨论结束后,徐老师还为我们分享了他在学术生活中的一些经验。

在报告中,徐老师首先介绍了这篇文章的写作背景,揭示蒯因的本体论相对性理论对其文章的影响,而后从语言哲学与认知语言学的角度,通过重点讨论被西语思维扭曲的汉语量词现象,进一 步揭露“西式思维”对于汉语本真结构的扭曲效应。同时以此为契机,为人工智能研究中母语意识的勃发,提供可行的技术实现路径。


徐英瑾老师有有关日/汉语量词现象的讨论可以分为以下几个步骤:

第一、由于统计学和大数据无法地道地表达汉语量词现象,基于英语思维的自然语言处理机制很可能会淡化量词的使用规则的重要性,因此一种对汉语量词真实语法和语义的刻画方案是十分必要的。

徐老师首先讨论了蒯因以日语表达式“三頭の牛”(即汉语“三头牛”)的逻辑结构问题提出的两种刻画方案,揭示了蒯因对量词现象的分析虽贴合所观察到的语言现象,但其引起的麻烦却是由英语思维决定的。而后以马歇尔·威尔曼以及日本的语言哲学家饭田隆先为例,指出其理论缺乏应有的统一性,且受制于英语“单、复区分”的思维陷阱。因此,为了直面汉语或日语中量词现象的“实情”,有必要“悬置”英语思维。

第二、提出一种基于汉语自身韵律学特征的演化历程与认知隐喻理论的量词刻画方案,或许能够更合理地说明量词在汉语或日语中发挥的真实功能。

徐老师认为,“汉语量词功能”之谜的关键,在于两汉时期文献中大量出现的通用量词。冯胜利先生指出,大量通用量词在两汉出现的主要因素,与所“个体化语言设施”毫无关联,而与韵律学(prosody)关系密切——通用量词的出现提升了古汉语韵律上的齐一性。对此,徐老师认为仅仅从韵律学的角度猜测汉语量词生产的机制对汉语量词的“语义属性” 关照依然不够。从而站在认知语言学的角度,认为任何一种语义抽象方式其实都是一种隐喻投射方式,进而淡化万物之间的差异性,加强人类通过语言操控万物的意识。除此之外,魏晋以来的特殊量词还具有对事物的名词进行范畴化的功能。日语专家金子孝吉先生所归纳的量词 助数词的功能向我们展示出了各种亚洲语言中“量词活用”所展现出来的巨大逻辑空间,充分证明了量词的重大使用价值,甚至对汉语未来可能的“进化”方向具有一定的提示意义,丰富了语言的语义推理潜能与审美趣味。

结论:推翻蒯因的预设,量词在东亚语言中的大量出现,与语言言说者对于外部世界的“个体化”与“对象化”需求基本无关,而与语言表征系统内部的某些内在特征更为相关。揭示新方案内在理论的统一性。

第三、基于以上对汉语中量词功能的理解,提出计算机相应地所应有的性质。最后,徐英瑾老师呼吁人工智能技术重视母语处理的智能化,这种计算机语言与语言学既有的关于量词的研究结果相结合的愿景,有助于闯出一条堪与英语世界主流技术进路争锋的新路。


在徐英瑾老师近一个小时精彩的报告之后,主持人王阳老师充分赞赏了将语言学中量词上升到语言哲学高度研究的新颖性,也极高地评价了报告所涉及知识的深度和广度。接下来,评议人王洪光老师争对报告文本提出了自己的几点疑惑。

1、您论文最后给出了自己的量词刻画方案,指出天普大学的王培先生发明的“纳思系统”的表征形式具有主谓逻辑的外观,却允许某种复杂的递归结构中表征类比推理和隐喻投射。我的问题是如果主谓结构能够表征递归结构的话,为何不用表征能力更强大的谓词逻辑?

徐老师的回答:王培先生发过一篇文章,谈到了与谓词逻辑有何不同。这篇文章篇幅很短,而且如果要发技术性的东西的话,编辑未必会接受,所以基本上都是一个形式语言。至于他是怎么做隐喻的,不是我这篇文章可以说清楚的。因为他的语言大概有十来个层次。如果要看他的那本书,需要一个层次一个层次形式语言学的,隐喻大概要等到第四或第五层才能学到,不是一开始就能做到,但是实际上不是特别难学,只是有点繁琐而已。这也从侧面解答了为什么不用谓词逻辑的原因,这也是避免谓词逻辑导致的一系列问题。最大的一个问题就是内涵和外延的问题。尤其是内涵性的问题,在很大程度上,语词的敏感性是建立在内涵性上的,尤其是做隐喻一定要依赖于语词的内涵性。


2、您刚才提到系统的运作不应该依赖大数据环境,通过小样本归纳且计算平台拥有“非公理特征”,我把这个公理理解为实质公理(预先约定什么是正确的,像欧式几何)而不是形式公理。如果您不给出一个实质公理也不依赖于大数据,如何保证这个计算平台或者这个系统的可靠性?

徐老师的回答:“公理化路径”在人工智能行当里的意思和逻辑有关系,但不完全一样。它实际上是一个锁死的知识库,比如早期的有一些人做日常生活中活动的机器人,根据定义好的日常知识,在其中做各种逻辑推理。这个东西的最大问题是很明显的,如果说预先设定好的和生活中有一丁点的不一样,机器人就不知道该如何应对。第二,一个最麻烦的问题就是相关性问题,或者说框架问题(frame problem),因为有很多公理性的知识在很短时间内不知道什么东西是和什么东西相关的,这个传统的谓词到逻辑的基本问题,也就是外延主义是要看其每个句子的真值的,然后看它的真值的ifthen ”之间的关系。如果是这样的话,在自然语言当中,“ifthen”很可能连接的东西根本不相关,但在形式上却符合真值表征的要求。这样的计算负担会非常大。做词项逻辑的基本想法就是做词义之间的相关关系,它是否会导致逻辑上的不一致呢?逻辑上的是否一致是在公理化系统里面讨论是有意义的。如果不是公理化系统就不会考虑在逻辑上是否一致的问题。可靠性在很大程度上类似于统计学机制,在历史上大多数情况下,无非就是二者选更优者。王培先生认为在某种意义上,他所说的和统计学机制以及逻辑机制有像的也有不像的。我没有办法谈很多技术上的东西,大家有兴趣的话可以看参考文献。


3、您在讲座当中没有讲但却在论文中提到的所谓的地方性概念或者地方性知识,实际上具有两种不同的意思。在文化人类学角度来谈,相对于西方中心主义,涵盖非西方知识的总称,这种地方知识与当地人的条件情境有关,另外一种地方性知识是科学哲学意义上的,指的是所有知识不具有普世性。您文本中说,“有鉴于量词现象客观上的普遍性……恰恰是英语思维方式本身才是地方性的”,您既然用地方性来批评它,那么如果按照科学哲学的意义上来使用,就会产生自我驳斥的结果。因为英国英语、美国英语本身就是有差异的,如果按照您的写作目的,我们不得不考虑汉语方言所具有的地方性特征。另一方面,即使是标准的普通话,对于不同的使用者来说也有地方性特征。如果人工智能按照这个自然语言去做的话,本性上是不可能的,那么就不是科学哲学意义上的,那么可能在人类学意义上的。而人来学意义上是以西方的视角去看非西方的东西,在这个意义上就对调了观察的中心。

徐老师的回答:您所讲的第二个是比较接近我想表达的意思,我是有一点逆向西方主义倾向的。但是我的文章并不是逆向西方主义,而是逆向英语主义。因为我提出了世界上像汉语这种特征的语言是很多的,因此把英语作为一种西方语言提出来我认为是很荒谬的,因为按照语言的多数性来讲,它是少数派的。

我在文章的一开始就提到:一些读者或许会认为,逻辑与统计学才是编程工作所依赖的“基础知识”,英语只是其皮毛,因此,汉语研究者大可不必因为一看到“英语皮”就联想到“英美骨”。在我看来,一个系统要运作一定需要经验知识,然而这种经验知识只能从庞大的知识库中来,也就是研发国家的知识库中。就比如,逻辑能否从“一个人在吃汉堡包”entails that “一个人在吃食物”?逻辑是不知道汉堡包是食物的,如果用符号逻辑来做会非常繁琐。这种情况下用神经元网络来做,即给大量被试者展现特定英语的画面,然后要求后者对画面进行英语概括。这种研究实际上是以英语为核心的常识库的。这就是为什么我的文章是逆英语主义。


4、我注意到您文章英文标题使用的是interface”,用户视角的话是“界面”的意思;从程序视角的话是“接口”的意思。编程使用的是现代现代思维逻辑下的人工语言。虽然您在文章中指出编程语言会使用像“go to”这样的自然语言,但这仅仅是一个符号(term)而已,并没有太大影响。

徐老师的回答:这是你所攻击的关键点,比如说在C语言当中所说的auto”、“double”等和英文当中的意思是不一样的,是需要专门来学的。我当然承认这一点,不然计算机学位也太好拿了。但其中存在着两个问题,一个问题是它仍然做了一个对英语世界有利的偏好,以命题逻辑为基本单位在很大程度上是一种更西化的做法。其他文化未必是这样,我认为中国人的语言单位可能是字本位,或者说以亚句子为基本操作单位。另外一个是工作上的实践,界面语言和编程语言并不是断裂的,有经验的编程人员可以通过界面反应,倒猜出你用什么编程语言。而知识库本身显然是很容易把某种文化的特点体现出来。


接着,外国哲学专业的研究生顾欣欣问到,汉语当中的这些量词在人工智能的使用当中真的需要被量化吗?

徐老师的回答:你把两个概念混在一起了。量化这个词在数理逻辑当中是在前面加个量词,在日常语言中指的是被数量化。我要说的是人工智能要处理自然语言的话,需要把所有可计算化,这里量词是否可被计算化其实没有关系,它都涵盖住了。这个技术思路是在做量词之前有一个隐喻的思路,在做隐喻投射之前要有一个更基本的思路,即类比推理。所以先要把类比推理做出来之后再做隐喻投射,然后把隐喻投射当中的某一部分叫做entrench(已经作死的那部分)的一部分处理成量词,然后使得它和一些名词的捆绑具有系统的优先性。

在最后,徐英瑾老师向我们分享了他的学习经验和研究特点:

徐老师:我自己在复旦大学读哲学的时候,实际上分析哲学是属于较分支的一种,基本上没什么人弄,所以在很大程度上分析哲学都要靠自学。我采取的一个路数呢就是从弗雷格罗素、维特根斯坦啊等自学加上课结合。我博士论文本来是想做维特根斯坦的颜色问题,因为我觉得维特根斯坦这个颜色问题的考量可以和很多问题发生交界。晚年他有一个观点是关于颜色的考量,所以我通过这个考量,试图把历史上歌德的颜色学相连接。但后来这个办法似乎并不被认可。但我认为颜色这个问题很有意思,它含盖了心理学、语言学、神经科学。因此,我决定做维特根斯坦的现象学来伪装一下,大家就认为很有意思了。通过这个事情我思考了一个根本的认知科学哲学的问题,即教授他判断是否有意思也是依赖于一些说法,所以我也在琢磨别人会判断这个事情是否有意思的算法,为什么有些东西在某些教授眼中看来是核心的,而一些是不核心的。因为我是一个自然主义者,所以我认为教授的思维也是可以被自然主义化的,所以也是可以做科学研究的,可以预测他在博弈当中会有什么行为。我觉得这是一件很有意思的事情。有一个报道是说在美国研究中国史,研究中国史的经常会旁听别的讨论小组,因为会有更多的方法论,你看外国人做中国史他的眼光就很多,方法就很多。在中国做中国史的一个很大的缺点就是,近亲繁殖,自我循环。我在复旦的一个好处就是没有人能指导我分析哲学该怎么研究,我就可以相对自由地研究。我对认知语言学具有很大的兴趣,而其在国内其实是很多的,但在复旦没什么人做,那么也就没什么人可以束缚你,可以相对自由地研究。所以我的一个致学的道路是自称杂家,就是自己觉得酷的理论就去看,但是我是有选择性的,往往倾向于自然主义的,倾向于用一些比较硬的学科来解释比较软的学科。比如借助基因的思维来解释比较软的文化现象我更能看得进去,反过来的话除非给出很硬的证据。所以我认为在很大程度上现在的我们哲学教育的一个最大的问题就是,它的线性结构,即一路传下来,但西方学术界会发生一些爆炸性的事件,这也是我喜欢认知科学哲学的一个道理,认知科学哲学的一个最大的特点就是你还是得关心自然科学哲学,然后想办法把它和这个东西结合在一起。现在的问题就是大家对于知识谱系的网是非常单一的,并没有了解外部发生的事情。所以就我自己学问的一个特点就是:随心所欲。意思是我不管是什么学科,我就看是否觉得酷,如果觉得为我所用我觉得就值得看。所以基本上我有点倾向于亚里士多德那种博物学传统,所以我上课经常和大家讲一些偏门的知识。我认为将一些技术性的东西和偏门的知识结合起来是非常有趣的。最后我认为作为语言学学习而言,首先作为国际通用的英语是必须要掌握的,否则没有办法做研究。所以我一开始就强调了有些人强调母语意识是为了把英语边缘化,背后是一个智力斗争。因为你可以看出不同的人学语言的成本是不一样的。因此你在强调母语意识的时候,不是反对国际的英语,而是反对第三层意思,即安格鲁撒克逊的那种母语感。比如欧洲人的英语就要比美国人的英语易懂,因为欧洲人的用词都非常的规范,而美国人的英语所带的地方性特征,那种母语感是中国人学不会的,除非你生活在那里。


以上就是鹭岛青年哲学工作坊的第三期内容,希望有更多的老师和同学参与到后续的分享与讨论当中!

(华侨大学哲学与社会发展学院哲学专业本科生宋琦整理)