Character1995的个人博客分享 http://blog.sciencenet.cn/u/Character1995

博文

[转载]3.2.4乔姆斯基的语言观2

已有 1201 次阅读 2023-1-14 12:44 |系统分类:观点评述|文章来源:转载

自然语言的使用需要说出或写下符号才算完成。人类婴幼儿对母语的学习,是从父母、周围其他人的讲话,不断接收实际例子,以熟悉不同场景下字、词、复合词、词组等素材的使用,以及各种组合方式的使用;然后自己不断实践、反馈与校正,在这过程中有意识无意识地会对言语的使用进行分析与总结,形成相应的语感与直觉。传统上,语言学家的研究主要是从言语,即人们说出的话,或写下的文本来进行观察与总结。这种总结得到的主要是语法,也涉及语义、语用,以及更多的主题。今天,所有这些方向的研究综合起来,也不能给出对自然语言令人满意的解释。用于指导实践时,效果也差强人意。在对第二语言的学习中,以中国人学习英语为例,教学上很强调对语法的掌握,认为这是正确使用的基础。大量的时间与精力会用于对语法规则的记忆与练习,整个学习过程经年累月,最后的效果是多数人都不能应付日常的会话。

怎么说,怎么写,这些思考发生在人脑中,目前这是不能观察的。从外部对言语行为进行的观察总结,是否刻画了人脑中语言使用的真实机制与过程?这个问题的答案更多是倾向于否定。接近于对大脑中语言使用机制的描述,我们可以找到索绪尔“联想关系”与“句段关系”的说法。“联想关系”主要意思是:语言的任何素材会按任意一种意义上的相似形成记忆里的聚类;可以是语义上的相关,也可以是形式上的部分相似,或者在各类组合里占据相同的位置……“句段关系”就是指语言里的符号单位的组合性,这里强调是对组合应用的场景、使用目的、上下文、配列的单位、可替换性等的潜意识分析与整理。索绪尔的这些观点不全是观察可见的事实,还包括了通过内省才能得到的认识。这些观点也只是说明性的,并没有形成一种详尽的描写。

目前,语言学家对自然语言形成的认知,主要是通过自然语言的符号方式来进行描述与说明的,这种表达方式是否有效也是一个问题。使用现代计算机,应用统计方法,对大量语料进行计算,在此基础上形成对部分人类言语行为的模拟,这是当前在做的自然语言处理的研究。由此方法建立的系统,可能更接近于大脑里的真实机制。这目前更多是一项技术,并没有输出系统的观点,指导人们理解自然语言。

如何认识语言?怎样对语言有效地描写?这仍是一个基本问题。美国语言学家诺姆·乔姆斯基(Avram Noam Chomsky1928-至今)于1957年出版了《句法结构》一书,开创了转换-生成语法理论,对这一问题给出了不一样的回答。乔姆斯基把语言分为语言能力与语言行为二方面,相当于索绪尔的语言与言语。语言能力追溯到人类智力上天赋的“普遍语法”,普遍语法加上不同的参数形成各种具体的自然语言,这些参数是由历史选择与积累,并体现为社会拥有的母语的特征、使用规则、甚至直觉。语言行为是语言的具体使用与结果。传统语言学是从语言行为研究语言的,这被乔姆斯基认为是经验主义的做法。乔姆斯基的语言学是以语言能力为研究对象,期望通过对语言能力的研究可以解释人类语言的习得机制。相对于经验主义,乔姆斯基的语言研究具有理性主义色彩,他借鉴逻辑与数学的方式,从假设出发,期望可以构建形式的符号系统,通过符号系统规则的递归应用,可以从基本的词库生成所有人类语言语句,包括已有的语句以及潜在无穷的语句。然后通过对这个符号系统的逐步求精可以认知到人类的语言能力。

乔姆斯基的转换生成理论历经多个阶段,目前仍处于探索与变动之中。本节中我们简单介绍下乔姆斯基理论早期的短语结构语法,以及该学派建立的四种文法。短语结构语法的生成规则可图示如下:

短语分析.png

                                               (图3-2:短语结构树)

图中的每一符号表示一个语法类别,最下面的竖线表示每一叶子结点可由对应类别的具体词汇替换。

S   :表示一个待定句子

NP  :表示一个名词短语

VP  :表示一个动词短语

Det :表示一个定冠词

AP  :表示一个形容词

N   :表示一个名词

V   :表示一个动词

示意来说,一个句子通过下面的程序进行替换改写生成。

第一步:初始S

第二步:S=NP+VP

第三步:S=DET+AP+N+VP(替代NP

第四步:S=DET+AP+N+V+NP2(替代VP

第五步:S=DET+AP+N+V+DET+N(替代NP2

第六步:具体的单词替换上面各位置值,得到具体句子

其中S=NP+VPNP=DET+AP+NVP=V+NPNP=DET+N中右边表达式对左边表达式的替换,以及实际单词对(NVAPDET)的替换就是乔姆斯基理论中的语法规则。

短语结构语法也称为0-型文法,或无约束文法。一门语言里如果构建一个规则集:PP能够生成所有可被接受语句,或者基于P能判断每一语句是否能被接受,这个P称为一个文法。除0-型文法外,乔姆斯基及其学派的其他人还研究了其他的三种文法,并将这些文法理论形式化。P中每一规则可表示A→B,即出现A时可以用B替代,如果B字符串长度大于A,也称为产生式规则。能够出现于所有A→B规则的AB位置的字符,其组合的集合称为字母表,字母表中包括了如NPVP这样的语类的变项,这样字母表的内容组成可分为非终结符号与终结符号,终结符号是不能再分解的符号,比如说基础词汇、标点符号,终结符形成的集合表示为∑。字母表中终结符以外的内容就是非终结符,它们是生成过程中的非叶子结点。非终结符的集合表示为NN交∑为空集。每一次生成过程,能作为起始的非终结符号称为识别符号,比如语句类型的变项,识别符号形成的集合表示为SSN的一个子集。这样一门形式的语言可表示为:

G=N,∑,PS

字母表+P={语言里所有的语句}

四种文法从0-型文法开始,每一文法在前一文法基础上增加对P的约束得到,增加的约束可以是针对产生式P的左边,也可以是右边:

无约束语法:0-型文法

语法形式:A→B

约束:

P中至少有一规则A位置出现非终结符号

在满足约束的条件下,A改写为B

 

上下文相关文法:1-型文法

语法形式:XAY→XBY

新增约束

|A|<=|B|:绝对值符号表示字符长度

且,B位置不能出现S集中字符

在满足约束的条件下,A改写为B,当A位于左边是X右边是Y的序列中

 

上下文无关文法:2-型文法

语法形式:A→Z

新增约束:

A位置有且仅有一个非终结字符

在满足约束的条件下,A改写为B

 

有限状态文法:3-型文法(正则文法)

语法形式:A→Αb/A→Bα/A→a

新增约束:

出现在B位置上字符最多只能是二字字符,两个字符时必须一个为非终结符,另一个为终结符(小写字母),而当只有一个字符时,必须为终结符。

在满足约束的条件下,A无条件改写为Αb、或、或a

乔姆斯基的理论体现为形式文法系统,这些形式系统被看作语言的核心部分;且这些形式系统是自足自洽的,并不依赖于意义或者语音,它们只在最后形成表述时产生相互作用。如果乔姆斯基的理论在自然语言领域取得成功,按本书的观点,对自然语言的认知也就外化为了他的形式文法符号系统。然而,乔姆斯基的理论没有真正成为自然语言的模型,问题主要是他对意义的看法,意义不大可能只视为表层作用的因素。言语的表达输出很难说没有意义的驱动,反过来,同一意义则可采用不同形式来表达。相比较,组合性的说法与经验更加符合。乔姆斯基的工作类似于严格限制环境条件下的思想实验,这类实验所得到的结论,总会与真实的状况有差距。另一方面,这种更纯粹、抽象的理论,在不依赖于经验语义的人工语言领域,如计算机程序设计语言领域,成为了一种真实的理论基础。后来的研究揭示,乔姆斯基理论所述的语言机制可与自动机器关联起来。四种文法正好对应了四种自动机:无约束文法对应图灵机;上下文相关文法对应线性有限自动机;上下文无关文法对应下推自动机;正则文法对应有限状态自动机。正是乔姆斯基理论能够延伸与交叉出的内容,显示出其特别的意义。




https://m.sciencenet.cn/blog-3433545-1371936.html

上一篇:[转载]3.2.3符号的组合2
下一篇:[转载]4.1算术2

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 18:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部