科学网

 找回密码
  注册
科学网 标签 语言学 相关日志

tag 标签: 语言学

相关日志

语言科学探索的最新发现:融通融合的方式,在索绪尔时代已见端倪(清华大学雨课堂主讲嘉宾邹晓辉讲授)
geneculture 2020-8-27 12:36
个人分类: 语言学基础研究|1325 次阅读|2 个评论
清华大学雨课堂主讲嘉宾邹晓辉讲授语言科学内在建制:语言学和语言哲学之后的发展(涉及跨学科研究和大跨界整合的关键问题)
geneculture 2020-8-26 09:29
今晚8点清华大学雨课堂主讲嘉宾邹晓辉讲授语言科学内在建制:语言学和语言哲学之后的发展(涉及跨学科研究和大跨界整合的关键问题)
个人分类: 语言学基础研究|1150 次阅读|1 个评论
语言学和语言哲学之后的语言科学
geneculture 2020-8-7 11:26
这是一个开创性的讲座(邹晓辉曾在美国加州大学伯克利分校2011、北京大学语言认知论坛2018和清华认知系统论坛2018分别做过一系列前期讲授,今天在清华大学雨课堂秋季课程(暑期班开头)系统讲授(在世界大学城也会做一次通俗讲座)。
个人分类: 语言学基础研究|1291 次阅读|1 个评论
当下最重要的是:怎么从难以置信一步一步走到确信无疑?
geneculture 2020-7-5 13:17
什么是当下最重要的:怎么从难以置信一步一步走到确信无疑? 删除 原创作者:融智学创立者邹晓辉 邹晓辉大鱼号 10分钟前 今天是周末,2020年07月05日。刚看完《局中人》第21集。之前,早晚又都听了清华大学雨课堂主讲嘉宾邹晓辉讲授的《八言八语:语言科学中文认知范式探新》回放视频(蕴含着许多人都梦寐以求的千载难逢的机会)。再联想到最近看的《爱我就不要想太多》。因此,有话想说,有问题要问:芸芸众生的读者之一的阁下,您究竟在期盼着从阅读之中得到什么潜在的巨大回报呢? 一、回报之一:阅读本身的愉悦 阅读的喜悦之一就是文从字顺。俗话说得好,人生一世,草木一生。人生天地之间,若白驹过隙,忽然而已。在《爱我就不要想太多》和《局中人》里,都可窥斑知豹。进而,再看一看,听一听,清华大学雨课堂主讲嘉宾邹晓辉讲授的《八言八语:语言科学中文认知范式探新》回放视频,如能洞悉其中蕴含着许多人都梦寐以求的千载难逢的机会,那就犹如:久旱遇甘露(国人太需要这样可扬眉吐气的原创来引领振兴社会文化经济诸多事业)。 二、回报之二:作者传递的信息 国人太需要这样可扬眉吐气的原创融智学研究成果来引领振兴社会文化经济诸多事业了! 2.1. 字面信息 您可按重要级别排序如下: A. 清华大学雨课堂主讲嘉宾邹晓辉讲授的《八言八语:语言科学中文认知范式探新》回放视频(蕴含着许多人都梦寐以求的千载难逢的机会)。B. 《爱我就不要想太多》。 C. 《局中人》。然后,去网上找来看一看。 2.2. 特殊信息 其中,清华大学雨课堂主讲嘉宾邹晓辉讲授的《八言八语:语言科学中文认知范式探新》回放视频看后,您会想它究竟蕴含着什么样的机会可称之为许多人都梦寐以求的千载难逢的机会呢?需要您动一动脑筋好好想想!如果还是想不到,那么就说明您还需要一些提示信息-或许它们就藏在《爱我就不要想太多》和《局中人》里。 2.3. 知音信号 从《爱我就不要想太多》和《局中人》里您不仅可看到日常生活里喜怒悲哀和贪求痴慕的各类人的知音信息,而且还会发现“喜怒悲哀全是假,贪求痴慕总是真”古人的金句蕴含的真谛及其背后的警醒作用。然后,您才有可能进一步去想:什么叫中文认知范式?这样的问题及其答案是需要知音信息的指引提携才能有所顿悟的。 三、回报之三:学莫便乎近其人 综上所述,本文传递了一系列的有用信息,就看读者您自己的悟性和缘份了。通常的读者容易感受到的形象化的对象都是可感的物化对象或其可视化的文化形式,而对需要开动脑筋加上必要的背景知识乃至切身实际经验才能理解的抽象的意化理念却往往都会失之交臂-哪怕其中就是蕴含着巨大的商机或缘份。-原创作者:融智学创立者邹晓辉
个人分类: 语言学基础研究|1495 次阅读|3 个评论
语言学和信息学的枢纽:清华大学雨课堂融智学系列讲座回顾
geneculture 2020-7-2 22:49
https://search.bilibili.com/video?keyword=%E9%82%B9%E6%99%93%E8%BE%89 大道至简一键搞定看启迪智慧的公益课回放 https://search.bilibili.com/video?keyword=%E9%82%B9%E6%99%93%E8%BE%89order=clickduration=0tids_1=0
个人分类: 语言学基础研究|1416 次阅读|2 个评论
智能系统研究: 语言和知识的选域测序定位(语文现代化与知识大生产的枢纽)
geneculture 2020-7-2 10:59
主讲嘉宾邹晓辉讲授的融智学导论 第38课 语文现代化与知识模块大生产的枢纽
个人分类: 高教管:特色与质量|1103 次阅读|0 个评论
清华大学雨课堂公益课 跨学科思维训练 语数英 第七课 开启新时代的维特根斯坦 融智学系列课程之学术大师介绍
geneculture 2020-6-23 14:54
清华大学雨课堂公益课 跨学科思维训练 语数英 第七课 开启新时代的维特根斯坦 融智学系列课程之学术大师介绍 语数英综合技能发挥文本理解作用
个人分类: 高教管:特色与质量|1451 次阅读|4 个评论
世界语论文钩沉:世界语的语言学特点(3/3)
liwei999 2020-5-13 04:50
【立委按】语言类型学把自然语言分为注重词法的综合语言和注重句法的分析语言。区别在所依赖的主体语言形式和表达手段不同。世界语的最大特点是兼收并蓄,分析综合两种表达手段在武器库并存。这是设计时候的有意为之(不得罪任何民族),进而产生了表达手段丰富、风格多变灵活的效果,让人惊艳。 Li, Ŭej (Wei) 1991. Lingvistikaj trajtoj de la lingvo internacia Esperanto. InSertagratulatoriainhonoremJuanRgulo,Vol.IV.pp.707-723.LaLaguna:UniversidaddeLaLaguna 李维,1991:国际语世界语的语言学特征 3. 分析形式和综合形式 3.1 世界语的另一个突出的语言学特点是,它既具有分析语言的手段,又具有综合语言的精髓。世界语在功能词和词尾变化方面都很丰富,可以通过分析形式(借助功能词)或通过综合形式(借助词尾变化)表达语义关系。 当然,这两种形式并不完全等同,它们展示了不同的风格。 世界语非常灵活且富有表现力。 作为目标语言,它可以很好地模仿原文作品的语言特征,无论是词序自由富有弹性的斯拉夫风格,还是诸如中文和英文这类语言的平实风格。 以下是世界语中分析形式和综合形式普遍并存的一些示例: 分析形式 / 综合形式 (1) 时态: Mi ESTAS srib-ANTA. / Mi skrib-AS. Mi skrib-ANTAS. (2) 语态: Ĝi ESTAS limig-ITA. / Ĝi limig-ITAS. Ĝi lim-IĜAS. Ĝi SIN-limig-AS (3) 词义: Tio estas MALGRANTA (ETA) sekreto. / Tio estas sekret-ETO. (4) 介词短语与格变以及副词形容词(-E/-A)的类变: Li parolas EN (PER) Esperanto. / Li parolas Esperant-E (EsperantON). la libroj DE mi / mi-AJ libroj Ŝi parolis POR (JE) 30 minutoj. / Ŝi parolis 30 minut-OJN. LAŬ mia opinio / miaopini-E ridi JE iu / ridi iu-N EN (JE) fakto / fakt-E inkluzive DE 2 poemoj / inkluzive 2 poemoj-N (副词带名词宾格!) vidi mult-E DA homoj (mult-ON DA homoj) / vidi mult-AJN hom-OJN (5) 介词手段与合成词手段: finiĝi tie, KIE VI TROVAS BONA / finiĝi laŭ via BONTROVO; finiĝi LAŬBONTROVE (更多例示参见【附录3】及 2.1.7.) 3.2. 最重要的分析形式:助/系动词 EST- 与介词 3.2.1. 仅有的助/系动词 EST- 3.2.1.1. EST- (BE)没有实义, 从综合语角度看,它是不需要的: Ili ESTOS skrib-ITAJ ĉe la jarfino. – Ili skribi-ITOS ĉe la jarfino. Ni ESTAS ĝoj-AJ ESTI ricev-INTAJ iliajn leterojn. – Ni ĝoj-AS ricev-INTI iliajn leterojn. Vi ESTAS vere bonkor-AJ (vi en pluralo). – Vi vere bonkor-AS (没有数的变化). Li ESTAS profesor-O (laboradis kiel profesoro) en tiu universitato. – Li profesor-IS (profesor-ADIS) en tiu universitato. 注意,EST- 作为助动词可以被取代,但作为系动词则不能简单取消: Ĝi ESTAS tablo. / ?? Ĝi tabl-AS. Ĝi ESTAS biciklo. / ** Ĝi bickl-AS. Kp. Li bicikl-AS. = Li ESTAS bicikl-ANTA. = Li bicikl-ANTAS. ESTAS 3 homoj en la ĉambro. / ?? 3 homas en la ĉambro. 3.2.1.2 EST-一词虽然只有一个,但作为分析形式却极大地丰富了表达方式。否则,语言将具有完全不同的风格,趋向紧凑和刻板,很难为母语为分析语言的人所接受。 3.2.2 介词短语 3.2.2.1 在语言学界普遍认为介词短语(介词加名词补足语)本质上也是一种”格”,唯一的区别是介词表达语义关系通常比”格”更为具体。实际上,不同介词也包含不同程度的具体性,例如,比较: intituto JE lingvistiko – instituto DE lingvistiko – intituto PRI lingvistiko (从抽象到具体) 有一些相当抽象的介词实际上可以像其他语言中的”格”一样工作,例如 JE / DE / AL / PRI / PER(请参阅【附录3】)。 (请注意,格的语义在抽象上也有所不同。) 3.2.2.2 正如2.3 中已经提到的,副词(以-E结尾)也是一种语义抽象的格(状语格)。但是,世界语中的副词其实也可以表示与任何介词一样具体的关系! 条件是词干是词根和介词前缀派生而来。例如: LAŬ (la) regulo(j) – LAŬ-regul-E (更抽象地: regul-E ) 有许多这样的示例(请参阅2.1.7)。 实际上,完全可以在介词短语”P+la+N”与其相应的副词”P-N-e”之间自由转换(省略冠词LA)。 3.2.2.3 因为每个介词也可以同时充当前缀(世界语前缀集的主要部分!),所以所谓的“重要的分析形式”介词恰恰也是最重要的综合形式(词缀)之一! 3.3 【小结】 世界语随处可见分析形式和合成形式的共存,这是世界语不同于民族语言的重要特点之一。尽管没有排除任何分析形式手段的纯粹的综合语言,也没有完全独立于综合形式的纯粹的分析语言,但是每种民族语言总是以一种形式为主导,难以见到两种形式的普遍并存和自由转换。 4. 世界语的透明性 4.0 世界语的本性是形式足够透明(无论是词与词组合的分析形式还是词内部组合的综合形式,但分析形式似乎比综合形式具有更高的透明度),这无疑是其突出的优点之一,也是世界语易于学习的主因。世界语之所以如此,是为了让人们可以使用很少的形式(元素)来表达无限的信息,也为了让接受方易于将语句解析成理解的元素。 4.1 世界语是完全透明的吗? 并非如此,而且永远也做不到,而且也不必要 – 至少对于人类语言而言。 透明性的前提是,每个概念都可以被分析成可数的语义因子或”义素”(这可能吗?参考人工智能圈中的相关进展)。另外,语义相互联系的复杂度应该是可以容忍的。这一点并不总能满足,特别是对于科学术语而言。术语通常内容丰富且含义精确,以至于其阐释往往需要完整的论文。因此,这种概念只能通过某种语音形式固定在人脑中,其书面对应物往往是个不透明的单词!另一方面,大多数科学术语都享有国际性,因此,硬性把术语按照世界语构词法透明化往往并非智举,例如,把 matematiko 叫做 nombro-scienco,但是“数学”仅仅是数字科学吗?(参见4.4) 4.2 就像分析形式和综合形式的共存一样,在世界语中,许多情况下(当然是在不同的层面),透明形式和非透明形式也普遍并存。 Pekino: Beijing lingvoscienco : lingvistiko preskaŭ ne: apenaŭ elektre kalkula maŝino: komputilo (aŭ: komputomaŝino ): komputoro (aŭ: komputero ). 值得注意的是,为了术语的精确性和世界性,世界语甚至可以容忍这种完全“非世界语化的”外来词黑箱子( komputoro / komputero )! 4.3 然而,一些最常用的日常用语已经将自己确立为透明形式,这又表明了世界语有强烈的透明化倾向! patrino: ?? matro malbona: ?? bada maldekstra: ?? lefta 但是,良好风格的世界语不走极端,即使是手握最有效和最容易的手段: ?? malkun: sen ?? malmorgaŭ: hieraŭ (aŭ ?? malhieraŭ: morgaŭ) 4.4 世界语的两难 4.4.1 世界语作为国际语言,旨在为全人类提供便利的交流。但是,在语言实践中,透明度(世界语的语言内涵)与国际性(世界语的目标外延)之间往往存在两难,这在术语的构造中表现最为明显。结果,世界语词汇比预期的要大得多,增加了学习的难度。 4.4.2 世界语作为一种有效的沟通工具应该而且往往也是偏向紧凑的形式,但透明性是紧凑性的反面。实际上,越透明,就变得越松散。 4.4.3 最后,在透明性(从而易于学习而很少消耗记忆和精力)和包容性之间也存在两难。世界语作为一种科学的和面对人类的语言,需要在形态和句法上包容所有有效的语言资源,这就需要多种形式的共存,自然也包括不透明的形式。 5. 总结 5.1 从上面论述可以看出,与主观推论相反,世界语是一种极其灵活的语言,具有多种可以相互补充和转换的表达方式。语言的灵活性也更易适应人类思维的模糊性。它为人们提供了极大的表达自由,为充分发挥使用者的语言潜能提供了最佳条件。另一方面,它也具有很大的包容性,即使是初学者或语言能力欠缺者也可以比较轻松简单地以易于理解的方式表达自己。这是一个适合所有人的表达天地。但是,这种灵活性不会影响世界语基本语法的严谨性。自由与严谨在这里和谐相处。在世界语中,每个人都是创造者,每个世界语者都能体验到这种创造的乐趣。人们不再是语言习惯的奴隶。世界语的灵活性和规律性的和谐统一是一种真正的语言奇迹。 5.2 世界语语言学特点关键字集合: (以)人(为)本性/自然性/科学性/规律性/包容性/容忍性/弹性/粘合性/数学性/拟递归性/逻辑性/透明性/可分析性/灵活性 5.2.1 这些特点大体呈现如下关联:灵活性 – 粘合性(从而透明性)和各种形式的包容性(无论分析形式还是综合形式,透明或不透明);规律性与科学性 – 数学性和逻辑性 5.2.2 从容忍性和实际信息交流的角度来看,前文所有标有??的示例都是可以容忍的,至少是可以理解的。与民族语言相比,这种宽容显得尤为突出。 5.3 【结论】 世界语的超凡成功是人类语言历史上的一个伟大奇迹。这是人类理性的胜利,语言学的胜利!在“习惯就是上帝”的语言领域,世界语作为国际语言独树一帜,其与民族语言形成的语言学对比,怎样赞誉也不过分。 【附录1】 我们以词根STUD-的全部动词和形容词形式为例,将其与英语study的相应形式进行比较。 (1)42个动词形式: stud-I stud-U stud-US stud-AS stud-IS stud_OS stud-ANT-I stud-ANT-U stud-ANT-US stud-ANT-AS stud-ANT-IS stud-ANT-OS stud-INT-I stud-INT-U stud-INT-US stud_INT-AS stud-INT-IS stud-INT-OS stud-ONT-I stud-ONT-U stud-ONT-US stud-ONT-AS stud-ONT-IS stud-ONT-OS stud-AT-I stud-AT-U stud-AT-US stud-AT-AS stud-AT-IS stud-AT-OS stud-IT-I stud-IT-U stud-IT-US stud-IT-AS stud-IT-IS stud-IT-OS stud-OT-I stud-OT-U stud-OT-US stud-OT-AS stud-OT-IS stud-OT-OS 2.28个形容词形式 stud-A/stud-A-J/stud-A-N/stud-A-J-N stud-ANT-A/stud-ANT-A-J/stud-ANT-A-N/stud-ANT-A-J-N stud-INT-A/stud-INT-A-J/stud-INT-A-N/stud-INT-A-J-N stud-ONT-A/stud-ONT-A-J/stud-ONT-A-N/stud-ONT-A-J-N stud-AT-A/stud-AT-A-J/stud-AT-A-N/stud-AT-A-J-N stud-IT-A/stud-IT-A-J/stud-IT-A-N/stud-IT-A-J-N stud-OT-A/stud-OT-A-J/stud-OT-A-N/stud-OT-A-J-N 【附录2】 世界语词尾削尾算法(自动词法分析): (1)若词尾为-O,则得结论Substantivon/Nominativon/Singularon,转(2);否则,转(11). (2)削尾后查词干词典.查词典成功则得结论Nulmodon/Aktivon,加工毕;否则,转(3). (3)若词尾为-ANT,则得结论Participon/Aktivon/Kontinuon,转(9);否则,转(4). (4)若词尾为-INT,则得结论Participon/Aktivon/Perfekton,转(9);否则,转(5). (5)若词尾为-ONT,则得结论Participon/Aktivon/Malperfekton,转(9);否则,转(6). (6)若词尾为-AT,则得结论Participon/Pasivon/Kontinuon,转(9);否则,转(7). (7)若词尾为-IT,则得结论Participon/Pasivon/Perfekton,转(9);否则,转(8). (8)若词尾为-OT,则得结论Participon/Pasivon/Malperfekton,转(9);否则,转(10). (9)削尾后查词干词典.查词典成功则加工毕;否则,转(10) (10)得结论Novavorton,加工毕。 (11)若词尾为-A,则得结论Adjektivon/Nominativon/Singularon,转(2);否则,转(12). (12)若词尾为-E,则得结论Adverbon/Nominativon,转(2);否则,转(13). (13)若词尾为-OJ,则得结论Substantivon/Nominativon/Pluralon,转(2);否则,转(14). (14)若词尾为-AJ,则得结论Adjektivon/Nominativon/Pluralon,转(2);否则,转(15). (15)若词尾为-ON,则得结论Substantivon/Akuzativon/Singularon,转(2);否则,转(16). (16)若词尾为-AN,则得结论Adjektivon/Akuzativon/Singularon,转(2);否则,转(17). (17)若词尾为-EN,则得结论Adverbon/Akuzativon,转(2);否则,转(18). (18)若词尾为-OJN,则得结论Substantivon/Akuzativon/Pluralon,转(2);否则,转(19). (19)若词尾为-AJN,则得结论Adjektivon/Akuzativon/Pluralon,转(2);否则,转(20). (20)若词尾为-AS,则得结论Verbon/Predikaton/Prezencon,转(2);否则,转(21). (21)若词尾为-IS,则得结论Verbon/Predikaton/Preteriton,转(2);否则,转(22). (22)若词尾为-OS,则得结论Verbon/Predikaton/Futuron,转(2);否则,转(23). (23)若词尾为-US,则得结论Verbon/Predikaton/Kondicionalon,转(2);否则,转(24). (24)若词尾为-U,则得结论Verbon/Predikaton/Volitivon,转(2);否则,转(25). (25)若词尾为-I,则得结论Verbon/Infinitivon,转(2);否则,转(26). (26)该词没有词尾。查功能词词典。查词典成功则得结论Funkcivorton;否则,得结论Novavorton/Substantivon/Propranomon。加工毕。 【说明】上述算法已经上机实现,验证其有效性。 【附录 3】 世界语与其他语言格系统的比较
个人分类: 立委科普|2422 次阅读|0 个评论
世界语论文钩沉:世界语的语言学特点(1/3)
liwei999 2020-4-19 13:55
【立委按】很久很久以前,我发表过一篇世界语语言学特点的论文,后应邀扩展为一个 chapter,这段经历我在博客有记录。记得只看到样本,密密麻麻都是老先生对我论文的校对,但未等到付印我就出国了。后来流浪世界,一直没有顾上追踪这篇论文的下落,直到博士毕业来美国加入创业公司。我在公司做了主管以后,想到在世界语圈子的 Paul,他当时是加拿大世界语协会主席,也是我的兄弟学校的语言学博士候选人。Paul 苦读多年终于要毕业了,我就把他招来做了我的手下。有一天我提到这篇论文的事儿,他主动说我可以到图书馆查询,看到底发表了没有。后来他果然找到了,复印给我当年我呕心沥血写就的长篇论文。这篇论文的底稿早就不存了,只剩下这篇复印件,我一直想把这篇论文重新数字化,但还没找到合适的世界语文字识别软件,可是要是一字字地敲进去又没有这个耐心。在这喧嚣的世界里,我们越来越浮躁,很难静下心来。现在加入了这个群组,左右都是同仁和老师,感觉给了我动力。20多页密密麻麻,我就一点一点植字,也算是重温旧梦吧。 Li, Uej (Wei) 1991. Lingvistikaj trajtoj de la lingvo internacia Esperanto. InSertagratulatoriainhonoremJuanRgulo,Vol.IV.pp.707-723.LaLaguna:UniversidaddeLaLaguna 李维,1991:国际语世界语的语言学特征 1. 世界语的黏着性 1.0 众所周知,世界语在很大程度上是一种典型的黏着语,它的语素(词尾、词缀和词根)具有相对固定而独立的含义,可以“黏着”(叠加)构词。下面我着重探究世界语词尾黏着的构词能力,尽管词缀黏着(所谓派生词构词法)与词根黏着(所谓复合词构词法)同样有趣,值得研究。 本文中的术语“词尾”专指语法词尾,亦叫“形态”。 1.1 词尾黏着 一般而言,词尾用于表示语法信息:词类、格、数、时态、语态、语气等。 1.1.1 世界语中有多少个独立的形态语素? 其绝对数非常有限,只有17个,即:-o,-a,-e,-n,-j,-i,-u,-as,-is,-os,-us,-ant-,-int-, -ont-,-at-,-it-,-ot-。由于它们的黏着组合的特性,17个形态语素就足够完整,其表现力几乎可以与形态丰富的语言媲美。 1.1.2 根据17个基本形态,可以从一个词干按规则生成多少个单词形式呢? 理论上的答案是112:42个动词,28个名词,28个形容词和14个副词(请参阅附录I)。 1.1.3. 形态语素黏合成词尾的规则 1.1.3.1. 每个单词只有一个词类。实词总是以其形态标示其词类:名词、形容词、动词还是副词。但是,功能词(例如介词,原副词等)是由词典人为规定的词类,它们是可枚举的。因此,表达词类的形态语素之间不允许黏合,就是说,-o,-a,-e,-i /-u/-as/-is/-is/-os/-us 这些词尾相互独立,不可叠加,例如下列形式是非法的: ** -as-o / ** -e-i 【说明】 ** 表示不合法的语言形式(单词或短语),而 ?表示成问题的语言形式。 1.1.3.1.1. 词类不交叉是国际语很大的优势:世界语不存在词类同形现象,这无疑为无论是人还是机器的对词的功能解析提供了的极其有利的条件。而词是最小的句法单位和基础。世界语的高度规则性在此得到了最好的体现。 1.1.3.1.2. 另一方面,上述特点也带来了世界语利用词尾任意转换词类的自由,只要词类转换不违背逻辑(参见1.1.5.1)。这不正是世界语兼具高度规则性与高度灵活性的体现吗?例如: La flor-OJ glor-AS. (那花儿绽放了:“花儿” 与 “绽放/开花” 是同一个词根 flor- 只是词类词尾不同) Li kan-AS italan popolan kant-ON. (他唱意大利民歌:“唱” 与 “歌” 是同一个词根 kant-,只是词类词尾不同) Mi estas ĝoj-A. Mi ĝoj-AS. (他开心:“开心/高兴” 无论是动词谓语,还是做系动词后面的形容词标语,词根都是一样的 ĝoj- ) la propon-ITA propon-O (所提建议:“提议” 与 “建议” 同一个词根,只是词类词尾不同) 词类转变在古代汉语也有类似的自由度,叫做“词类活用”。但是,不幸的是,古汉语的词类转换没有以可见的形态表现出来,只能通过上下文句法、逻辑的分析来识别(“句读”)。请比较: 1)三“人”行,必有我师。(Tri hom-OJ iras, inter kiuj nepre estus mia instruisto.) (因为没有词尾形态,逐词直译就是:tri hom? ir?, nepr? est? mi? instruist?). 其狼“人”立而嗥。(La lupo hom-E staras kaj hurlas.) (逐词直译:tiu? lup? hom? star? kaj hurl?). 2)其物“净”且清。(La aĵo pur-AS kaj klaras.) (逐词直译:tiu? aĵ? pur? kaj klar?). “净”其身,食其肉,乃去。(Pur-IG-IS la korpon, manĝis la viandon, kaj eliris. ) (逐词直译:pur? tiu? korp?, manĝ? tiu? viand?, kaj elir?). 1.1.3.2 表示词类的形态都可以黏合到 7 个“中缀”型形态上(中缀形态永远不会出现在单词的结尾),其中6个是所谓“分词”形态,用来表示“时体”(进行体、完成体与未完成体)和语态(主动语态和被动语态)。这6种分词形态各自独立,不能相互黏着。第7个是“零形式”(即分词形态阙如,表示默认的“一般体”加主动语态的含义)。 1.1.3.3 动词的黏着规则 1.3.3.1 一个动词必须用以下词尾之一:-i / -u / -as / -is / -os / -us,它们之间不再存在黏着的可能性。这意味着,以 -i(不定式),-u(命令式) 或 -us (虚拟式)结尾的不再有时态的变化/含义,而 -as(现在时) / -is(过去时) / -os(未来时)不再有“时体” 的变化/含义。 1.1.3.3.2 世界语动词没有“数”与“格”的变化。因此,动词词尾不能与复数词尾 -j 和 宾格词尾 -n 黏着。因此,在世界语中,不存在以下两种形式的区别: Mi skrib-as. / ** Ni skrib-j-as. (au: ** Ni skrib-as-j.) (即不存在其他语言那种主谓在数上的“一致关系”要求。) 1.1.3.3.3 表示时态(现在,过去和将来)和语气(不定式、命令式和虚拟式)的 6 种动词词尾,加上表示时体和语态的7格分词形式,黏着在一起的结果为:6*7 = 42 个动词形式。 【问题探讨】不定式到底是语气(modo)还是独立的词类(speco)? 1.1.3.4 名词和形容词的黏着规则 1.1.3.4.1 名词和形容词有“数”(单数为零形式,-j 为复数形式)和“格”(主格为零形式,宾格形式为 -n)的形态变化。7个名词词尾 -o / -ant-o / -int-o / -ont-o / -at-o / it-o / ot-o,两个数变 (加 -j 或不加) 和两个格变(加 -n 或不加),最终形成 2*2*7 = 28 个名词形式(同理,有28个形容词形式)。 1.1.3.4.2 它们之间的顺序是:(词干)+ 分词 + 词类 + 数 + 格,其中词干 = 前缀+词根+后缀(前后缀可省)。例如:stud-ant-o-j-n。仅词根语素和词类语素必须有,其他语素可能根本不出现。上述语素之间的次序是很自然建立的,有语音方面的原因(尽管从形态上说,词尾语素之间的次序是纯粹任意的,因为次序本身不会改变其语法意义,这方面与词缀黏着的情形有所不同!参见1.2)。如前所述,即使词干以元音收尾,词类词尾的元音 o 或 a,后面跟半元音 j (复数)和鼻辅音 n(宾格)串起来发音和听音也还是很顺: sci-aj-n / ** sci-j-an 1.1.3.5 副词的黏着规则 与名词和形容词的规则非常相似,只是副词不包括“数”这个语法范畴(在这种情况下,应注意,副词宾格与名词宾格用法不同)。因此,这些副词形态变体的总数为 2*7 = 14。 1.1.3.6 关于黏着的词尾规则为建立用于“削尾”和加尾的算法提供了很好的依据,这是机器解析和翻译世界语的第一个必要阶段。由于黏着语内部的高度规则性(包括一定程度的递归),研究此类令人满意的算法并不困难(请参阅附录2)。 1.1.4 世界语17个基本形态语素是否做到了在语义上的单纯,没有交叉? 1.1.4.1 可惜不是。这在【附录2】削尾算法中看得很明显(比较各个形态对应怎样的词法意义)。 1.1.4.2 语义不交叉的词尾只有5个:-o / -a / -e / -i / -n。应该说明的是,所谓的语义不交叉的词尾并不一定意味着只对应一个语义。语义不交叉词尾 -n 实际上有三个语义(即包括了三个单独的句法或逻辑功能,当然,三者并不共存):(i)宾语;(ii)方向(通常用于副词或介词后名词);(iii)状语(通常用于时间、距离等名词,功能等价于介词 je)。再如,在某些语言中,存在三个数,单数(1)、双数(2)和复数(大于2),但是世界语复数词尾 -j 的含义更大,包括2或大于2。 1.1.4.3 在世界语中,没有单纯的基本形态语素来表示动词、谓语的特征以及词法范畴时态、语态、语气和时体“的具体所指。在分词的6个形式中,时体和语态是混杂在一起的。时态、语气与动词/谓语的特征也混合在一起。但是,这些不透明的的混合性词尾不会给人的理解带来困难。相反,它们显得足够自然和方便,特别是,那些混合在一起的词法特征都是紧密相关的。 【延伸讨论】 分词并不是独立的词类,它可以属于4个主要词类的任何一类。分词的真正含义是给一个词以逻辑动词的意味,类似于表示动作性意味的后缀(或“类词尾”)-ad- 。 1.1.4.4 有意思的是,即使在世界语不透明的混合形态中,也存在一定程度的“透明性”。在 -as/-is/-os/-ant-/-int-/-ont-/-at-/-it-/-ot- 中,“a” 似乎表示“现在”或“进行”,“i” 表示“过去”或“完成”,“o” 是 “未来”或“未完成”,“s” 似乎指 “谓语”(但命令式谓词 -u 则是例外,”n“ 表示 “主动”。尽管从形态学上,这些“类词尾”不能被视为基本形态,但是,所反映的这种“透明性”客观上加强了使用者对形态的把握,而且,人们总是体验到这些混合式形态构成的平行之美。 【延伸讨论】作为句法范畴,时态与时体显然彼此不同,但在实际使用中,其边界其实是灰色的: Verk-ONT-oj estas tiuj, kiuj verk-OS au verk-ONT-AS. Stud-ANT-oj estas tiuj, kiuj stud-AS (ne nepre stud-ANT-AS!). Hav-ANT-e multon da mono, mi ghojas. =Ĉar mi hav-AS (neniel necese hav-ANT-AS) multon da mon, mi ghojas. Li jam vid-IS/vid-INT-AS la filmon. 实际上,这两个词法范畴均与客观世界的时间维度相关,是针对事件时间的不同角度的反映。这大概就是柴门霍夫作为语言践行者,对两个客观相似的概念(例如“过去”与“完成”)采用相同的元音(“i”)作为形态构成因素的考量吧。 1.1.4.5 然而,正因为世界语没有单纯的形态语素表示语态,语态信息是融合在6个分词形态里面,这就造成如下情形:一个被动形式对应了两个主动形式,如下所示: -as / -antas -- -atas; -as / estas -anta(j) -- estas -ata(j) -is / -antis -- -atis; -is / estis -anta(j) -- estis -ata(j) -os / -antos -- -atos; -os / estos -anta(j) -- estos -ata(j) 这个问题的本质是世界语实际上有四个时体:一般体(零形式),进行体,完成体和未完成体,同时存在两个语态:主动(零形式)和被动。而六个平行的分词形式只能蕴含三个时体和两个语态。这种状况使得以零形式表示的一般体没有其对应的被动形式,从而使它无奈之下不得不去共享或抢夺进行体被动态的分词形式 -at-。不能不承认,这是世界语形态系统的一个理论缺陷。其结果是,尽管 -at- 理论上是 -ant-的被动对等物(进行体:-antas -- -atas),但实际上 -at- 通常是作为一般体的被动形式(一般体:-as -- -atas),越俎代庖了,因为一般体比进行体更为常用。因此,有人建议允许黏合形式 -ant-at- 或 -at-ant-,用作进行体和被动式的结合,或者将混合式分词形态独立开来,即:-ant-at- 代替 -at -,-int-at- 代替 -it -,-ont-at- 代替 -ot- ,以这种透明的黏合形式弥补形态体系的理论缺陷。这种符合黏合特性和组合逻辑的书斋提案,对于机器可能更加合理有效,但是对于我们人类来说,它们失之繁琐,反而成为不必要的学习负担。 1.1.4.6 【小结】理想的纯黏合语言是每个语素,至少每个词尾形态,应该具有单纯唯一的独立含义,正如柴门霍夫在《第一书》中声称的那样。任何复杂的意义组合都应该以语素的黏合手段加以表达。这也正是黏合语与其他的形态语言之间的根本区别。由此单词词形内的词法结构将变得彻底透明,完全可解析。最方便彻底贯彻这一黏合设计思想的语素正是词尾形态,而不是数量大得多的词缀语素和词根语素。然而,就这一点而言,世界语也没有表现出100%的黏合性。在我看来,这可以用语音手段的局限来解释:将所有词尾形态原子化肯定会导致每个单词的音节数大增,这样对于使用者的接受度来说太过复杂。 此外,世界语只有5个元音 a / i / e / o / u,这些元音也已经严重超载。世界语过去、现在和将来都是为人实际使用而设计的足够“自然的”人类语言(尽管其起点是人造),而不是机器语言。 (请参阅第4节。) 1.1.5 这 112 个单词形式都会用到吗? 1.1.5.1 在词法上,是的,所有这些形式都可能用到。实际中有一个限制:词干与这112种词尾的黏合,必须在逻辑上是可理解的,即语义上可以兼容。譬如,在我看来,那些表示具体物体的词根(例如“tabl-”)是应该没有分词形式的: ? tabl-ant-i / tabl-ot-a / tabl-ant-a / tabl-int-o 这种限制是使用者自然遵守的,毕竟人不大可能表达自己也无法理解的信息。 1.1.5.2 尽管从实用角度来看,这112种形式的使用频度彼此之间有很大差异,但是不能说哪种形式不可使用。这112种形式的有效性和可理解性是同样的。哪些形式更受青睐,更多出现是由多种因素决定的,包括:说话者的语言习惯和母语背景、风格、教育程度、语言能力、听众是谁以及希望产生何种效果,等等。 尽管如此,世界语的简约原则要求尽可能多地使用简单形式而不是复杂形式。例如: Mi NUN stud-AS (au: Mi ESTAS stud-ANTA) 代替 Mi stud-ANT-AS. Ili JAM ir_IS (au: Ili ESTAS ir-INTAJ) 代替 Ili ir-INT-AS. veredir-E 代替 veredir-ANT-E 因此,人们宁愿使用 “la parol-O far_E de Zamenhof(柴门霍夫做的演说)”,而不是“ la parol-ADO far-ITA de Zamenhof”,或将短语 FARE DE 简化为新的介词 FAR(la parolo FAR Zamenhof)。 因为人类思想本身就存在必要的模糊性,此外,上下文和功能词(包括唯一有形态变化的助动词 EST-)通常也对解析有所助益(如上面示例所示,另请参阅 3.2.1),所以,世界语的节约原则并不难遵守。 1.1.5.3 【小结】仅仅17个基本形态最终形成112个有效的词尾形式!每个词都可以有112种变化,这真可算是黏合造词的奇迹。更重要的是,无论是表达还是理解,如此众多的词形却不会给人带来负担。这不是世界语黏合规律的最好证明吗?实际上,黏合的本质不外乎是选择性排列(由造词结果角度观之)和拟递归(由过程角度观之,请参阅【附录2】)。更抽象地讲,是一定的数学特性引入世界语了。世界语词汇是规则性和灵活性高度统一的典型案例,在世界语中这是同一现象的相互依存的两面。 1.2 词缀的黏合 词缀主要用于表达单词的细微差别。其黏合通常遵守自然逻辑或语义的兼容性,都是全人类共同的准则。因此,没有(也没有必要)特别规定词缀黏合的规则,使用者自然会让黏合易于理解。有一个世界语结构关系的就近原则在这里起作用,该原则要求两个相互关联的元素尽可能地接近,以便于清晰理解。比较 PLIMALBONIGI 与 MALPLIBONIGI 之间的细微差别: bon-a -- mal-bona -- malbon-ig-i -- pli-malbonigi bon-a -- bon-ig-i -- pli-bonigi -- mal-plibonigi (aŭ:bon-a -- malpli-bon-a -- malplibon-ig-i) 1.2.1 词缀的抽象度有所不同。 最抽象也是最常用的词缀有 -et- (“小”,程度轻微)、-eg-(“大”,程度严重)、mal-(反义词)、ne-(否定词),可以用于任何词根/词干和任何词类(原则上,每个词根具有一个逻辑词类,就像每个单词都有一个语法词类一样),而其他词缀,如 -ul-(“者”)、-ing-(“值得”)、 el- (“出”)、 kun-(“一起”)则非常具体。 1.2.2 与多后缀黏着相比,前缀黏合或多或少受限,并且语音上不允许在前缀之间或前缀与词根之间连音(例如,MALAPERI 和 MALANTAUPORDO: mal-a-pe-ri / ** ma-la-pe-ri; mal-an-tau-por-do / ** ma-lan-tau-por-do 1.2.3 后缀的黏合非常灵活自由: rid-i -- rid-et-i -- ridet-em-a -- ridetem-et-a-- ridetemet-ul-o --ridetemetul-in-o --ridetemetulin-et-o --ridetemetulinet-aĉ-o --ridetemetulinetaĉ-et-o ... = la ete aĉa eta knabino, kiu ete emas rideti 上面这个由一个词根一个词尾中间黏着了8个后缀的派生词词义组合透明、易于理解,意思是:有点儿爱微笑的有点恶作剧的小女孩。后缀有:-et-(程度轻微)、-em-(倾向于)、-ul-(“者”)、-in-(女性)、aĉ(恶作剧)。 有意思的是,语缀(如 -et-)可以在一个单词中多次出现,这与形态语素完全不同。从理论上讲,后缀的数量在黏合过程中是不受限制的。当然,一个单词太多音节,发音器官可能有困难,人们通常不会使用过于繁复的多后缀黏合的词法综合形式。一般取而代之的是,使用句法词组的分析形式来表达复杂的概念组合。 另外,世界语中有两个特别的后缀 -ĉj-/-nj-,它们会更改与之黏合的前面的发音:patro(父亲) / patrino(母亲) -- pa-ĉj-o(爸爸)/ pa-nj-o(妈咪)。 1.3 词根的黏合 词根黏合用来表达复杂概念,其黏合规则非常简单也很自然:中心词始终居后。词根复合的黏合,与中文(以及德语)合成词的构成,具有类似的自由性。示例: (1) akvo-fonto: 水/源 (2) varm-energio: 热/能 (3) arbo-branĉo: 树/枝 (4) surd-mut-ulo: 聋/哑/人 (5) blank-hara: 白/发 (6) nur-pieda: 光/脚 (7) bon-kora: 好/心 (8) fonto-lingvo: 源/语 (9) celo-lingvo: 目标/语 (10) naci-lingvo: 民族/语 (11) internaci-lingvo: 国际/语 【补记】 还有些语言学特点文中没讲透,譬如实词的三大类别,可以在这里做个补述。词缀的创造中,词类本体化也很有意思:对应于动词概念的 -ad- (类似于英语的 -tion/-ing),对应于具体名词概念的 -ajh-(类似于中文的“东西”或类后缀“-品”),对应于形容词概念的 -ec- (类似于英语的 “-ness”)。这样一来,实际上世界语等于有了两套实词的大类:本体概念上的名词(-ajh-)、动词(-ad-)、形容词(-ec-),和句法上的名词(-o)、动词(-i/-u/-as/-is/-os/-us)、形容词(-a)。 其实三大类别不止于此。所有的实词词根,从概念上都隐含着三大类别之一:表示事物的名词性概念(譬如 hom-,kat-,tabl-),表示行为的动词性概念(如 traduk-,ir-,ven-),表示性状的形容词概念(bel-,ver-)。这样一来,世界语的实词有三套平行的大类,一个内核,一层内衣(可省),一层外衣。这三层大类交错黏合成词,使得世界语词汇的表达空间游刃有余。 为什么 tradukado 可以省略为 traduko?因为 traduk- 本来就是动词,-o 已经起到了名物化的效果了,就不必劳动 -ad- 这个后缀了。但这也不妨碍可以用它,来更加强调动作的过程性。同理,为什么可以用 belo 代替 beleco?因为 bel- 本来内核就是形容词,用 -o 的名物化自然表达了“性状”,就不必劳动后缀 -ec- 了。但这也不妨碍用它来加强对于“性状”的强调。可见,表达手段的丰富增加了词汇细微差别(nuance)的微妙,使得国际语比自然语言更加具有柔性和张力。 语言比较很有意思,特别是从语言学角度。譬如中文。前面说过,中文是“裸奔”的语言,语言学中叫“孤立语”。怎么讲?三层大类在中文,只剩下内核,既没有外衣(形态),也基本没有后缀(内衣)。一个概念既不穿内衣,也不穿外衣,就这样赤身裸体出来,与其他词组语成句。需要变类怎么办?靠上下文。古代汉语表现最突出,叫“词类活用”。所谓活用,就是不穿衣服,但是等于是穿了衣服。 “老吾老以及人之老。” “老” 内核是形容词,到了所有格代词“吾”和助词“之”后成了名词,表示 “老人”。名词短语(“吾老”)前的“老”,则成了及物动词。所有这一切的词类转变,全部没有“穿衣服”明示。古汉语具有世界语类似的词类转变的灵活性,但因为不穿衣服,比世界语难太多了。现代汉语降低了灵活性,使用大得多的词汇量来弥补灵活性的不足,自然也比世界语难得多。 关于世界语到底是不是简单易学,不同的人往往感受和看法不一,也说点自己的切身体会。 我觉得一切都在比较之中。毛委员说过:没有比较,就没有鉴别。记得老电影《南征北战》里面,国军长官说过:“不是我军无能,而是共军太狡猾了”。可以说,不是世界语容易,而是其他外语太难了。 对于国人,如果学会一门欧洲语言,再学世界语,的确更容易体会其简单容易。如果除了母语,只学世界语,那就很难有这种体会。如果是欧洲人,世界语做第二外语,那的确不难,毕竟世界语根本上是欧洲语言的简化规范版。但对于非印欧语系为母语的人,不会觉得容易。 我英语专业的,二外是法语,三外是俄语,到接触世界语的时候,这应该算是四外了。当时有晕眩的感觉,天哪,还有这么容易的语言,学了四五天就可以写信,学了一两个月,就可以写论文,心里一点都不怵。记得第一封世界语信是写给(河南还是枣庄?)一位世界语朋友(当地的一个世界语活跃分子),收到他的回信,以及附在信里面的绿星等纪念品,开心死了。几十年下来,二外法语现在带着词典还能勉强读一点,但绝对写不出合法的句子了。三外俄语完全还给老师了。只有世界语多年没用,感觉还可以随时捡回来。这样看来,世界语的确是其他外语没法比的。没跟英语比较,是因为一直在英语世界里。真要比较,我觉得我的世界语水平大体可以与我的英文水平,打个平手。口语不如英语,那玩意儿需要有环境和机会实际操练。但书面语可能还强过写英文。我从小学开始学英文字母,中学一直跟着广播英语,到后来本科英文受专业培训,再到后半辈子一直在这个语言世界里面,那是多少时间和精力的投入啊。相比之下,世界语连学英语的零头功夫都没有。 【相关】 Lingvistikaj Trajtoj De La Internacia Lingvo Esperanto(1/3) 《 立委:一小时学会世界语语法 》 《朝华午拾:我的世界语国》 《朝华午拾 – 世界语之恋》 《朝华午拾:朋友遍天下》 《朝华午拾 – 欧洲之行》 《朝华午拾:与白衣天使擦肩而过》 硕士论文:世界语到汉语和英语的自动翻译试验 立委硕士论文全文(世界语版) 《朝华午拾:shijie-师弟轶事(3)——疯狂世界语》 灵感有如神授,巧夺岂止天工 立委世界语文章(1987):《中国报道:通天塔必将建成》 立委世界语论文(1986):《国际语到汉语和英语的自动翻译》 立委(1988)《世界科技:世界语到汉语和英语的自动翻译试验》 DLT项目背景介绍 《李白詹120:乔老爷老矣》 【关于机器翻译】 【语义计算:李白对话录系列】 【置顶:立委NLP博文一览】 《朝华午拾》总目录
个人分类: 立委科普|4006 次阅读|0 个评论
言和语的关系——在语言和言语的区分基础上进一步
geneculture 2019-7-3 15:44
言和语的关系——在语言和言语的区分基础上进一步 【摘要】: 本文 旨在 从哲学反思和科学预言 两个角度 来探讨 言和语的关系 。其科学 意义 是 在语言和言语的区分基础上前进一步 ; 其哲学意义是 在理性演绎和经验归纳的结合基础上前进一步 。本文的研究途径或 方法 附后。其 结果 是 : 第一 , 发现了 汉语的言和语所具有的可间接形式化的特点 不仅 符合自然数的数字化特征 , 而且 , 还可 分别从普通语言学和形式语言学这两个角度来改进并优化英语研究中遭遇的两大类基本问题 , 即 : 分与合 , 以及 划界 的问题和 分类 的问题 , 这是现代汉语所面临的基本问题。第二 , 发现了汉语在言和语的区分上具有的独特优点 不仅 有利于汉语自身的间接形式化 , 而且 , 还 有利于它用来帮助英语等其它语言区分其所承载的思想内容与语言形式本身及其物化语音和文化字符 。其 结论 是 : 不仅 明确了语言科学的研究对象 , 而且 , 明确了语言哲学的根本问题 。得出上述研究结果和研究结论的研究途径或 方法 可分为 : 基于理性演绎的间接形式化的科学方法 , 基于经验归纳的间接计算和统计的科学方法 , 对语言科学研究的 新的哲学反思所依据的崭新观点和方法体系即方法论 。本研究的 背景 : 语言学背景不仅涉及 索绪尔的语言学研究对象和语言学学科性质的基本判断 , 即 : 索绪尔对语言与言语的基本区分 , 索绪尔认为 语言是一个价值系统 的论断 , 而且还涉及乔姆斯基 对语言以及语法所做的形式化处理 及其方法论即方法体系 ; 语言哲学背景不仅涉及 弗雷格问题——包括弗雷格关于意义和指称的问题 及其背后所隐含的逻辑悖论问题 , 进一步涉及晚期和早期的 维特根斯坦遭遇的问题 , 以及其后塞尔、克里克普、奎因和戴维森等人也都没有解决的问题。由于这里涉及普通语言学、形式语言学和语言哲学及其交叉研究领域的问题 , 因此 本研究属于 语言哲学与语言学的跨学科研究 。 【作者单位】: 中国地质大学(北京)思想政治教育学院高等教育研究所 【基金】: 伯克利大学哲学系塞尔和中国地质大学(北京)刘志方共同支持的中美双语信息处理课题组 即:中美合作项目——美中赛尔研究中心(双语研究项目筹备处) 【分类号】: H0-05 全文阅读: 新语言观 邹晓辉 邹顺鹏 言和语的关系及其应用.pdf
个人分类: 语言学基础研究|1848 次阅读|0 个评论
[转载]王顺君:腓特烈二世——博学多才,关心灵魂,赞成解剖
fqng1008 2019-6-10 21:26
腓特烈二世(1194年-1250年)是神圣罗马帝国皇帝、德意志国王(罗马人的国王)、西西里国王、耶路撒冷国王、勃艮第国王和意大利国王。他能在统治者中脱颖而出,被称为“Stupor Mundi”(世界惊奇),是因为他特立独行,而且异常博学、思想前卫。在他之前,教皇英诺森三世也曾被人称为“Stupor Mundi”。事实上,这是一个略带贬义的称号,有点“这可是一神人”这种意思。但放在腓特烈二世身上,却散发出一种独特的魅力。 腓特烈二世的肖像 来自他自己亲自撰写的《训鹰的艺术》(De arte venandi cum avibus)一书,书稿现藏于梵蒂冈档案馆 他成长的西西里处于东西方文明的交汇点,深受诺曼文化、拜占庭和穆斯林文化影响,因其多元化的背景,腓特烈二世可以流利地讲9种语言,书写其中的7种。他拥有各种文字的大量书籍,有历史学者分析过他的藏书,其中有很多的神学书籍、供做弥撒时使用的绘制精美的圣咏集、还有当时广受欢迎的骑士传奇,例如《亚历山大大帝远征记》(Roman d'Alexandre)和亨利·冯·维尔德克(Heinrich von Veldeke)所写的《埃涅阿斯》(Roman d'Enéas)等宣扬骑士冒险远征和动人爱情故事的史诗故事。此外,还有很多涉及自然科学、数学和医药的书。皇帝还邀请很多伊斯兰和犹太教的科学家及哲学家来到宫廷,将希腊及伊斯兰的科学古籍翻译成拉丁文。他在巴勒斯坦时,其渊博的知识给阿拉伯人留下深刻印象:“一个非常有学问的人,一位认真的几何算术学和其他推理科学的专家。” 他还非常喜欢数学。在叙利亚的时候,他说服了和他亲密交往的埃及苏丹,将非常著名的数学家哈尼菲(al-Hanifi)送给他。皇帝十分高兴,对哈尼菲厚待有加。数学家是皇帝宫廷中的明珠,其中最著名的就是比萨的列奥那多——斐波那契。 中世纪最伟大的数学家斐波那契的胸像,他将现代书写数和乘数的位值表示法系统引入欧洲 看过悬疑小说《达芬奇密码》的朋友应该还记得老馆长死前留下了一串数字:“13-3-2-21-1-1-8-5”,这个就是著名的“斐波那契数列”。这个数列是由兔子的繁殖问题推算出的,代表着自然界奇妙和谐的数字规律。这位当时最伟大的数学家出了一本书介绍全新的数学知识,所谓的“阿拉伯数字”也就是由斐波那契、即比萨的雷奥纳多开始提倡的。皇帝也是这本书的忠实读者,并支持数学家推广。传说有一次,皇宫里举行数学竞赛,邀请了很多数学家,其中就有斐波那契。皇帝开始出题:“求一个数 ,平方根和立方根都是有理数。”结果就斐波纳契解了出来,皇帝非常高兴,重赏了这位智者。后来皇帝提的问题就更难了:“是否存在这样一个平方数,如果加上或减去5,每次都能使它成为另外某数的平方?”这个问题难倒了中世纪最伟大的数学家,而且至今人们都不能用最基本的方法解决。皇帝和比萨的列奥那多是通过书信交流的,除了数学之外,也请教天文学和哲学。九五之尊的腓特烈在斐波纳契面前非常谦逊,称其为“皇帝宫廷里最杰出的哲学家”。 皇帝一直很关心人的灵魂,他在给宫廷哲学家、数学家、天文学家,以及巫师和术士——60岁的苏格兰人米歇尔·司各特(Michael Scot)的信中这样写道:“一个活生生的人的灵魂,当它进入另一个世界之时,既不能通过第一次爱,又不能通过恨使其回来?这到底是怎么回事呢?”米歇尔·司各特曾在牛津、巴黎和莱托多大学读过书。除了玄学上有所造诣外,他还是很有名望的翻译家,将伊斯兰学者阿维森纳(Avicenna)和亚维侯(Averroes)关于天文学、医学等方面的书籍从阿拉伯文翻译成拉丁文。1217年,他便翻译了第一本系统介绍亚里士多德天文学系统的《天文学之书》(Liber astronomy)。在一封早期的信中,好奇的皇帝还打听宇宙的结构:一共有几重天?这一重与那一重天相距多远?这一重天比那重天大多少?最后那重天的后边又隐藏着什么? 米歇尔·司各特所著的《天文大导论》(Introductorium maius in astronomiam)的15世纪抄本 在民间传说中,皇帝和米歇尔·司各特的结缘过程很传奇。迷信的腓特烈想聘请一位皇家占星师,应聘者如云。皇帝亲自出考题:明天,皇帝会从哪个城门出城?然后,让各位大师把答案写在答题纸上。腓特烈精灵古怪,让人连夜在城墙上开了个洞,第二天大摇大摆地穿过从新开的洞出城,皇帝以为没有人能算出来。但米歇尔·司各特的答题纸上赫然写着:皇帝会从一条新路出城。这让皇帝又惊叹又敬佩,从此这位苏格兰人成为皇帝的心腹术士。 根据意大利人弗朗切斯科·皮皮诺(Francesco Pipino 1270-1328年)的记载,说司各特的法术极准,甚至算到自己会死于头部的重击,所以他整日戴着钢盔度日。但人算不如天算,约1230年的一天,他陪同皇帝上教堂做弥撒,出于对皇帝的尊敬和礼节,他把钢盔摘了下来,就在这时,空中突然掉下一块小石子砸中了他。但他没有当场毙命,还对这块石头进行了观察,交待了很多事后才去世。这当然是一个传说,在教廷的文献中,米歇尔最后出现在1232年4月28日,现在的历史学家推测他在1235年左右去世。但丁的《神曲》把这位玄学大师放置在地狱第八层第四囊的一群占卜者中:“那另一个两肋那样瘦的人,是米歇尔·司各特,他确实会施邪术妖法。” 不管怎样,腓特烈二世非常相信玄奇事件,他相信并敬畏命运的。 皇帝感兴趣的事很多,为了知道饭后运动还是休息有助于消化,他让人带来两个死囚,让他们大吃大喝一顿后,让一个人外出骑马打猎,另一个躺着睡觉。第二天早晨,皇帝令人切开这两人的胃和肠子查看消化状况。实验的结果是:饭后休息消化得更好。 南意大利的萨莱诺医学院坚持解剖和研究尸体,其专业之高超享誉当时的世界 皇帝还赞成解剖尸体。他是萨莱诺医学院解剖系的创始人,规定5年要解剖一次尸体。甚至有人说,有一次萨莱诺解剖死去的孕妇时,皇帝也在一旁非常认真地观看。解剖尸体在当时是惊世骇俗之举,即使之后的300多年,在信仰笼罩的欧洲,解剖尸体还是非法的,医科生只能从非法的渠道弄到尸体,偷偷摸摸学习解剖。他对人体的秘密有着一种“奇特的激情”,仿佛想一窥造物主的奥秘。 (本文节选自王顺君著《救世主还是恶魔:神圣罗马帝国皇帝腓特烈二世传》,台海出版社,2017年1月。澎湃新闻经作者授权发布。)
个人分类: 读书笔记|330 次阅读|0 个评论
语言科学的研究对象:牵一发而动全身
geneculture 2019-5-27 08:39
我的博士论文主要就是解决语言科学的研究对象这一个根本问题。
个人分类: 学术研究|1272 次阅读|1 个评论
中国传统语言学面临一个重要而巨大的挑战
geneculture 2019-1-21 11:20
中国传统语言学研究成果如何与ahci和ssci以及sci乃至ei之间衔接从而规范表达其研究成果? 这是一个巨大的挑战。解决这个问题的重要性不言而喻。因为它牵一发动全身。
个人分类: 信息学基础研究|2075 次阅读|1 个评论
语言与信息:人机双脑智慧能力融通融合的基础
geneculture 2019-1-16 06:28
温故知新 邹晓辉 2019-01-16晨 (一) 人类的语言特征 机器的信息特点 如何理解是关键 融智学聚焦于此 (二) 用最简单的符号 传递基本的规律 用一组模型表达 其结构程序标准 (三) 拥有其背景知识 自然就容易理解 仅仅从符号信息 未必能真正明白 注:六天前的一次学术活动纪要(自己的那一部分内容要点记录暨录像的截图)。如果把投影改作平板电脑的大屏幕,那么就不会再有光影效果了(我还是喜欢毛玻璃书写的效果)。
个人分类: 学术研究|1341 次阅读|0 个评论
(多)学科知识中心采用点面结合方式逐步形成
geneculture 2019-1-8 23:57
务必有一个共赢的凝聚点,方能把各自的需求(职业发展愿望)和供给(智力优势即潜在能力)用机会(特定的智慧融通融合)给结合起来! 这就是我们的(多)学科知识中心在做的一件事情。 未来十年内邹晓辉主持的学科知识中心示范项目每年都会增加具体的学科及协作单位。 用邹晓辉的融智学理论与文化基因系统工程实践方法及工具做(多)学科知识中心的建设示范。 只要确定一个具体的学科、领域及其产业作为彼此的合作切入点,就能做相应的联合示范课题或项目。 课程(理论)与产业(实践)就是可落地的结合点。 这样就是很务实的可落地的产学研一体化发展模式。 例如大学的课程(含实习配套的产业群链)就是基于融智学理论与文化基因系统工程实践(方法和工具)改进并优化的。 这个专题系列采取每次围绕一个具体课题或项目展开一场有针对性的学术交流的方式来操作(平时线上交流,需要时线下交流)。
个人分类: 高等教育学|1413 次阅读|0 个评论
多学科思想国际期刊2010-5- at Harvard
geneculture 2018-10-26 19:33
International Journal of Multidisciplinary Thought by Xiaohui Zou
个人分类: 融智学前期探索|2 次阅读|0 个评论
[转载]马克思主义语言研究专辑 2018年 Language Sciences
hwzhan 2018-10-18 17:38
Language Sciences Volume 70, Pages 1-204, November 2018 https://www.sciencedirect.com/journal/language-sciences/vol/70/suppl/C?dgcid=raven_sd_via_email
928 次阅读|0 个评论
对广义和狭义的文本对象做六类分析(视频回放)
geneculture 2018-8-24 07:26
六大分析:对广义和狭义的文本对象做定性分析和定量分析以及结构分析、程序分析、定向分析与定位分析。-邹晓辉 中文棋盘的发现和发明及其应用ppt讲解 http://www.webmeeting.com.cn:8800/pub_recording_view.php?id=60 公佈日期: 三月 01, 2018 錄影日期: 三月 01 (05:47 下午), 2018, 1 小時 10 分 7 秒 主持人: 邹晓辉 提示: 第一次拜访邹晓辉云教室需要事先准备即进入 http://www.webmeeting.com.cn:8800/portal.php 下载JionNet安装页面选择单机版jnj(可直接打开调用)或手机版App(苹果机仅占3m内存,必须提前安装,在Safari状态进入即可) http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=1101814
个人分类: 语言学基础研究|1931 次阅读|0 个评论
再次公开2010年在贵大举行的中西方语言哲学上的发言
geneculture 2018-4-21 23:59
在“2010西方语言哲学夏日书院”的大会发言 屏蔽 已有 648 次阅读 2010-8-10 04:09 | 个人分类: 2010年7-8月 | 系统分类: 论文交流 推荐到群组 结论:本真信息与序位逻辑的同义并列,导致(“物、意、文”之后)第四范畴(理或义或法或道)的凸显。 邹晓辉在做大会报告之前或会议期间分别同Maria、钱冠连、王寅、林允清、李鸿儒、王爱华、梁瑞清、王建芳和包通发等专家教授做过较为深入的面对面的交流,并得到了各个角度的认同以及进一步推广该原创思想在具体表达或交流方式上的各种意见。 各位专家关注的焦点是不同的,例如 : Maria教授 关注的是“三棱模型比三角模型的丰富性”、 钱冠连教授 关注的是“三棱模型提出的哲学问题及其中西融合哲学问题的重要性”、 王寅教授 关注的是“三棱模型提出的核心问题——真正的形而上问题(即:形上本质)”、 林允清教授 关注的是“具体的学术渊源或研究途径”、 李鸿儒教授 关注的是“创新及其对很不容易的创新如何鼓励并让其阐述透彻的问题”、 王爱华博士 关注的是“三棱模型的核心——第四范畴如何实现无歧义地论证过程”、 梁瑞清博士 关注的是“三棱模型的各个知识要点与西方语言哲学大家的具体思想的对接或渊源关系——表现为具体的参考文献”、 王建芳教授 关注的是“三棱模型怎样给大家深入浅出地讲透彻”和 包通发教授 关注的是“三棱模型如何把中国传统的哲学思想融合进去的——例如模型及其背景知识中涉及老子的道与德以及孔子的仁与礼而不仅仅是那些与西方哲学对接的部分”。 对本人及其学生或助手这都是一个很好的鼓舞、帮助和启示。尤其是钱老提示“不要急、不要多(少而精)以及要舍得(赞成笔者引用鲁迅所说的要忍痛割爱的做法)”以及王老明示“1 弗雷格、罗素、维特根斯坦,2 后现代哲学各派,3 三棱模型的螺旋上升”这样的具体论述途径或轨道,对笔者及其助手进一步提炼三棱模型的具体表达方式很有帮助和启示;Maria的思维方式和表述习惯对笔者及其助手进一步提炼三棱模型的英文表达方式很有帮助和启示。 转载本文请联系原作者获取授权,同时请注明本文来自邹晓辉科学网博客。 链接地址: http://blog.sciencenet.cn/blog-94143-351532.html 下一篇: 什么是语言科学的研究对象——“言本位”从根上解决问题 收藏 分享 修改 | 删除 | 当前推荐数: 0 推荐到博客首页 发表评论 评论 ( 3 个评论) 删除 回复 邹晓辉 2011-4-2 22:48 谢谢! 你是从以下网页复制粘贴过来的: http://bbs.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=418598 删除 回复 邹晓辉 2010-10-1 17:18 融智三棱提出的信息科学基础问题以及它的信息科学基础意义在信息科学基础国际会议其间得到专家们认可 http://www.sciencenet.cn/m/user_content.aspx?id=351755 博主回复: 信息科学基础国际会议是自然科学、社会科学、人文科学和哲学等领域具有信息科学以及信息技术特长的中外专家们聚集的地方。 删除 回复 邹晓辉 2010-10-1 17:15 融智三棱提出的哲学问题以及它的哲学意义在夏哲院得到专家们认可 http://www.sciencenet.cn/m/user_content.aspx?id=359234 博主回复: 夏哲院是外语学界的(中西)语言学、语义学、语用学、翻译学、认知语言学、解释语言学和计算语言学等领域具有(中西)语言哲学修养的专家们聚会的地方。
个人分类: 学术研究|2230 次阅读|0 个评论
马可·波罗带回意大利的不止有披萨?——禅的行囊(之八十九)
罗非 2018-2-11 10:56
导读:佛教用语中, “ 阿罗汉 ” 的前缀 “ 阿 ” 的含义是 “ 无 ” ,后面的罗汉则是 “ 烦恼 ” 、 “ 欲望 ” 或 “ 出生 ” 等 “ 轮回 ” 等主因。所以, “ 阿罗汉 ” 就代表了 “ 断烦恼 ” 、 “ 离欲 ” 和 “ 无生 ” ,也就是断除了轮回之因的圣人成果。但在汉语中,何以有时又变成了 “ 罗汉 ” 了呢?这岂不是把烦恼、欲望、出生等轮回之因找回来了? 原来,佛教在传入中国时,有一部分是经过中亚诸国辗转流传过来的。在中亚国家中,当时的字母 a 是不发音的。所以,梵文 “ 阿罗汉 ” 在那里尽管写法不变,但读音就变成了 “ 罗汉 ” 。按照这些语言翻译成中文的资料,就把这个词音译为 “ 罗汉 ” 了。类似的情况还有 “ 阿弥陀 ” 与 “ 弥陀 ” 。这是文化流传过程中由于语言学途径不同而产生的一些变异。 但是,对于烦恼重重、欲望沉重的人类来说,要想把这些根深蒂固的东西统统弄没了,可不是一件容易的事。如果根据这个定义,阿罗汉这个 “ 圣果 ” 就有极高的难度。于是圣人也就变得可望而不可即了。但证之以历史,在乔达摩在世时,许多学生在听讲的当时就证得了阿罗汉,许多学生学会一个方法之后,实践七天就证得了阿罗汉,似乎又不是那么困难。这又是怎么回事呢? 有一种解释,是中国文化自明朝之后,由于采取朱熹的注释为主,各个学派的观点都倾向于封闭保守,歧视女性,倡导禁欲。而普通人眼见这个标准和自己相去甚远,于是高推圣境,把圣人想象得难之又难。其实,在唐宋时期的中国,就和近代的藏传佛教一样,圣人贤人都俯拾皆是。其根本原因,就是曲解了 “ 阿罗汉 ” 一词的涵义。 如果仔细研究中国上古的儒释道三家的经典,就可以看出中国文化提出的 “ 寡欲 ” 、 “ 离欲 ” 并不能等同于 “ 禁欲 ” 、 “ 绝欲 ” 。后者代表完全没有欲望的冷漠状态,而前者则代表不以欲望为自我的智慧状态。两者的境界可以说是天壤之别。证之于婚姻观,现代美国人对 “ 爱 ” 的重视,就是受到正统东方文化影响的结果;而现代中国人对现实利益的重视,就是明朝以后曲解中国文化的流毒。可见真的如禅宗祖师所说, “ 一字之差,五百世野狐身 ” 。 *************** 今天是清明节,是中国传统节日中为数不多的阳历节日之一,时在春分日之后的第十五天。【此处大胡子到了解不完整。中国文化中的二十四节气都是阳历的节日。三九和三伏也都是阳历。中国从来都是阴阳合历的,同时参考太阳和月亮的运行轨道制定历法和节日】上香的善男信女们挤满了华林寺的大小殿堂,争先恐后地焚烧香烛纸钱,整个寺院都笼罩在蓝色的烟雾之中。为了躲避浓烟,我们走进了寺院最后面的五百罗汉堂,这是华林寺里硕果仅存的前朝遗物,它建于 1841 年,也就是鸦片战争结束的那年。与大多数中国寺院的佛堂不同的是,五百罗汉堂的平面是一个由许多条纵横交错的回廊构成的巨大 “ 田 ” 字形,五百尊真人大小的罗汉铜像便供奉在这些回廊里。 “ 罗汉 ” 或者 “ 阿罗汉 ” ,是梵语 “arhat” 的音译,原意为 “ 离欲 ” ,在佛教中被用来称呼那些了断一切嗜欲,解脱了红尘生死的修行者。修成罗汉果位并不是一件容易的事,但华林寺的罗汉似乎比别处标准更宽松些 —— 我在其中发现了一位新当选成员,马可 · 波罗。当然,这只是我的猜测,马可 · 波罗弄不好真的修成了罗汉果位也未可知。【在东西方文化交流繁荣时期,许多西方人都对东方文化有很深的心得。丝绸之路畅通无阻的蒙古帝国时期很可能就是如此。现代一些西方大心理学家也是如此。直至当代,仍有许多西方人达成了中国标准的圣贤境界。这是近代以来西方文化不断演进的源动力】至少他也是 “ 西来 ” 的。 出了佛教名人堂,我们穿过院子里的重重迷雾,又一头扎进新建成的初祖达摩堂。佛堂之中供奉着一尊高达七米的达摩趺坐像。如此巨大的铜像,造价想必极昂,而且工艺其实颇有水准。但是在看过了其他真人大小的祖师和罗汉之后,这尊过于雄伟的造像,以及那些前仆后继的信徒,反倒让人觉得有违禅理。【禅还有理吗?此处该打一棒】达摩不是自己也说过么: “ 自心是佛,不应将佛礼佛。 ” (引自《菩提达摩论》) 在一旁照看佛堂的僧人告诉我,等到周围民居的动迁完成,华林寺还将建起一座规模更加宏伟的大殿,用于供奉华林寺的镇寺之宝佛祖舍利。说来也巧,这批佛舍利的由来也和动迁有关。 1965 年,政府决定搬迁华林寺原址上的一座白塔,无意中在塔基下发现一具石函,舍利便藏在函中。据说,这具石函是 1655 年由顺治皇帝秘密送来华林寺的,但是,与舍利一同出土的文字资料里既没有解释顺治帝从何处得来这批舍利,也未说明他为何要将其放在华林寺。唯一可知的是,石函中的木匣上写了 “ 佛舍利 ” 三个红字。这批舍利原有二十二颗,但出土之后历经辗转,其中一颗已经神秘地消失了。我猜想,当时满洲人刚刚入关不久,将至宝舍利送来帝国南疆,也许有抚远定边、驱邪镇妖的用意。不过,我们很难说顺治皇帝的选择是明智的:佛陀本人就是一位西来的 “ 外国人 ” ,用它的遗骨镇守边疆恐怕很难灵验。【算起来,南疆虽然把香港租给了英国,不过后来又收回来了,和其它几个方向的边境线比较起来,算是国土基本无损。而且还收获了许多政治、经济和文化的利益。一笑】离开之前,我和丹妮艾拉也点燃了几炷香,为寺院上空的滚滚浓烟添砖加瓦。【哈哈!不能笑话别人】 达摩祖师离开广州北上之后又过了二百年,惠能来了。公元 676 年的一天,他走进了华林寺北边不远处的法性寺。那天,正逢方丈印宗法师开示《涅槃经》,可能是在讲课的间歇时分,忽有阵风吹过,堂前旗幡招展,两名僧人因而争论起来:一个说是风在动,另一个说是幡在动。惠能听见了他们的争论,插话说: “ 不是风动,不是幡动,仁者心动。 ” (见宗宝本《坛经 · 自序品第一》)
个人分类: 科普|2092 次阅读|0 个评论
语言学研究之浅见
热度 2 saif 2017-9-29 22:01
这些年来,稍稍远离了主流的语言学理论,也没有对具体的语言现象加以注意,大部分精力都放到了语言学之外的学习,主要是逻辑学的学习,从一阶逻辑、模型论、证明论、类型论到和计算有关的可计算函数理论、包括lambda演算和组合子逻辑。除此之外就是数学的学习,包括集合论、抽象代数和范畴论的学习。 当然,学习的主要动机仍然和语言学有关,在经历了生成语法(GB、HPSG、LFG、TAG)、范畴语法(的各种变种)、蒙太古形式语义学(及其后续理论)之后,我希望能够找到其中最本质的东西——在这些语言理论和形式框架背后的基本思想和方法论。这个探索过程经过了语法框架——语法框架的形式基础——一阶逻辑——类型论——lambda演算——组合逻辑,过程充满了乐趣和艰辛。而探索的动机来源于对现存所有语言学理论的怀疑——这个怀疑可以由许许多多的问题构成,但最后仍然归结为我们坐在教室第一天听《语言学概论》时的第一个问题:什么是语言学? 这个迷惘和困扰一直在缠绕着我,直到“遇到”一位从未谋面的伟大作者Max Cresswell,一位“差点”和Montague齐名的新西兰的逻辑学家。他在《Logics and Languages》这样写道: “至少存在着两种研究语言的方法:一种方法是把语言看做是现实中的人类现象,深入其中、研究发现的现象;第二种方法是研究各种形式语言,对这种语言我们可以先规定一些严格可控的的定义,再把这些定义引入这些形式语言;然后在这些形式语言中一点点加入自然语言的成分。” 毫不讳言,作者的这个思想我本人也具备,我在《闲聊语义学》中曾经提到Montague研究自然语言语义学也是从谓词逻辑开始一点点加入更多的东西。而且,从一个基本的、微小的原型(prototype)出发,逐步构建系统也是任何科学研究和程序设计、软件工程的一个基本方法。但是作者的这段话仍然深深地打动了我,对着这段文字我凝神良久,突然在一霎那有一种“顿悟”的感觉,它把我多年想表达但是表达不清或者不到位的思想,一步到位地说清楚了。 我一直在找寻一种方法想把“形式语法理论”的基本思想、以及这种理论和其它语言学理论的区别说清楚,一次次尝试终无法如愿。这个区别,在Cresswell的论述中变得清澈透明,一眼望到底。 这段话,现在看来有几个意义: 第一,对初学者来说,当你跨进语言学大门的时候,应当意识到你将来的学习、研究的对象是什么?研究的方法是什么? 第二,对于正在学习语言学而且有了一定基础的人来说,回过头来看已经学过的内容,应当问问自己,你真的相信你学的这些理论能够解决语言问题? 第三,对于研习语言学多年,对各种语言学理论大致了解之后,就应当问问自己,我是否真的知道语言学是什么? “语言学是什么”,这个问题在Cresswell的著作中被剖析的清清楚楚:要么你去研究各种纷繁复杂语言现象,汉语的、英语的,然后学习一些时髦的语言理论,再利用“代入法”用这些理论的现成结论说明所研究语言的某些现象;要么投入到各种抽象的形式系统,先找到一个安全的基础,确保自己将来赖以生存的理论基础不会被人“撤梯子”。然后,认真学习各种形式科学的理论,包括逻辑、数学、计算理论以及本体论和知识论,从中找到真正的科学方法,然后试着说明一小部分语言现象,并力图完全说清楚。前者,对于有世间承诺的人来说,例如升学、读研、毕业论文等显然是捷径,有数不清的文献资料、有众多的学长、老师可以帮助你,一句话,可利用资源无穷无尽。而后一种,没有人可以帮你,没有现成的道路,也没有众多的资源可以利用,唯一的指望就是你的读书与思考:读别人的书,想自己的路。 第四,明确对自己的定位:当我说“语言学”的时候,我的真正意思是什么!按照Cresswell的划分,我自己可以说是从第一种过渡到第二种的那种类型,但是这种过渡是潜意识的,懵懵懂懂的,但是一旦明确了,我会毫不犹豫地将自己划分到第二种类型。 那么第一种呢?直接对语言现象进行研究、特别是田野调查、归纳整理方言资料、抢救濒危语言等等,难道不是有意义的语言学研究?用计算机搞计算语言学研究,建立语料库对语言数据进行标注,做语言的数据分析,难道不是有意义的语言学研究?研究汉语,然后可以更有效地在全世界传播汉语和中国文化,难道不是有意义的语言学研究?掌握语言学理论,并将其运用到外语教学中去,使更多的人用更少的时间更高的效率学习外语,难道不是有意义的语言学研究? 是的,就像是人类本身是个多面体一样,语言作为人类的精神、社会、民族、文化、地域等因素的综合结合体,有着多方面的研究角度和相应学科。而且对语言进行研究甚至根本不用什么语言学理论,而把语言现象当做一种半随机现象,以统计概率、模式识别和神经网络的方法也可以进行。 因此,在某种意义上,对语言研究视角的选择其实也是你对语言学是什么这个问题的个性回答。Cresswell在阐述这个问题时强调的是“至少”有两种方法研究语言。 选择“形式语法理论”就意味着,第一、相信自然语言是有规律的,尽管有许许多多的规律之外的”例外“。第二,人类不可能在最近的将来搞清楚语言理解和生成的大脑机制,任何以此为前提进行”假说“的理论都是靠不住的。第三,人类理性思维的最高形式是推理——逻辑推理,对这种推理的研究人类已经进行了两千年了,无论是中国、希腊还是印度,都具有悠久的逻辑研究传统。而作为明确的科学逻辑学——符号逻辑学在近代科学发展史上起到了引领、指南的作用,已成为多个学科共同的理论基础和灵感来源。第四,计算机科学的发展,使人类更深入地了解过去看似常识甚至比常识更微不足道的现象,而且这方面的研究更促进了哲学中本体论和知识论的研究,最大的收获就是,一些看以来非常trivial的现象和问题实际上比表面看上去复杂的问题更困难。而这些非常trivial的问题 有时 甚至成为某个学科产生发展的基本动机。而语言,作为人类天生来就掌握的技能,有许多是母语话者通过直觉就可以判断解决的问题,但是要想进行详细周密的分析,仍然需要像用显微镜那样的工具,和相应的科学方法,这就是形式语法理论的本质。 作为汉语的使用者,我们的语言学研究迟早会转向我们的母语。而汉语,从西方语言学的传统动机来看,缺乏研究的意义(significance),因为汉字转化为拉丁字母后,已经失去了汉语的”精血“,只剩下一些没有任何形态关联、令人感到无趣的开音节符号,没有曲折、没有时态、没有格、没有任何句法标识、不构成任何语言学意义上的兴趣。因此,站在西方语言学的角度,研究汉语动机的相当一部分不是出于语言学本身。 汉语研究的未来应当是同时熟悉西方语言理论和汉语语言的中国的年轻学子。在吃透了西方语言学发展的基本动机、研究方法、哲学思想和使用工具的基础上,应当建立和西方语言学理论相对接的(compatible)的以汉语为基础的普世语言学理论。这个理论,也许在最近的将来不会出现,但只要有人在努力就一定有希望。 对此,提出下列不成熟的想法和关心汉语研究的朋友分享: 1. 真正立足汉语本身的语言理论必须以汉字作为”原码“而绝对不可以转换成拉丁文字或任何拼音文字。 2. 由于”汉语“是一个非常模糊的概念,我们这里对汉语实例的定义只限制在它的书面形式:汉字串的集合,或者,汉字的文本。 3. 作为书面形式的汉语又分为文言文和白话文,但又不是绝对,白话文中掺杂文言也是现代汉语常见的现象,但是各自的组合规则却有着极大的不同。汉语的造句规则和造词规则是平行的。 4. 汉语没有西方语言的那些词尾变化、时态、没有性数格等feature,但是目前汉语的词类的分类仍然是在西方语言学中的八大品词分类的框架中,可以说是貌合神离,甚至是削足适履。 5. 汉语中其基本元素是汉字,而汉字的固定的物理成分只有形和义。在这个意义上进行汉语的研究,本质上就是研究汉字作为基本元素符号组合规律,包括造词规律、造句规律、或者作文规律。 汉语的表达能力完全依赖于汉字千变万化的组合。因此,研究汉语,特别是从形式语法理论的角度研究汉语,其本质就是研究汉字的分布与组合规则。 如果以上这些观点可以成立,那么,从逻辑——类型论——lambda演算——组合子逻辑开始就是一条非常有希望的研究路线。 以上这些特别是关于汉语的想法可以说是我”独自“的想法,也是这些年来的学习后所获得的认知,这个认知如果用一句话概括就是——作为形式语言的自然语言。
个人分类: 语言学|8136 次阅读|2 个评论
语言和语言学
热度 3 saif 2017-9-12 03:47
本人从事语言学研究多年,从早期的结构主义语言学到20世纪后半叶的生成语法理论,再到范畴语法及其各种变种、Montague语义论。随着时间的流逝,我对语言、语言学理论、各种语言学理论框架、流派认知也在发生着改变。这种改变可以归结为一个从逻辑学角度是同义反复的命题:语言学是研究语言的学问。而关于语言的理论、框架、流派等语言之外的东西,仅仅是人类为研究语言开发的工具,而不是语言本身。 语言的概念,自17世纪末莱布尼兹提出characteristica universalis(直译:通用表意文字——普遍语言)后开始扩大,除了天然存在的自然语言,开始出现为了某种特殊目的人工语言,例如“世界语”(Espenranto),就是人类为了排除自然语言多样性和复杂性的伟大尝试。除此之外,随着数学、逻辑学、计算机科学和其它自然科学的发展,近几百年来还出现了大量的形式语言。这些形式语言和自然语言相比有几大特点:1) 语法规范简单;2) 语义明确、可形式定义,对应相对单纯、单一的应用场景;3) 词表和词表元素简单,范畴分类没有一对多、多对一和多对多的情况;4) 由于使用场景单一,对“语境”和语用的形式化定义成为可能。最后,我认为,这些形式化语言的研究,为研究自然语言提供了方向。 遗憾的是,关于自然语言的现代语言学研究,并没有人工语言的位置,也没有古代语言的位置,现代语言学只关心目前人类正在使用的、活的语言的的研究,这就造成了现代语言学的传统研究重点是语音学和音位学,这也是上世纪1950年代前欧美占统治地位的结构主义语言学的昌盛的主要原因。生成语法出现后,句法成为了语言学发展的主流,占据的语言学研究的绝对统治地位,其原因之一就是:任何母语话者都可以随时产生从未说过的“新句子”,因而句法学的研究关注的正是人类语言知识的这个“创造性”侧面,而不仅仅是对语言对象的静态描述、整理和分类。生成语法将这种创造性能力归结于大脑的生物学特性——语言学,归根到底就是生物学。 人工语言的出现,特别是计算机语言的普及,让我们见证了人类不但作为语言使用者而且作为语言创造者的“非凡经历”,这使得在彻底探明大脑的语言能力机制之前,能够在一个小范围内理解语言产生、获得、理解、生成的全过程。这样的研究,比目前将语言学看做是生物学黑洞,在未明的大脑机制外面打转转,提出什么假说、理论框架更具有科学性和实验性。 自然语言的研究,实际上是对一个不可控的复杂系统的研究。在究明其本质之前,目前所有的研究方法,只有两种性质:一、假说性质;二、统计性质;按照前者的方向,自索绪尔起,我们已经经历了太多的语言学流派,理论、框架;按照后者的方向,自上世纪1970年代,产生了基于统计概率的自动学习的自然语言处理技术;到目前为止,基于后者的理论已经开花结果,我们在日常生活中已经感受到了基于这种理论所产生的技术以及由这种技术对我们生活的改变。 这并不是说前者没有价值,相反,自《句法结构》以后所产生各种语言学理论、流派使人类对语言有了更深刻的认识,对自然语言的共性——普遍语法的原则 ,和各种语言的复杂多样的个性——参数,可以用一个统一的视点观察;不过这些观察只是外在于大脑机制的观察——很难验证这些观察是否是对大脑语言机制的正确描述。 对复杂系统的研究和认知,可以从软件工程学到一些东西。当面对开发一个复杂的软件系统时,基本的方法并不是直接面对复杂问题的细节,而是先去建立一个缩小版的、简化的、复杂度可控的、可立即、直接得到结果和反馈的“原型”(prototype),通过对原型的观察、处理和反馈,找到复杂系统的核心机制,在这个原型基础上一点点扩大规模和复杂度,最终达到目标工程的要求。 语言学所研究的对象——大脑中形成的潜在的语言知识(covert knowledge),可以说是人类所能产生的知识中最为复杂的,使得问题更困难的是,这个知识不是“能动”地产生的,而是基于一种神秘的、尚且未知的天生的“语言能力”被动产生的。无论是语言学家们现在所拥有对自然语言的显性知识(overt knowledge),还是研究这种超复杂、混沌的(overcomplicated and chaotic)现象可以使用的工具,都无法直接面对其复杂性,况且这种直接面对复杂现象的接近法从科学研究的角度完全是不可行的。 因此,对自然语言的科学研究,必须用科学的方法——具体地说就是,缩小规模,减少其复杂度、在一个句法、语义、语用、语境多维度可控的空间,研究自然语言普遍性的某个子集。这种研究法——始于Montague的形式语义学研究,以及现代的范畴语法研究,被证明是最有科学意义的研究。如果单纯从复杂度的角度以统计学为工具进行研究,那么所谓语言学仅仅是“复杂性”研究的一个实例而已。例如大家都在使用的Google翻译,就是一个绝好的例证。其翻译引擎没有关注特定语言对(language pair)的对应机制,而只是用一个统一的学习算法、只关注其学习对象的复杂度和具体的使用实例就可以把握两种语言文本的句法和语义对应。 这对语言学研究,对我们认识什么是语言是不是有深刻的启示呢? 因此,我的关注重点从现存的语言学理论、框架、假说、流派,转移到关于语言的更基础的问题——什么是语言?应当如何研究语言?语言的实质是什么?这种研究的精神是探索性的,这里所定义的“语言”,包括自然语言、计算机语言、逻辑形式语言,以及作为语言研究工具的古汉语。 古汉语,应当作为一个和现代中国官方语言——普通话相区隔的另一个语言系统。本人并不想成为古汉语研究专家——我们已经有了足够多的古汉语专家——这里只是发现了古汉语作为形式系统的表述语言的一些独特的形式特性——形式上的简单性和节俭原则(formal simplicity ontological parsimony)、语义的可重定义性(redefinability in semantics),语境敏感性(context sensitivity),以及一个尚未能表述清楚的特性——函项组合性(functional combinability)。这些问题容后陆续展开。如果这项研究能够产生建设性的成果,那么古汉语很有希望在未来的形式系统中充当元语言的角色。
个人分类: 语言学|7621 次阅读|3 个评论
奇才精通百种语言,初出茅庐却因官职炮轰领导是三等人才
热度 10 beckzl 2017-8-21 20:18
随着社会制度的改变,当今的社会主流价值观和百年前相比发生了极大的改变。 中国社会向来不爱歌颂的商人,在新的时代地位变得空前的高。 人们对成功商人的崇拜从“马云爸爸”、“思聪老公”等称呼中就可以体会到。 甚至有人放言: “一流人才经商,二流人才当官,三流人才搞研究。” 文人学者在当代社会的变革中似乎渐渐地被边缘化,渐渐变得举步维艰。 若是熟悉历史,定会想起些许知识分子们的无力抗争。 回首百年前的另一场社会变革,当年文人学者所追崇的理想也许更值得我们品味。 上个世纪,我们的祖国出现过一位难得的语言奇才。 据不完全统计,他至少精通世界上一百多种语言,其中包括许多几近失传的古语言。 他赴美留学,四年内从学士直升博士,在美国教育史上都颇为罕见。 在这四年里,他通过田野调查意外地发现了当时被认为已失传了的重要印第安语。 他用自己的方式从最后一位懂得这种语言的长者口中记录下了宝贵的资料。 几十年后,这些原住民的后人们竟然还要从一个中国人写下的资料中重新学习祖先的语言。 毕业后他回国做学问,接到中研院历史语言研究所所长的邀请拟聘研究所官职。 然而所长三番五次上门游说,他不但不念知遇之恩,甚至没给好脸色。 最终他冲着年长的所长豪言:“ 研究人员是一等人才,教学人员是二等人才,当所长做官的是三等人才。 ” 所长不但不恼怒反而躬身长揖,边退边说:“ 谢谢先生,我是三等人才。 ” ____________ 这位语言大师不是熟为人知的赵元任,也不是300年一遇的才子陈寅恪先生。 他虽与赵元任地位不相上下,被誉为“中国非汉语语言学之父”,却没有赵元任一半的名气。 这个没有多少人知道的名字叫 李方桂 。 李方桂 李方桂祖籍山西,生于广州。 其祖父、父亲一门两代进士及第,母亲曾是慈禧太后的代笔女官,书香门第都不足以形容这样的家世。 李方桂自幼聪颖,据说7岁时就能蹲在椅子上陪父亲的同事打麻将。 8岁时,当时在广州当官的父亲因为深感朝政的黑暗,内忧外患日甚一日,决定辞官回乡。 如此看来,李方桂7岁就上麻将桌也许并非他兴趣所好,而是替父应酬。 父亲变卖了房产,拖家带口告老还乡,打算回到山西昔阳老家做一名乡绅。 可没想到路至保定遭遇兵变,所带银两以及财物被洗劫一空。 李方桂其母担忧子女未来的教育,劝丈夫重回官场,但两人意见出现分歧,最终分道扬镳。 李方桂家乡山西昔阳以大寨闻名全国 李方桂跟随母亲回到北京娘家,靠着变卖珠宝首饰购置了一处四合院,自己居住外也放租以维持生计。 生活清贫却也没改变母亲 “万般皆下品,唯有读书高” 的观念。 母亲坚持将李方桂送到附近的小学读书,之后又进入 京师大学堂的附属中学 学习。 可以说李方桂幼年时接受的教育是北京最优秀的。 中学毕业后,李方桂原计划报考 协和医学院 ,将来做一名医师。 但老师建议他报考清华学堂,那是美国人用“庚子赔款”创办的一所留美预备学校。 不说教学质量,光毕业后公费赴美留学这一点就足以吸引家境衰落的李方桂。 早年的协和医学院 毫无压力地,李方桂和另外两位同学考上了清华预科。 两年预科过去,李方桂的理想仍旧是做一名地位崇高的医师。 但在当时,大凡学习医学的学生除了学习各种自然科学基础课程外,还要学习拉丁语。 正是在学习拉丁语的过程中,李方桂心中语言学的种子发芽了。 清华学堂旧照 李方桂跟随清华学堂一位优秀的拉丁语教师学习了一年拉丁语,随后又学习了3年的德语。 这段经历让李方桂对语言学产生了极大的兴趣,等到毕业时,他早已将医学抛到了九霄云外。 清华学堂五年的学习生活转眼就结束了,同学们纷纷纠结于选择留学哪所名校。 而李方桂早已做了自己的决定,不是芝加哥大学也不是哥伦比亚大学,而是一所名号并不算响亮的密执安大学*。 *注:密执安为密歇根的另一种译法,密执安大学也称密歇根大学,但与密歇根州立大学不为同一所。 密执安大学 原因很简单,李方桂就是奔着这所学校独有的实验语言学专业。 之后的两年里,李方桂研究了古英语、中古英语方言,他发现通行各国的英语不过是日耳曼语的一支而已。 追根溯源,了解语言的发展也是探寻文化历史的过程,语言学是何等的有趣。 1926年,李方桂以优异的成绩毕业,被授予 “全美最优秀学员集团会员” 的光荣称号。 之后便转入芝加哥大学,继续傲游于语言的海洋当中。 李方桂开始系统性地学习欧洲古语言,包括常人闻所未闻的奥斯肯语、翁不里亚语、古意大利方言、古波斯语、古教会斯拉夫语…… 转眼间就修完了所有印欧语相关的全部课程。 印欧语分布示意图 但他还并不满足,又将目光放在了更加偏门的 印第安土著语言 。 印第安人的语言没有文字,很多历史流传下来靠的是口口相传以及一些艺术化的形势。 而当时的印第安文化已经被殖民者侵蚀得差不多了,很多种土著语言都几乎失传。 一旦这些语言消失,那再也不会有人能了解到他们的历史。 李方桂虽然研究的是语言,但本质上却是在保护原住民的文化和历史。 1927年,李方桂师从 爱德华·萨丕尔 教授攻读美洲印第安语。 一表人才的萨丕尔教授 在加利福尼亚西北的一次田野调查中,他意外地发现了胡伯谷马佗里印第安人的部落。 从部落仅剩的两名会古语的长者口中调查了他们独有的印第安语,并用拉丁拼音的方式记录了下来。 马佗里印第安原住民 就在那次田野调查结束后,那两名马佗里印第安人便相继去世了。 李方桂手里的调查笔记成了这门语言存世唯一的资料,以至于部落的后人们想了解祖先的语言必须查阅一个中国人撰写的资料。 李方桂足足花了三个月时间才完成这份宝贵的调查报告,意外地拯救了一门重要的印第安语。 同时,这份报告也为他的博士论文提供了宝贵的材料。 不过,李方桂光沉迷研究印第安语,反倒忘记了去考德语和法语的书面考试。 这两门考试是在芝加哥大学拿博士学位所必须的,这让李方桂的博士学位迟到了几个月的时间。 即便如此,李方桂还是在4年的时间里获得了本硕博三个学位,惊为天人。 留学毕业后,李方桂迫不及待地要回到祖国,他的导师萨丕尔教授表示支持,还特地从洛克菲勒基金会给他申请了一笔颇丰的学术基金。 洛克菲勒基金会 刚一回国,名气还不算大的李方桂便受到了时任中研院院长蔡元培先生的家宴款待。 宴会上,蔡元培当场就任命李方桂为中研院的研究员。 只可惜李方桂拿着洛克菲勒基金会的钱,正式的职务不便担任,倒是做了一个不拿薪水的名誉研究员。 蔡元培 这李方桂刚一回国,便在广州街头受到了一位讲瑶语的海南人启发,萌生了研究的念头。 随后他发现中国南方的少数民族语言之间有许多相似之处,随后又拓展至南亚各地的语言。 研究期间他拒绝了洛克菲勒基金会的资助,正式成为了中研院的研究员。 起初还接受了赵元任先生提供的经费,取道东南亚做研究。 短短几年后,就已经名扬全国,与赵元任先生一起并为中国语言学的双雄。 李方桂与赵元任 1940年,当时还在云南、四川做田野调查的李方桂已经通晓多门少数民族语言,对他们的历史文化也颇为了解。 当时中研院正筹备成立民族学研究所,时任中研院代院长朱家骅看中了李方桂,托 傅 斯年 前去说服。 五四青年傅斯年 这傅斯年是民国时期学术界最活跃最有影响力的大人物,是当年“五四运动”的学生领袖。 他尤其嫉恨贪官污吏,曾在国民参政大会上炮轰孔祥熙贪污,并将他轰下了台。 如此事迹再加上他身材敦实,因此人送外号“傅大炮”。 同时傅斯年也是中研院历史语言研究所的创办人、所长,还是当年李方桂的举荐人、领导。 左起,傅斯年、梁思成、李济之、李方桂 按理来说傅斯年这号大人物前去说服李方桂是件十拿九稳的事。 可没想到,傅斯年三番五次地劝说也未能成功。 李方桂不但不领情,还十分不给面子,说道: “我认为,研究人员是一等人才,教学人员是二等人才,当所长做官的是三等人才。” 言语中表达了自己拒绝出任所长的意思,还贬低了傅斯年。 “傅大炮”一番好意反遭炮轰,换作是谁都会暴怒。 可傅斯年听了,反而躬身给李方桂做了一个长揖,一边退下一边说: “谢谢先生,我是三等人才。” 傅斯年 李方桂此举倒不是为了激这位德高望重的前辈,而是他心中的文人学者就应该是潜心做学问的。 不拜官不问政是他傲骨的坚持,不容得半点玷污。 而爱才如命的傅斯年也非常尊重着一份罕有的纯粹,依旧给予李方桂极高的评价。 “中国非汉语语言学之父” 的名号正是出自傅斯年与人的谈话里。 李方桂与妻子 李方桂对侗傣语等少数民族语言的研究是狂热的,经常奔波西南各地,出没于田野乡间。 因此他每次外出调查都会带一身虱子回家,他的夫人就将他的衣物放在蒸笼里蒸。 有一次,棉衣还没出笼,赶上傅斯年来访,李方桂就只好裹在被窝里与他研讨问题。 此外,李方桂还对汉藏语系的音韵学颇有研究,发表了不少对上古音的研究成果。 是唯一一个能在印第安语、侗傣语、汉藏语系三个截然不同的领域都做出了基础性奠基性贡献的语言大师。 另一位语言大师赵元任也毫不吝啬赞言:“中国语言学家之中,只有极少数人,研究范围能涵盖汉语的南北古今及其它相关语言,其中之一就是我的老友兼同事李方桂。” 李方桂一家与赵元任一家 当然还有后半句:“我曾经发现李方桂在想问题的时候有一个特别的姿态,就是他总是 把头微微向右抬起25度的样子 ,直到30年代末期,我第一次见到布龙菲尔德,才发现那个布龙菲尔德的角度,才知道方桂是从哪里学到那个沉思的姿态的!” 赵元任与抬头25度的 布龙菲尔德 战乱年代,李方桂为求清静地做研究,不得不离开祖国,定居美国。 先后受聘于哈佛、耶鲁、普林斯顿等知名学府,在那里度过了自己的后半辈子。 李方桂先生关于藏语最重要的著作《唐蕃会盟碑考》出版时他已经走到了生命的尽头。 他躺在病床上收到此书,指着封面上的署名激动地对身旁的护士说:“我的名字,我的名字。” 李方桂夫妇金婚合影 两个月后,刚过完87岁生日的第二天,李方桂先生就离开了人世。 那是1987年的8月21日,迄今整整30年。 有媒体撰文援引外电报道:“硕果仅存的‘少数民族语言学之父’李方桂的去世,代表了人文科学领域语言学时代的历史结束。” 1972年李方桂获密歇根大学荣誉博士学位 华盛顿大学教授乔治·泰勒说:“我们只要想起方桂那沉静而宽厚的风范,内心就激荡不已。他是一位世界级公民,世界级学者!是国际学术合作力量的一座灯塔!是一位人格高尚的人!” 他还说:“如今我们痛失了一位杰出人物,我们唯一能够弥补的是,永远纪念他、了解他。” 可当今的学者,已经没有多少人能记得起李方桂。 而当今的学术,也很少能有李方桂的那一股纯粹。
10179 次阅读|12 个评论
融智学理论与三大系统工程实践(总结提纲)
geneculture 2017-8-13 16:58
融智学理论与三大系统工程实践(总结提纲) 作者:邹晓辉Geneculture 中美欸乃塞尔研究中心 主任 研究员 2017-08-12于北京 一、脚踏实地,没有实践不行 ( 实践出真知 ) 1.1. 文化基因智能化系统工程 1.2. 言识软硬形式化系统工程 1.3. 教管学用社会化系统工程 二、高屋建瓴,没有理论不行 (前瞻性理论) 2.1. 理论融智学(观点与方法; 第一基本定律:序位结构唯一守恒 ) 2.2. 工程融智学(标准化技术; 第二基本定律:同义并列对应转换 ) 2.2.1. 间接形式化的双字棋盘 2.2.2. 协同智能化的驻行载器 2.3. 应用融智学(个性化艺术; 第三基本定律:同意并列对应转换 ) 2.3.1. 双融共赢格局(金融的本质是智融,融资的实质是融智) 2.3.2. 大智慧养廉说(集大成、融大智超越角力、竞技和斗智) 三、融智学基础 3.1. 研究对象:三智融通融合的机理(三智--智慧、智力、智能 ,既可分别研究,又可整合探讨,更可融通融合探索 ) 3.2. 学科性质:三智融通融合的本质(哲学的智慧、心理学的智力、计算机科学的人工智能, 三智之间的区别和联系 ) 3.4. 概念体系:三智融通融合依据的基本概念框架(七个字的术语体系) 3.4. 方法体系:三智融通融合采用的基本方法架构(11个词的术语体系) 四、小结 4.1. 基于人脑的信息处理能力(语言学关注的人类智力) 4.2. 基于电脑的信息处理能力(信息学关注的人工智能) 4.3. 基于双脑的信息处理能力(融智学关注的智慧能力) 五、习题 5.1. 现象信息(物意文三种基本现象) 5.2. 本真信息(理义法三类核心本质) 5.3. 本体信息(文和物记载各种用意) 六、参考文献 6.1. Zou Xiaohui.Value-Takingand Confidence-Building of Language.AAAS Annual Meeting https://aaas.confex.com/aaas/2012/webprogram/Paper7342.html 6.2. XiaohuiZou.FUNDAMENTALLAW OF INFORMATION: PROVED BY DOUBLE MATRICES ON NUMBERS AND CHARACTERS. AAAS Annual Meeting 2017 https://aaas.confex.com/aaas/2017/poster/papers/viewonly.cgi?password=598206username=20325 6.3. XiaohuiZou.Characteristicsof Information and Its Scientific Research. IS4SI-2017 » Session Conference FIS 2017:The Seventh International Conference on the Foundations of Information Science http://sciforum.net/conference/IS4SI-2017/paper/3926 作者文献 总发文量: 13 总下载量: 1252 最高被引 软件工程学科何以独特——形式化方法的双重路径 . 邹晓辉,邹顺鹏.软件 . 2011 (07) 7 间接计算模型和间接形式化方法 . 邹晓辉,邹顺鹏.软件 . 2011 (05) 6 最高下载 高校教育学科建设理论探新 . 邹顺鹏.中国地质大学(北京) . 2012 (10) 334 “云计算”概念的分析研究——协同智能计算系统的一个特例 . 邹晓辉,邹顺鹏.软件 . 2011 (09) 171 协同智能计算系统——理论模型及其应用 . 邹晓辉,邹顺鹏.软件 . 2011 (06) 157 论公平视域下当代科学通识教育的前瞻性——从《面向全体美国人的科学》得到的启示 . 邹顺鹏,邹晓辉. . 2011 151 软件工程学科何以独特——形式化方法的双重路径 . 邹晓辉,邹顺鹏.软件 . 2011 (07) 132 间接计算模型和间接形式化方法 . 邹晓辉,邹顺鹏.软件 . 2011 (05) 58 言和语的关系——在语言和言语的区分基础上进一步 . 邹晓辉,邹顺鹏. . 2012 58 虚拟的孪生图灵机——以双语信息处理为例 . 邹晓辉,邹顺鹏.软件 . 2011 (08) 51 双语信息处理方法及原理 . 邹晓辉,邹顺鹏.计算机应用与软件 . 2015 (11) 45 当代中国大学新使命:基于汉语思维与双语处理的文化传承和创新 . 邹晓辉,邹顺鹏.南京理工大学学报(社会科学版) . 2012 (05) 43 专利名称 发明人 申请人 数据库 申请日 公开日 下载 热度 1 一种基于双语自动转换的间接形式化方法 邹晓辉;邹顺鹏 邹顺鹏;邹晓辉 中国专利 2010-05-18 2011-11-23 0 2 制作个性化电子地图及其友好界面的方法 邹顺鹏;邹晓辉 邹顺鹏;邹晓辉 中国专利 2010-05-18 2011-11-23 0 3 双字棋盘 邹晓辉 邹晓辉;邹顺鹏 中国专利 2014-04-21 2014-09-24 0 4 一种轻型示警分类书包 邹晓辉 邹晓辉;邹顺鹏 中国专利 1996-06-28 1997-09-24 0 找到 4 条结果
个人分类: 融智学前期探索|379 次阅读|1 个评论
经历“语言学、语言哲学、语言形式化”成为“语言科学”
geneculture 2017-8-4 05:05
言和语的关系及其应用:言即单音节(纯形式),语既有双音节又有多音节(纯形式),前者是语言科学的基本研究对象,后者是派生的,其学科性质是可用它衡量语言的形式化特征,例1,书面汉语即中文就是由纯形式的汉字和汉语所构成的,其文字特征是大字符,其语言的结构单位可划分为:言、辞、链、块、读、句、段、篇,其特点在言的内涵即字类可区分为:音、形、实(义)、虚(法)、象、释、用、解,例2,书面英语即英文则是由混音节的词和句来双向区分词组或短语以形成其内容理解与分歧化解的,word,phrase,sentence,非常简捷,其特点是三者都可在做进一步地分析并解构,由例1和例2可见其各自的基本概念体系和基本框架的区别特征,相应的方法体系也都可在其形式分析与解构的过程中发现其基本架构和方法特征。该理论与实际的结合可产生同时有利于人机双向的各类基本操作,既可在纯形式的分析方面做到全自动化计算与统计乃至各类基本比较,又可做到对其承载的义项做一系列的基本分析,三类双语联动机制的发现,蝴蝶模型与语言系统工程涉及的两大类形式化方略,尤其是双语信息处理的方法和原理的发明与发现,对于其应用的广阔前景尤其是三类双语联动处理机制的推广应用对人机双脑协作可产生的实际影响,对英汉或汉英双语(狭义的)、语文与算术(广义双语)、术语和俗语(另类双语)这样典型的三类双语协同处理与理解是是相当典型的,加之双字棋盘的应用,可让人们体会并感受到语言的无穷魅力。--邹晓辉Geneculture2017-08-04凌晨4:48
个人分类: 学术研究|331 次阅读|1 个评论
2017国家社科基金项目:语言学立项情况
carldy 2017-6-16 17:39
中华典籍英译云平台的构建及应用研究 张政 北京师范大学 重点项目 语言学 英语专业服务国家对外战略的区域国别课程体系构建与人才培养实践研究 常俊跃 大连外国语大学 重点项目 语言学 儒学海外传播文本数据库建设及传播话语研究 秦洪武 曲阜师范大学 重点项目 语言学 汉英法律大词典 肖云枢 西南政法大学 重点项目 语言学 基于 HSK 大数据挖掘的汉语习得研究 柴省三 北京语言大学 重点项目 语言学 基于概念整合的现代汉语高频并列式双音词语义网络构建研究 武文杰 河北大学 重点项目 语言学 汉语古诗英译策略的体系构建与运行机制研究 文军 北京航空航天大学 重点项目 语言学 语言接触视角下的广西汉语方言语音演变研究 覃远雄 中国社科院 重点项目 语言学 桂东北地区方言地图集 邓玉荣 贺州学院 重点项目 语言学 多地移民杂居的山西安泽方言比较研究 赵变亲 山西师范大学 重点项目 语言学 汉语特殊型语言障碍儿童与高功能自闭症儿童语法能力对比研究 何晓炜 广东外语外贸大学 重点项目 语言学 汉语自闭症儿童和正常儿童的多模态指称策略对比研究 马博森 浙江大学 重点项目 语言学 汉语二语句法结构眼动加工研究 常辉 上海交通大学 重点项目 语言学 16 批战国楚简谐声通假数据库建设与上古音研究 杨建忠 浙江财经大学 重点项目 语言学 出土战国文献汇释今译暨数据库建设 张玉金 华南师范大学 重点项目 语言学 吐鲁番文献合集、校注、语言文字研究及语料库建设 王启涛 西南民族大学 重点项目 语言学 元明戏曲文献字词关系研究 曾良 安徽大学 重点项目 语言学 与被动标记、虚义动词及话语标记相关的构式在历时演变中的压制和反压制研究 刘文正 湖南大学 重点项目 语言学 大型语文辞书编纂与修订研究 蒋宗福 四川大学 重点项目 语言学 克普恰克文献语言研究 阿力肯 · 阿吾哈力 中央民族大学 重点项目 语言学 基于依存句法标注语料库的中国英语学习者句法发展研究 蒋景阳 浙江大学 重点项目 语言学 中国英语学习者二语语用能力发展研究 杨连瑞 中国海洋大学 重点项目 语言学 二语写作理论体系建构及本土化研究 王俊菊 山东大学 重点项目 语言学 外交翻译的理论构建与中国特色外交话语体系建设研究 杨明星 郑州大学 一般项目 语言学 “一带一路”背景下新疆周边国家语言政策对新疆语言规划的影响和对策研究 郭建荣 新疆教育学院 一般项目 语言学 “一带一路”背景下中亚五国汉语传播的国别比较研究 尹春梅 新疆师范大学 一般项目 语言学 “一带一路”视野下的对外汉语“AR”教学创新模式研究 郑世珏 华中师范大学 一般项目 语言学 丝绸之路沿线语言比较视野中的上古汉语词汇研究 叶晓锋 温州大学 一般项目 语言学 西方经济学家对改革开放以来中国的认知与表述文本计量研究 郭社森 杭州师范大学 一般项目 语言学 “互联网+”时代大学英语教学模式重构研究 杨港 临沂大学 一般项目 语言学 大数据时代的维吾尔语动词词网研究及其构建研究 阿孜古丽 · 夏力甫 新疆大学 一般项目 语言学 社会网络理论视角下西藏时政外宣翻译研究 彭萍 西藏民族大学 一般项目 语言学 东部裕固语语言生态调查研究 阿拉腾苏布达 内蒙古大学 一般项目 语言学 中华文化外译的语用策略研究 莫爱屏 广东外语外贸大学 一般项目 语言学 中国社会文化新词英译及其接受效果研究 窦卫霖 华东师范大学 一般项目 语言学 中华文化“走出去”视域下中国文学在美国的译介、接受与影响研究 党争胜 西安外国语大学 一般项目 语言学 中国文化“走出去”战略下的科幻小说英译研究 李红霞 西北师范大学 一般项目 语言学 茶文化模因的跨时域表征与古今茶著翻译研究 姜欣 大连理工大学 一般项目 语言学 赤水河流域民俗词汇与民俗文化研究 蓝卡佳 遵义师范学院 一般项目 语言学 社会文化理论视域下新任外语教师身份认同研究 王栋 山东师范大学 一般项目 语言学 跨文化接触对大学生跨文化能力发展的作用机理研究 吴卫平 武汉理工大学 一般项目 语言学 基于复杂网络的汉越同源文化词汇对比研究 赵燕华 广西师范大学 一般项目 语言学 北方宝卷语言文化研究 曹强 渭南师范学院 一般项目 语言学 认知老化对老年人语音感知的影响研究 杨小虎 上海交通大学 一般项目 语言学 世界百种语言基本核心词词义数据库 冉启斌 南开大学 一般项目 语言学 汉语篇章结构的特征 — 依存描写机制及资源建设研究 冯文贺 广东外语外贸大学 一般项目 语言学 哈贝马斯普遍语用学视域下的国家语用策略博弈研究 刘森林 暨南大学 一般项目 语言学 基于汉语语料的词结构生成机制研究 程工 浙江大学 一般项目 语言学 扩展模式语法框架下的现代汉语句子结构研究 瞿云华 浙江大学 一般项目 语言学 中国手语词的构造及其所受汉语影响研究 陈小红 怀化学院 一般项目 语言学 主观化理论视角下的汉英事件 / 实体错配研究 卢军羽 景德镇陶瓷大学 一般项目 语言学 汉英音系结构深层机制中的音高差比研究 郭嘉 南开大学 一般项目 语言学 基于事件语义的语用标记词汇化跨语言对比研究 孔蕾 曲阜师范大学 一般项目 语言学 英汉语序优势 — 和谐的程度差别及其功能动因对比研究 席建国 广州大学 一般项目 语言学 英汉学术互动中权势关系建构研究 任育新 兰州理工大学 一般项目 语言学 英汉名词修饰语功能与语序互动的类型学研究 邢晓宇 内蒙古大学 一般项目 语言学 英、汉原型情绪的概念化研究 周频 上海海事大学 一般项目 语言学 认知语言学视域的英汉受事前置句对比研究 汤敬安 吉首大学 一般项目 语言学 认知语法框架下的英汉小句联结研究 莫启扬 西南大学 一般项目 语言学 译出与译入文本语言特征的计量风格学研究 蒋跃 西安交通大学 一般项目 语言学 国家战略视角下的翻译立法研究 赵军峰 广东外语外贸大学 一般项目 语言学 现代湖南翻译史论 张旭 广西民族大学 一般项目 语言学 翻译在近代英美汉学演进中的角色及其影响研究 何绍斌 上海海事大学 一般项目 语言学 基于翻译规范的中国应用翻译批评及标准体系研究 傅敬民 上海大学 一般项目 语言学 西学翻译与晚清中西、新旧思想嬗变互动研究 卢明玉 北京交通大学 一般项目 语言学 面向机器翻译的质量深度评价体系研究及应用 秦颖 北京外国语大学 一般项目 语言学 与西式翻译学理异趣的魏晋南北朝中国译释学实践研究 牛云平 中国人民大学 一般项目 语言学 认知翻译学研究体系的构建研究 肖开容 西南大学 一般项目 语言学 马汉《海权论》在我国百年翻译与接受研究( 1900—2016 ) 罗天 重庆交通大学 一般项目 语言学 国家形象外译融通与可接受性研究 曾剑平 江西财经大学 一般项目 语言学 服务国家对外话语传播的“翻译修辞学”学科构建与应用拓展研究 陈小慰 福州大学 一般项目 语言学 近代英文期刊对中国经典的译介与传播研究( 1800—1949 ) 曾文雄 广东财经大学 一般项目 语言学 多语种外宣译本海外认知度与翻译有效性研究 侯旭 东南大学 一般项目 语言学 当代中国文学英译与澳洲后汉学的形成研究 陈吉荣 辽宁师范大学 一般项目 语言学 当代中国小说英译中的文学性再现与中国文学形象重塑研究 孙会军 上海外国语大学 一般项目 语言学 中国翻译伦理学术话语体系构建研究 申连云 扬州大学 一般项目 语言学 《文心雕龙》话语体系英译和中西文论对话研究 胡作友 合肥工业大学 一般项目 语言学 基于《论语》英译的中国典籍对外传播机制创新研究 范敏 上海立信会计金融学院 一般项目 语言学 世情小说《金瓶梅》英语世界译介模式研究 赵朝永 华东师范大学 一般项目 语言学 《庄子》在英语世界的经典化研究 张云 湖南大学 一般项目 语言学 基于语料库的英汉概称构式传译研究 张凌 西北农林科技大学 一般项目 语言学 基于自然语料的汉英同声传译预测机制研究 符荣波 宁波大学 一般项目 语言学 英汉同声传译能力的发展模型研究 梁君英 浙江大学 一般项目 语言学 同声传译共时信息处理能力研究 邹德艳 大连外国语大学 一般项目 语言学 地理语言学视域下的赣闽粤交界地带客家方言语法特征研究 付欣晴 南昌大学 一般项目 语言学 图片上的境外汉语方言研究暨配套图库平台建设 丘学强 深圳大学 一般项目 语言学 地理语言学视角下的杭嘉湖地区方言语法研究 张薇 杭州师范大学 一般项目 语言学 地理语言学视域中的客赣交界地带方言研究 汪高文 南昌大学 一般项目 语言学 明清官话与闽语的接触研究 陈泽平 福建师范大学 一般项目 语言学 基于来华传教士文献的近两百年广州方言发展演变研究 金桂桃 武汉理工大学 一般项目 语言学 湖北境内江淮官话毗连带方言语音研究 盛银花 湖北第二师范学院 一般项目 语言学 地理语言学视角下的鄂豫皖方言接触研究 叶祖贵 绍兴文理学院 一般项目 语言学 新疆汉语方言变异研究 彭嬿 新疆大学 一般项目 语言学 西北三声调方言的连字调研究 衣莉 中国农业大学 一般项目 语言学 基于《人民日报(海外版)》的中国对外话语体系研究( 1985—2017 ) 徐小婷 济南大学 一般项目 语言学 GMS 五国语言政策及其主要外来语言地位嬗变研究 孙瑞 广西大学 一般项目 语言学 非洲语言政策与规划发展变革研究 徐丽华 浙江师范大学 一般项目 语言学 近代中国语文运动及其国家认同研究 黄晓蕾 中国社科院 一般项目 语言学 宁夏家庭语言生活状况调查研究 杨晓宇 宁夏大学 一般项目 语言学 市民化进程中流动学前儿童语言能力发展及其影响因素研究 尹静 北京交通大学 一般项目 语言学 中国手语方言词汇比较研究 赵晓驰 南京特殊教育师范学院 一般项目 语言学 军语同义词群构建及其应用研究 向音 军事经济学院 一般项目 语言学 西藏地区手语使用状况调查及汉藏手语的语言比较研究 郑璇 重庆师范大学 一般项目 语言学 新媒体语境下的新闻话语研究 翁玉莲 西北大学 一般项目 语言学 基于语料库的医生话语策略与和谐医患关系建构研究 梁海英 西北师范大学 一般项目 语言学 法庭审判话语的态度表达及其人际功能研究 施光 南京师范大学 一般项目 语言学 基于语料库的美国智库涉华政治话语的批评性分析 支永碧 苏州科技大学 一般项目 语言学 情绪 STROOP 范式下的外语学习焦虑个体中、英文信息加工对比研究 张素敏 河北师范大学 一般项目 语言学 英语认知诊断测评模式构建及有效性论证 马晓梅 西安交通大学 一般项目 语言学 二语违实结构加工中的层级意动研究 于善志 宁波大学 一般项目 语言学 汉英视、笔译的语篇认知加工模式对比实证研究 项霞 宁波大学 一般项目 语言学 语用障碍干预策略的取效行为研究 尚晓明 黑龙江大学 一般项目 语言学 中国英语学习者语音习得问题研究 卜友红 上海师范大学 一般项目 语言学 基于 ERP 证据的汉英科学隐喻脑加工机制对比研究 唐雪梅 安徽工程大学 一般项目 语言学 汉语词中成分位置的认知加工机制研究 李德高 曲阜师范大学 一般项目 语言学 基于汉语儿童语料库的语言障碍诊断系统研究 周兢 华东师范大学 一般项目 语言学 信息技术支持下高校英语教师专业发展路径和机制研究 王京华 河北大学 一般项目 语言学 高校外语教师教育者的职业身份发展轨迹研究 闫春梅 华中师范大学 一般项目 语言学 大学英语课堂教学有效性研究 孙云梅 华中科技大学 一般项目 语言学 形成性评价在我国英语教育领域的情境重构及实现路径研究 陈秋仙 山西大学 一般项目 语言学 英语专业本科阶段英语能力结构的认知水平研究 陈慧麟 上海外国语大学 一般项目 语言学 信息化时代大学外语教学范式重构研究 陈坚林 上海外国语大学 一般项目 语言学 基于语料库的大学英语教材与考试学术词汇覆盖率研究 李华东 杭州电子科技大学 一般项目 语言学 内地新疆班与西藏班“超用语”外语课堂教学研究 王平 嘉兴学院 一般项目 语言学 信息化时代基于移动学习的大学英语教学模式有效性研究 刘兵 太原理工大学 一般项目 语言学 指向学科核心素养的英语课堂教学任务研究 朱彦 复旦大学 一般项目 语言学 信息化时代高校学生英语自我调节学习与课堂评价支持研究 唐雄英 江西师范大学 一般项目 语言学 中国高校本科生学术英语写作综合评价体系研究 都建颖 华中科技大学 一般项目 语言学 基于系统互评模式下的英语写作能力发展研究 张福慧 东北师范大学 一般项目 语言学 英语和汉语作为外语的综合性写作测评研究 张新玲 上海大学 一般项目 语言学 中美英语写作教材百年发展比较研究 刘新芳 苏州科技大学 一般项目 语言学 华人移民对东南亚汉语传播影响的国别比较研究 韩晓明 郑州大学 一般项目 语言学 面向国际汉语教学的汉语话语标记主观性等级研究 潘先军 北京第二外国语学院 一般项目 语言学 汉语口语互动分级标准研究 王跃龙 华侨大学 一般项目 语言学 甲午战争以来日本军用汉语教科书研究 寇振峰 辽宁大学 一般项目 语言学 基于语篇难度级差的汉语语篇习得研究 田然 北京语言大学 一般项目 语言学 类型学视角下英、韩学生汉语语序习得研究 周文华 南京师范大学 一般项目 语言学 基于语料库的汉语学习者动宾搭配能力研究 王丽 南通大学 一般项目 语言学 面向自然语言处理的多模分布式语义模型研究 杨东强 山东建筑大学 一般项目 语言学 现代汉语新诗语言计量研究 潘夏星 华侨大学 一般项目 语言学 面向自然语言处理的汉语依存句法计量与模拟研究 陆前 广西师范大学 一般项目 语言学 中国西班牙语学习者语料库的构建与研究 何晓静 北京外国语大学 一般项目 语言学 “皇极经世系列等韵文献”语音理论与语音史价值研究 李红 首都师范大学 一般项目 语言学 清代汴洛及其周边地区刻本、稿本、抄本韵书语音研究 赵祎缺 新乡学院 一般项目 语言学 北京大学藏西汉竹书疑难字词研究及数据库建设 岳海燕 山西大学 一般项目 语言学 《字汇》音切来源与层次研究 高永安 中国人民大学 一般项目 语言学 《五方元音》四种版本综合研究 胡琳 西南大学 一般项目 语言学 以《论语》为依托的儒家经典文献文字历时研究 李冬鸽 河北师范大学 一般项目 语言学 宋元以来民间手书文献俗字典编著及研究 黑维强 陕西师范大学 一般项目 语言学 基于组类差异的甲骨文字词关系研究 张新俊 河南大学 一般项目 语言学 汉字发展史视域下三国吴简文字研究 王保成 池州学院 一般项目 语言学 东汉至隋石刻文献字词关系研究 谢国剑 广州大学 一般项目 语言学 战国古文与敦煌先秦写卷俗字对比研究 俞绍宏 大连大学 一般项目 语言学 《旅顺博物馆所藏甲骨》语言文字研究 郭仕超 大连民族大学 一般项目 语言学 战国秦汉三国简帛字迹研究 李松儒 吉林大学 一般项目 语言学 古文字特殊通转研究 王志平 中国社科院 一般项目 语言学 战国秦汉简帛文献用字综合研究 魏宜辉 南京大学 一般项目 语言学 金元医籍语言研究 涂海强 温州医科大学 一般项目 语言学 基于数据库的汉语外来词研究百年史 原新梅 辽宁师范大学 一般项目 语言学 圣语藏、碛砂藏、高丽藏汉文佛经异文研究 熊娟 贵州大学 一般项目 语言学 日僧无著道忠中国禅籍语言研究论考 雷汉卿 四川大学 一般项目 语言学 黄式三小学研究 胡世文 浙江海洋大学 一般项目 语言学 《说文》说解语词汇研究 徐前师 湖南科技大学 一般项目 语言学 古汉语联绵词形音义综合研究 孙玉文 北京大学 一般项目 语言学 早期汉译佛经一词多译比较研究 顾满林 四川大学 一般项目 语言学 贵州契约文书俗字词汇研究 卢庆全 哈尔滨商业大学 一般项目 语言学 跨语言视角下“来”的共时分布与历时演变研究 张言军 信阳师范学院 一般项目 语言学 基于出土文献的先秦汉语形容词研究 傅华辰 宿州学院 一般项目 语言学 满语对清代旗人汉语的语法干扰及其对北京话语法的影响研究 张俊阁 山东师范大学 一般项目 语言学 汉语状态变化事件语义编码的历史演变及类型学研究 林海云 湖南师范大学 一般项目 语言学 汉语性质形容词主观化与结构功能的互动研究 吴颖 上海师范大学 一般项目 语言学 现代汉语情感动词研究 赖慧玲 郑州大学 一般项目 语言学 句子功能中心的跨语言差异对句法结构的影响研究 司罗红 郑州大学 一般项目 语言学 现代汉语语气助词与相关范畴 / 结构的同现限制及补偿机制研究 吴早生 安徽大学 一般项目 语言学 白话文经典对现代汉民族共同语词汇形成与发展的影响研究 聂志平 浙江师范大学 一般项目 语言学 基于情态视角的汉语能性述补结构研究 周红 上海财经大学 一般项目 语言学 汉语句子里表达话语转述的语法形式研究 丁加勇 湖南师范大学 一般项目 语言学 汉语的语序类型对语法化的影响研究 李永 唐山师范学院 一般项目 语言学 汉语情态副词的语义提取与分类验证研究 赵春利 暨南大学 一般项目 语言学 类型学视域下的汉语意外范畴研究 万光荣 中南民族大学 一般项目 语言学 语言类型学视野下的汉语语气词演变研究 翟燕 中央民族大学 一般项目 语言学 现代北京话词汇变异研究 王伟丽 首都师范大学 一般项目 语言学 《汉语大词典》单音多义词词义系统与义项排序研究 尹洁 北京师范大学 一般项目 语言学 中文科技术语的语域传播研究 张春泉 西南大学 一般项目 语言学 国家语言战略背景下的汉语修辞能力标准研究 李德鹏 云南师范大学 一般项目 语言学 微语言语用平衡路径研究 周芬芬 湖南农业大学 一般项目 语言学 口述历史语篇的计量语体研究 赵雪 中国传媒大学 一般项目 语言学 事态观之下的汉语分裂结构句法语义研究 曹道根 浙江财经大学 一般项目 语言学 谓词语义角色的指称及其主观性研究 张占山 同济大学 一般项目 语言学 现代汉语语气词的句法语用互动研究 谢晓明 华中师范大学 一般项目 语言学 基于事件结构的汉语非常态构式研究 张则顺 武汉大学 一般项目 语言学 基于信息结构理论的数量成分述谓功能研究 朴珍玉 延边大学 一般项目 语言学 句法—形态接口视域下的汉语“得”字结构的跨语言研究 汪昌松 北京理工大学 一般项目 语言学 汉语紧缩构式群的互动承继系统研究 皇甫素飞 淮阴师范学院 一般项目 语言学 外骨架理论视域下现代汉语动转名词的词库 — 句法接口研究 熊建国 解放军外国语学院 一般项目 语言学 三音节固化词语的词汇化、语法化和构式化研究 李思旭 安徽大学 一般项目 语言学 中古汉语心理动词研究 姜黎黎 杭州师范大学 一般项目 语言学 汉语“动(+宾)+补”语序及相关语法演变研究 黄晓雪 浙江工业大学 一般项目 语言学 汉语跨层词汇化的再演变研究 刘红妮 上海师范大学 一般项目 语言学 基于语体差异的中古汉语语法研究 葛佳才 重庆师范大学 一般项目 语言学 语前聋成人汉语语音行为及其神经机制研究 陈彧 天津理工大学 一般项目 语言学 基于汉语音韵及方言事实的形式音系学共时与历时接面研究 贺俊杰 陕西师范大学 一般项目 语言学 满族与蒙古族语言接触研究 胡艳霞 大连民族大学 一般项目 语言学 锡伯语参考语法研究 桂芳 内蒙古大学 一般项目 语言学 元代文献中蒙汉语言接触词语解读研究 卓娜 内蒙古民族大学 一般项目 语言学 蒙古语语言资源的保护与开发问题研究 孟和宝音 内蒙古师范大学 一般项目 语言学 历史语言学视角下的蒙古语和满语静词形态比较研究 佟金荣 呼和浩特民族学院 一般项目 语言学 朝鲜朝教科书《童蒙先习》中国因素及其语言历史研究 李光华 延边大学 一般项目 语言学 朝汉语言接触与延边汉语变异研究 黄玉花 吉林大学 一般项目 语言学 类型学视野下的突厥语言元音和谐现象研究 魏玉清 新疆师范大学 一般项目 语言学 《猓猡译语》整理与研究 孔祥卿 南开大学 一般项目 语言学 汉藏语系语音重叠构词模式及韵律和谐研究 李春艳 天津大学 一般项目 语言学 纳西东巴文异体字研究及语料库建设 甘露 广州大学 一般项目 语言学 羌语词汇研究 邓春琴 西华师范大学 一般项目 语言学 藏传佛教语言的厘定、规范及其历史意义研究 索南东主 青海师范大学 一般项目 语言学 跨境载瓦语志研究 朱艳华 北京语言大学 一般项目 语言学 藏缅语并列结构的类型学研究 范丽君 中国传媒大学 一般项目 语言学 壮语词汇的计量语言学研究 韦爱云 广西师范大学 一般项目 语言学 侗语音韵研究 毕谦琦 华东政法大学 一般项目 语言学 海南黎语名词性短语形式句法学研究 蔡激浪 海南师范大学 一般项目 语言学 文字接触与传播视野下的古壮字研究 李明 中南大学 一般项目 语言学 基于语料库的英语语法隐喻研究 何清顺 广东外语外贸大学 一般项目 语言学 存在句的类型学研究 王勇 华中师范大学 一般项目 语言学 英语词汇认知的应激模型及语义提取研究 刘岩 东北师范大学 一般项目 语言学 基于概念整合理论的英语动词时、体、情态语法范畴的语义互动研究 陈敏哲 湖南师范大学 一般项目 语言学 英语句法类型的演化研究 刘晓林 重庆三峡学院 一般项目 语言学 中国政治话语双语术语知识库建设与应用研究 李晶晶 南开大学 一般项目 语言学 话语视域下中外行业语篇互文动态系统研究 邓鹂鸣 武汉大学 一般项目 语言学 中医古籍中情感隐喻的认知研究 李孝英 西南医科大学 一般项目 语言学 后冷战时期中美外交话语模式比较研究 徐中意 浙江越秀外国语学院 一般项目 语言学 二语学术话语中语篇评价能力的发展规律研究 周惠 东北师范大学 一般项目 语言学 认知协同维度的多模态会话分析研究 许俊 湖南大学 一般项目 语言学 面向言语行为分析的日语多模态语料库建设及其应用研究 刘玉琴 大连理工大学 一般项目 语言学 认知视域下日本政治语篇的隐喻学分析 刘桂萍 东北师范大学 一般项目 语言学 本质义理论框架下的日语格助词研究 许慈惠 上海外国语大学 一般项目 语言学 中国高校日语教师专业发展路径探索与模式构建研究 冷丽敏 北京师范大学 一般项目 语言学 日中韩语中的表人“比喻词汇”对比研究 施晖 苏州大学 一般项目 语言学 俄汉实 — 图构式的认知象似度研究 刘永红 华中师范大学 一般项目 语言学 基于平行语料库的俄汉语言学术语词典编纂研究 丁晓梅 大连海事大学 一般项目 语言学 俄汉文学叙事话语指称交际模式研究 黄东晶 黑龙江大学 一般项目 语言学 范式视域的俄罗斯语言哲学史研究 姜宏 复旦大学 一般项目 语言学 基于虚拟语境的俄语体验认知教学模式研究与实践研究 邵楠希 四川外国语大学 一般项目 语言学 山西晋语区“地方普通话”和“新派方言”的调查与研究 王利 长治学院 一般项目 语言学 网络新词生成与存在的语言哲学研究 谢萌 黑龙江大学 青年项目 语言学 网络语言中汉英习语变异的生态语言学研究 黄曼 深圳大学 青年项目 语言学 海南归难侨六十年语言与文化适应调查研究 岳朋雪 海南热带海洋学院 青年项目 语言学 译文接受效果的认知诗学研究 崔英 山东大学 青年项目 语言学 转喻加工亚型效应的实验语用学研究 李捷 仲恺农业工程学院 青年项目 语言学 类型学视野下趋向动词多功能性的语义地图研究 杨坤 西南大学 青年项目 语言学 基于概率模型的转喻识别英汉对比研究 张炜炜 上海外国语大学 青年项目 语言学 中国当代先锋小说英译及其在英语世界的接受研究 郑贞 解放军理工大学 青年项目 语言学 我国政府英文网站翻译质量评估研究 刘明 国防科学技术大学 青年项目 语言学 《论语》法译研究 周新凯 南开大学 青年项目 语言学 吴语人称代词的共时类型与历史演变研究 盛益民 复旦大学 青年项目 语言学 类型学视域下的吴语路桥方言语法研究 丁健 中国社科院 青年项目 语言学 湖南白族汉语方言研究 钟江华 湘潭大学 青年项目 语言学 满清中央政权语言政策史研究 张晓传 东北财经大学 青年项目 语言学 中东欧国家转型进程中的“国家语言”建构研究 何山华 扬州大学 青年项目 语言学 中医隐喻思维与隐喻话语研究 石勇 重庆师范大学 青年项目 语言学 我国主流英文报纸的中国话语构建研究 潘紫萌 西南财经大学 青年项目 语言学 西方媒体和中国外宣媒体笔下的“中国故事”叙事语篇结构关系研究 陈功 对外经济贸易大学 青年项目 语言学 第二语言学习者汉语篇章回指加工机制研究 程伟 暨南大学 青年项目 语言学 婴儿交际意图表征的心理语言学研究 郑小蓓 深圳大学 青年项目 语言学 中文阅读中字词加工年老化的眼动与脑电研究 刘志方 宁波大学 青年项目 语言学 高校英语教师教学信念与教材使用研究 张小东 北京外国语大学 青年项目 语言学 以二语认同为导向的多维外语教学模式研究 赵焱 西交利物浦大学 青年项目 语言学 中国大学生思辨能力的英语课堂评价和发展研究 周季鸣 复旦大学 青年项目 语言学 英语学习者协同互动能力评估体系构建研究 陈文雪 东南大学 青年项目 语言学 汉语国际教育案例资源研发研究 邓杉杉 湖北大学 青年项目 语言学 汉语作为二语的分级读物评估指标研究 钱彬 上海财经大学 青年项目 语言学 基于认知视角的来华留学生汉语辞格的理解及其应用研究 曹燕黎 东南大学 青年项目 语言学 两岸三地中国文学英译数据库建设与对比研究( 1951—2010 ) 张丹丹 齐齐哈尔大学 青年项目 语言学 19—20 世纪初闽台西方传教士闽南罗马字辞书与本土闽南韵书音系比较研究 马睿颖 福建师范大学 青年项目 语言学 日藏李登珍本韵书及相关文献与 16 世纪南京语音演变研究 封传兵 湖南理工学院 青年项目 语言学 甲骨缀合理论的整理与研究 李爱辉 首都师范大学 青年项目 语言学 明清时期南方方言文献文字研究 张荣荣 闽南师范大学 青年项目 语言学 基于写本文献的汉文大藏经异文研究 谭勤 浙江师范大学 青年项目 语言学 东亚朱子语录文献语言研究 潘牧天 上海师范大学 青年项目 语言学 域外汉籍《燕行录》词汇研究 谢士华 大理大学 青年项目 语言学 黑水城出土元代汉文社会文献词汇研究 邵天松 三江学院 青年项目 语言学 汉语语篇的语义分层与言者主体介入研究 仇立颖 上海大学 青年项目 语言学 互动语言学视角下的汉语应答语研究 谢心阳 上海财经大学 青年项目 语言学 选项语义学与汉语多功能副词的双向系统性研究 刘明明 湖南大学 青年项目 语言学 现代汉语量级含义的形式与功能互动研究 邓川林 北京外国语大学 青年项目 语言学 类型学视角下汉语违实范畴研究 雍茜 暨南大学 青年项目 语言学 类型学视角下汉语肯定否定极性逆转的限制条件研究 张汶静 上海师范大学 青年项目 语言学 汉语义位组合的规则及变异研究 袁世旭 河北师范大学 青年项目 语言学 汉语幼儿声调范畴化与词汇学习的交汇研究 陈傲 北京语言大学 青年项目 语言学 汉语发展性阅读障碍儿童青少年的执行功能干预研究 韩燕 重庆理工大学 青年项目 语言学 阿尔泰语系语言格范畴比较研究 钦德木尼 西北民族大学 青年项目 语言学 基于领域知识图谱构建的中国少数民族语言热点与前沿问题研究 杨媛媛 渤海大学 青年项目 语言学 比较语言学视野下的达翰尔语方言研究 郭玲丽 内蒙古大学 青年项目 语言学 面向信息处理的蒙古语话语标记研究 包敏娜 内蒙古师范大学 青年项目 语言学 中俄民族政策社会环境中的鄂温克语使用发展比较研究 金洁 内蒙古社科院 青年项目 语言学 类型学视野下的汉语和朝鲜语关系从句对比研究 崔惠玲 复旦大学 青年项目 语言学 回鹘文 — 汉文《大唐大慈恩寺三藏法师传》词汇研究 乃比江 · 艾比布拉 新疆大学 青年项目 语言学 察合台文文献《爱情书》语言研究 古力阿伊木 · 亚克甫 新疆财经大学 青年项目 语言学 纳西语方言地图集 和智利 云南师范大学 青年项目 语言学 类型学视野下中国境内南亚语系语言述补结构研究 王俊清 山西大同大学 青年项目 语言学 布依语名物系统调查研究 蔡吉燕 贵州民族大学 青年项目 语言学 基于汉英口译语料库的语块操作规范研究 李洋 东北大学 青年项目 语言学 语域变异视角下的英语现在完成式演变研究 要新乐 中国人民大学 青年项目 语言学 动态系统理论视域下中国学者国际发表中的身份构建研究 董记华 西北农林科技大学 青年项目 语言学 语料库辅助的涉港新闻话语研究 刘明 中山大学 青年项目 语言学 日汉语错位修饰的认知语言学研究 谢渊 暨南大学 青年项目 语言学 中日同形词搭配关系的异同与习得研究 王灿娟 北京大学 青年项目 语言学 基于汉文训读体系的日本江户时期四书注释研究 赵熠玮 南京理工大学 青年项目 语言学 类型学视域下汉语和日语的动词体范畴比较研究 许临扬 苏州科技大学 青年项目 语言学 基于语料库的中国政治隐喻俄译转换研究 孙秋花 黑龙江大学 青年项目 语言学
个人分类: 语言学探讨 Linguistics|12955 次阅读|0 个评论
6
luzheny 2017-4-29 22:23
6
个人分类: 语言和思维的本质|111 次阅读|0 个评论
汉字是百万年文明结晶和认知概括系统
热度 2 luzheny 2017-4-28 21:32
8000年前的大地湾文字 埃及圣书字、西奈字母、腓尼基字母、克里特字母,都有大地湾文字的传承,如: 山/sin/(深、深壑) 水/mem/(河、湖、没、沐),蒙语的mul即河,如阿穆尔(黑龙江)。腓尼基字母表中的水波形状,表示水,发音是/mem/;也表示河边湿地,发音是/nun/,即蒙语音的淖(尔),表明蒙语实际是远古汉语的分支。汉语北方方言是/neng/,即泥泞。 这个水波纹所象形的大地湾文字的读音,在国内找不到语音的证明。却由从埃及圣书字到腓尼基字母、希腊字母、罗马字母与英语字母的 M 与 N 保存下来,是8000年前黄土高原的语音特征和文字特征的证明。4万年前贺兰山岩画和大麦地岩画、美洲印第安岩画的文字与大地湾和半坡等仰韶文字结构相同,埃及圣书字到腓尼基字母、希腊字母、罗马字母与英语字母的 M 与 N ,还有这些文字的系统,确凿证明了汉字的起源时间、地域。 割(戈)/ga/。 打/da/(斗、争、粉碎、捣,图表内俄文的/T/等于汉语的/d/)。 宽式音标的音素是我对表中的俄语语音的转写。 汉语是几百万年人类文明特别是认知进化的结晶,是人类第四纪后期进化的先导。 汉字是黄土高原百万年华夏文明的结晶和认知概括系统,是4万年以来 全人类的认知和交流工具。 半坡以前的汉字最主要的特点就是线条化抽象,贺兰山岩画汉字、大麦地岩画汉字、美洲印第安岩画汉字(失去了黄土高原的人文环境是其没有在美洲运用的原因之一)、大地湾汉字、半坡汉字、腓尼基汉字、希腊字母、罗马字母、英文字母,一脉相承的是简洁概括(印章文字和表音位文字另文论述),这与苍颉造字以后的汉字不同。 苍颉增补了象形单字,并且“建类一首,同义相授”,创造了新的部首系统和转注造字法,以此造字法增加了上百倍数量的汉字。汉字的结构因而有些繁化。但是只要了解了六书造字的规律,特别是转注造字 由单字组合 的结构规律,学记汉字并不难。苍颉以转注造字法保留 了 汉字系统简明抽象的本质,又保证了汉字的传承,解决了数量不足,不敷使用的难题。 对不起苍颉的是,可能是从许慎 《说文解字》“考老是也”的转注例子举得不当 开始,两千年来误解了转注造字法,错误地把转注字 都 归类于形声字,失去了 原本的 转注造字法所开创的类化表达人类的类化概念系统的科学性、规律性和转注的深刻内涵 , 失去了建类一首的部首 的 “类化”挈领,同部首汉字无类可归,成为分散的无结构规律的形声字,没有声旁的也被归为形声字。基于百万年深厚文化根基而创造的科学化 的 汉字 类化造字与学习记忆方法,汉字六书中最后最科学的造字法,不再为人所知,西洋人因而看不到汉字的科学性。汉字差一点被取消 , 被也是源于假借表音汉字的拼音字母代替。 大地湾文字的照片是网上搜来的,谢谢网友“行走在西部的草原”!
个人分类: 语言和思维的本质|252 次阅读|2 个评论
黄土高原的地理环境导致华夏文明产生
热度 1 luzheny 2017-4-28 21:01
文明的进化,也是生物进化和物质有序化的过程。生物的进化,离不开物质基础;文明的演化,离不开地理环境。 文明是社会整体的智能、语言、文字、生产技术和文化的进化,不是个体或少数人能实现的。 从树栖转为地面生存以后,食物资源增加,但离开了高大树木的庇护,人类祖先的生存,首先面临猛兽的威胁,不得不进入天然岩洞。 世界各地考古证明,人类祖先经历了几百万年的洞穴时代。在此期间,人类的智能、语言随着石器、木器、骨器等的使用和制造,有了一定程度的进化,为离开洞穴准备了初步的条件。陡峭山石中狭窄的洞穴在为人类提供保护的同时,也限制人类祖先的进化。防水防寒、面向日光而又接近水源和食源的天然洞穴很少,无法容纳人口的繁衍和社会群体的形成,也就无法形成适合人类智能和语言进化的人文地理环境。所以,到几万年前仍然没有走出洞穴的人类群体,例如法国和西班牙几万年前能画出精美岩画的穴居者及其后代,未能创造出文字。洞穴周边的山地环境,既不适合搭建茅屋,也繁衍不出足够数量能在夜晚洞穴以外的茅屋中抵御兽群的人类群体。 大约至 115 万年前,手握石器,手脚运动功能灵活的直立人类,迫切需要从洞穴中走出来,摆脱限制进化的曾经庇护自己的洞穴,举目四望,到哪里去呢? 从260万年前开始,强劲的西北风把戈壁滩风化的砂石与细尘,源源不断地吹到从青海到太行山之间60多万平方公里的高原上。黄河及其支流,与降水和西北风一起,把最细的黄尘或冲或吹,播撒在青甘宁陕晋豫的 大地 上 , 水流又把黄土高原覆盖的平均一、二百米厚的黄土层,冲成沟峁塬梁交错的天然的巨大建筑工地,准备好了用之不尽的天然优质建材—细细的黄土,迎接华夏文明创造者的到来。 黄土高原的地理环境,是从200万年前新生代第四纪更新世中期到更新世中后期,最后一次冰期之前,地球上唯一最适合大规模人类社会文明进化的自然地理环境。 这里海拔适中,没有冰间期的海侵,不怕洪水的淹没;纬度适中,气候适合渔猎和发展农蓄业,也没有冰期的酷寒和冰盖。在一些低海拔地区文明遭遇海侵或洪水淹没而消失的时候,黄土高原能保持连续不断文明演化。 大约在11 5 万年之前, 以女娲为代表的蓝田人从长江三峡的岩洞出发,翻越秦岭,来到黄土高原东南边缘,成为 华夏文明的 开 创 者。他们 巧妙利用黄土高原沟峁塬梁交错的天然结构,依坡挖 出窑 洞,坡前为通道,坡顶防水, 用泥砖堵住 窑洞 出入口, 整体结构 可 防御猛兽 。窑 内居 可 住、制作工具和用品、贮物、饲 养 畜 禽 等等。 在窑洞外采集狩猎、逐渐发展农业。 这个石斧是磨制的,不是打制的 ,其结构合理,含有现代工具设计加工的智能因素,与世界各地的锥形及三角形石斧完全不同。这个石斧竖用适于挖掘窑洞,横用适合平整地面,应当称为石铲,这证明,蓝田人率先100万年进入新石器(萌芽)时代。我个人认为,这个石铲应当命名为“女娲铲”。 这样利用自然环境挖窑居住的方式,一直传承到现代,窑洞从低矮狭窄到高大宽敞,从少量到层叠连排,结村构镇,承载了从天然洞穴走出,到约5万年前延续约100万年的演化。 窑洞文明比非洲和欧洲的岩洞文明先进,文明发展水平的差距不是几千年,而是近百万年,所以黄土高原能产生最早的农业、制陶等手工业、结绳和卦易文化、最早的4万年前贺兰山及大麦地岩画文字、最早的陶文汉字,并传播到世界各地。 约5万至1万5千年前,一批又一批黄土高原的猎手、探险者等等,又从黄土高原陆续奔赴世界各地, 从贺兰山到 西伯利亚、白令海峡陆桥 、 美洲大陆 、 太平洋诸岛等等。 窑洞最关键的优势,是利于人口繁衍、结成大型社会,产生社会分工,分享和传承智能、情感,促进认知的深化和扩展与新概念的形成,进而促进新词汇的产生和语言交流与进化,促进文字创造和使用等等。 到更新世末期的 5 万年前开始,黄土高原的建筑不再限于窑洞,从茅屋和烧土建筑到 公共设施的 砖瓦建筑,到“女娲”观测天地万物、管理族群的高台,直到 五帝(《三才图绘》记载舜尚俭而不筑九层之台) 办公的“九层之台”,峁梁从此不再限制人类的眼界,九层之台建到了美洲大陆,成为玛雅金字塔,在故乡的九层之台被黄土和黄河淹没而同时湮灭历史的时候 , 玛雅金字塔成为5万年前华夏建筑水平和历史的证据。与玛雅金字塔一起保存下来的的记谱(结绳,记事治理的工具),有少量幸免殖民者的焚烧,成为华夏文明的活化石。 照片都是网上搜来的,谢谢拍摄和上传照片的网友!
个人分类: 语言和思维的本质|286 次阅读|2 个评论
【语义计算:李白王铿锵行】
liwei999 2017-4-4 20:20
【立委按】 “真心说,语言学虽然不是显学,乍看颇落寞穷酸,但的确是最有趣的学问之一,是少有的能与上帝同在和对话的“科学”。要不世界几千年美国几百年不世出的千古学霸乔老爷能以此扬名立万呢。” 当然,乔老爷的天下无敌的引用数与崇高名声,只能说最多一半是语言学的功劳,另一半是他的左派社会主义的独立知识分子情怀及其犀利的现实批判精神。 王: 这本书把我看晕了。 这本书把我砸晕了。 N1 把 N2 V1 V2 了。 V2和哪个N发生语义关系、发生什么样的语义关系好像比较好确定;但是对V1来说,如果不看具体的句子,好像就不能确定,当N1 N2与V1结合后,各自的论元角色是什么。 Me: 不确定这个句法树画得对不对…… 白: 要用次范畴 但是,如果句法的目的仅仅是确定“谁跟谁有关系”而不在乎“是什么关系”,是主是宾,根本无须过问。“看”和“砸”都有两个坑,“我”填一个,剩下的N填另一个。句法的任务就完成了。所以这两句的分析在我的体系里长得没差别: 王: 谢谢白老师!下一步确定哪个萝卜进哪个坑,是不是就是知识本体的工作了。 就是您说的次范畴设计,是不是就是在词库里设定一些语义相谐的规则,萝卜只能进和它语义相谐的坑。 白老师,您的体系里只有两种pos tag? 白: 利用subcat可以确定“我看书” 但“书砸我”并不典型。 “我砸书”也不是不可以。 N、S、X 三种 X意思是“可N可S”。真正排除“我砸书”需要常识或者统计,subcat并不能做出这样的区分。通常是“硬砸软”而不会“软砸硬”,人体属于“标配软”,书则“标配硬”,也不排除硬的人体(冻僵了那种)和软的书(帛书)。 王: 谢谢白老师指点! 白: 语义相谐不一定要通过规则,也可以通过统计。 subcat只对词条标注,不对短语标注。 注意到我画的图里,“我”一个萝卜填了“看/砸”“晕”两个坑。这是因为补语动词并入谓语动词,相应的坑不占同一个萝卜的额度。 王: 对, 李维老师上周推的文章 里好像也说了,本体是人编的,知识图谱是统计出来的,都可以用来判断语义相谐。 Me: 本体(ontology)也可以从大数据统计学出来 叫习得(acquisition),但跨领域的一般性本体不值得费劲儿去学。一来有现成的高质量的本体在 如董老师的 hownet, 语义大师 几十年打造的。跨领域跨语言的基本放之四海而皆准,仅次于上帝的工作。二来 学了半天 也难系统化 。但是 本体自动习得还是有一席之地,主要在,习得可以对领域 对数据有自动调适能力。更主要的是 习得可以包含本体常识的相谐的程度和或然性比较,这是人工标注 哪怕是大师的工作 所难以达到的。最终 常常是二者的结合。以专家本体框架为指导 以数据为对象 学出领域本体。 白: 相对标记,并不是每个本体都有的:“你打了他不该打的朋友。” 打,二价,但“朋友”自身仍有坑。 Me: 当然 玩本体 这种 元层次语义 需要一些修为 非新手可玩 玩了也不会用 。但是 玩知识图谱这种 倒是相对人人可为 基本就是个力气活,砸的是人力和计算资源,不需要一定有语义全局的高度。 白: 标注种子词条,习得种子关联,推荐更多词条,推荐更多关联。所谓bootstrap。 Me: 另外 所谓相谐(semantic coherence, or, attribute-value appropriateness) 是元知识 是本体的属性和功能 与一般的知识图谱无大干系。如果硬要 argue,在碎片化信息抽取整合成知识图谱的过程中,领域概念之间的相谐蕴含在图谱中,也不是没道理。但是关键在,相谐是作为一个软条件帮助语言分析理解,从而帮助抽取挖掘图谱的。图谱是结果,达到结果了 相谐已然过去式了。过河不必拆桥,但桥是为过河而设置,过了河就没桥什么事儿了。 另,“subcat只对词条标注,不对短语标注”,白老师这话不错。不过短语也可以继承词条的 subcat,继承的时候 已经填坑的要“折算”。换句话说 短语的 subcat 坑减少了。减少为0的时候 就功德圆满了 就没有了 subcat,譬如 s,那是最高的短语。 白: 坑的subcat没了,自身作为萝卜的还有 Me: 当然 譬如右嵌套:s 可以作为子句 作宾语,是VP的右嵌套。这时候不圆满还不行 不圆满就做不了所要求的宾语子句。语言学理论里面 把这种条件叫做 configurational constraints, 也就是乔老爷的 x bar 的条件。如果这个条件要求的是尚未圆满(not fully saturated, or partially saturated) 的短语,就带着未填满的坑前行,各种好玩的语言逻辑的戏就开场了。 白: 如果词负载结构,这一切都在填坑中自然完成,无需另外的句法来“制导”。 Me: 譬如 【书砸我】 还是 【我砸书】 这样的公案就出现了。到了 【书看我】 还是 【我看书】,本体常识或本体统计可以发力,当然 这种强搭配也可以不劳驾本体,而是当成词法或词典与句法的交互和接口,但是不强的搭配太柔软,句法就无计可施了,只能 identify 可能性 不能确认语义的唯一性。本体或反映本体的大数据 不得不上场。如果由于数据稀疏 上场了也不能解决 ,那只能保留歧义 有可能本来的语言表达就是双关。 真心说,语言学虽然不是显学,乍看颇落寞穷酸,但的确是最有趣的学问之一,是少有的能与上帝同在和对话的“科学”。要不世界几千年美国几百年不世出的千古学霸乔老爷能以此扬名立万呢。 【相关】 【语义网笔记:本体与知识图谱之辨】 《 语义三巨人 》 《泥沙龙笔记:知识习得对本体知识,信息抽取对知识图谱》 【泥沙龙笔记:再谈知识图谱和知识习得】 中文处理 Parsing 【立委科普:信息抽取】 【关于知识图谱】 【置顶:立委NLP博文一览】 《朝华午拾》总目录
个人分类: 立委科普|3966 次阅读|0 个评论
【骨灰级语言学家开讲段子小品】
热度 5 liwei999 2017-2-26 03:26
走在路上瞎琢磨,突然脑中冒出句俏皮话的段子: 天下无贼 贼有看头 why 好看啊 我是问 无贼 怎么有看头呢 白老师曰 相声的段子就是这么来的。 马: 贼有看头,估计有人看不懂这句 想起一个段子。 一个人去东北出差,问东北人宾馆是否好找,答曰:东北宾馆贼多。于是吓得不敢去了。 哈 马老师这个更好。 今天有闲,侃侃这个即兴段子的语言学。这样的对话在语言学家眼中有些什么看点呢? 从语义计算的角度,并不是下述每一个点都那么容易形式化、模型化,但是人机对话要想逼近人类对话的高度,这些方方面面迟早要被 addressed。 看点 1. 专名与字面语义的纠缠:《天下无贼》 自从摈弃了上世纪30-40(?)年代流行过的书名号(一种括号)和专名号(下划直线或波浪线:据说后来嫌排版麻烦,就逐渐舍弃了)以后,这个纠缠就很 annoying。这是不同层次的纠缠,但没留下形式痕迹。通常的做法是指望有一部专名大辞典,搜罗进去的遵从 hidden ambiguity 的休眠原则。于是,“天下无贼”被词典识别为默认的电影专名,其内部的语义结构(小句结构)则被休眠。 2. 两个贼的纠缠 自然语言有一个广为人知的属于 discourse 范畴的 heuristic,叫做 one sense per token,说的是,一个token在同一个discourse里面重复出现,那么这个token的所指是相同的。有数据证明,这个 heuristic 的准确率非常高。于是,两个“贼”因为这个 heuristic,就埋下了一条伏线:同指(coreference)的 heuristic 一线与不同指的 heuristic 例外的一线。我们知道,凡 heuristic 一律有例外:再高的精确度,也有不灵光的时候。 其实,这个例外也有人研究过,例外里面还是有规则。规则就是,如果一个token隐藏在一个成语(计算语言学所谓成语包括术语、专名和其他的合成词)内部,那么这个token就不(必)遵循 one sense per token 的原则。 3. 贼的内部歧义 贼的标配定义就是 blah blah 的【human】。不知何时,好像是早先来自我们东北兄弟,开始用“贼”表达程度(副词),感觉贼形象、贼酷。这个用法显得别致、匪气、接地气,进而渐次推广到全国,尤其在网络用语里面。于是,贼的 hidden ambiguity 出现了,(i)默认的名词【human】和(ii) 程度副词。 4. “vt头”的语言学 (有).... 看头、吃头、玩头 这事儿咱从头说起。汉语是孤立语,一般认为没有欧洲语言的形态(词尾等),也没有严格意义的前缀后缀。如果n个词素(morphemes)组合成了一个词典单位,通常的说法就是合成词(compounding),而不是有明显主干枝叶之分的派生词(derivatives)。但语言是发展的,从古汉语甚至合成词都极少(这是“孤立语”的本义,孤立语的典型和极致是没有 morphology的)、一切都是 syntax,逐步发展到现代汉语,汉语的孤立特性在明显降低。有些所谓类语缀(quasi-affix)的语言学材料开始出现。换句话说,汉语有朝着印欧语言的方向演变的蛛丝马迹。 “头”就是一例。 “看头”,不是句法的动宾: 看(了个啥)头 ; 也不是通常的合成词的定中套路: (所)看(的)头 。 而是一个特别的后缀,其派生词的构词法与句法的接口,可以这样来做形式化的描述(by the way 我的博士论文专门有一节论汉语的类语缀现象): NP 有/没有 Vt-头 ==》有/没有 VP{Vt NP} 的【value】,VP {Vt NP} 结构自然是典型的动宾式动词短语。 细究的话,这里面还有“学问”: 其一,Vt 不仅要求及物动词,而且要求是单语素(说白了就是一个汉字),两个汉字可能吗?也许由于灰色过渡的存在,可以找到个别的例子,但感觉不是很多: ? 这本书有学习头吗 ? 这个课题没有研究头。 * 这个曲子有弹奏头。 到了二字以上,那就绝对违法了。(MD 想一个三字的及物动词还真不容易:汉语的双音化太突出了。算了,不想了。) 其二,这个搭配句式中的 有/没有 不是 “拥有” 的“有” 而是“存在”的“有”,相当于英语的 (there) be or (there) exist。因此这个 V 的唯一的 arg 前置到主语的位置和后置到宾语的位置,语义关系不变: 这本书有看头 ==》 (i)有看这本书的价值 (ii)看这本书的价值有。 (后者头重脚轻,稍微有些不顺,但句法上是可以自由语序的, cf: (的确)存在看这本书的【价值】 看这本书的【价值】(的确)存在。 其他看点还有,譬如 “why” 和 “怎么”(字面意义是 how)的逻辑语义其实是一样的,问的是【原因】而不是【方式】。累了。歇了。只是记住一点: 自然语言里面的名堂,比我们每天说话的人想象的要丰富很多。希望年轻的 NLP 后学不要小看这门语言的学问。至于老人,那就不用指望了。 傲慢与偏见 ,爱咋咋。 【相关】 【NLP主流的傲慢与偏见】 【NLP主流的反思:Church - 钟摆摆得太远(1)】 【Church - 钟摆摆得太远(5):现状与结论】 中文处理 Parsing 【置顶:立委NLP博文一览】 《朝华午拾》总目录
个人分类: 立委科普|6129 次阅读|5 个评论
【李白之27:莫名其妙之妙,妙可道,妙不可言】
热度 1 liwei999 2017-2-6 16:35
我: 想到一个 minimal pair: (1)他莫名其妙。 (2)我莫名其妙。 单说,第一感觉是(1)(2)均无歧义。但对比看,就看出“莫名其妙”的歧义来。查词典,原来有两个义项: 莫名其妙 【解释】:【1】说不出其中的奥妙,理解不了其中之巧妙,比喻深奥让人不明白, 可带讽刺意味。【2】不知道到底是怎么个情况。 根据主语人称的不同,默认的义项随之不同:感觉第三人称主语(1)的标配义项是【1】,而第一人称主语(2)的标配是【2】。非标配的义项,在没有更大的上下文的时候,休眠了。 从语言学的不同维度,这个区别可以说是: (a)vi 【1】 和 vt【2】 的歧义; (b)也可以说是 adj 【1】和 v【2】 的歧义(反正vi和adj在汉语也可算一家); (c)成语义【1】与字面义【2】的歧义; (d)黑箱【1】与白箱【2】的歧义; (e)当然还可以说是 sentiment (“莫名其妙”的黑箱有讽刺贬义色彩)【1】与 neutral 【2】的歧义; (f)甚至还可以说是(隐式)被动【1】与主动【2】的歧义。 因为人的本性,通常不会自贬,因此第一人称做主语,贬义解的可能大为降低,因此(2)“我莫名其妙” 默认为白箱义。而当用于第三人称(其实是非第一人称)的时候,通常的理解都是黑箱,忽略了白箱的可能。这符合成语默认为黑箱的一般规律:毕竟第一人称是个案,而非第一人称则是常态。 白: 其实不是。“他莫名其妙”是“他使人感到莫名其妙”“我莫名其妙”是“我感到莫名其妙”前者是后者的使动用法。 我: 也好。又增加一个语言学范畴的维度: (g)也可以说是使动【1】与自动【2】的歧义。 白: 当别人表示我使之感到莫名其妙时,我可以反问“我莫名其妙?blahblah” 一般情况下,“我莫名其妙”并无歧义。 我: 我的语感是:一般情况下,“他莫名其妙。” 也无歧义。 语感的差别? 白: 对 因为感到莫名其妙是主诉,无须代劳。 我: 他这人莫名其妙。你怎么会喜欢上他呢? 白: 只有这个。与非第一人称相配的,是使动用法。这是标配。 我: 更多的有趣案例: 对于莫名奇妙,我莫名其妙。 白老师洞若观火,黑老师莫名其妙。 谁莫名其妙? 你才莫名其妙。 当然,(1)和(2)也都可以是歧义。这一切,都可以在更大的上下文中,被反转过来: (1a)对于此事,他莫名其妙,一片茫然,手足无措。 (2a)我承认我莫名其妙。(我就是个无厘头,不要理我好了。) 白: 反转的桥段可以有。对非第一人称,如果明示相对的事物,则变成“对该事物感到莫名其妙”之意。对第一人称,如上所述,在反问、抗辩乃至退无可退的认账情景下,可以转化为“我令人感到莫名其妙”之意。这些都是只有特设性条件才能激活的非标配解读。 我: 道可道,非常道。莫名其妙之妙,妙可道,妙不可言。 【相关】 【李白对话录系列】 中文处理 Parsing 【置顶:立委NLP博文一览】 《朝华午拾》总目录
个人分类: 立委科普|2813 次阅读|3 个评论
信息基本定律:用双字棋盘可验证。美国科学年会2017展示
geneculture 2017-1-15 06:26
信息基本定律:用双字棋盘已证成。邹晓辉Geneculture https://aaas.confex.com/aaas/2017/poster/papers/viewonly.cgi?password=598206username=20325from=timelineisappinstalled=0 三大基本定律所属多学科迭交领域:序位逻辑,双语数学,广义翻译。既属于信息学基础研究成果,也属于语言学基础研究成果,还涉及思维学基础研究成果和其它相关学科及其交叉研究领域的研究成果。1,2,3,足矣!信息基本定律:用双字棋盘可验证。 它是理论融智学的序位逻辑信息学基础研究成果、工程融智学的言识软硬形式化系统工程即双语数学语言学基础研究成果和应用融智学的教管学用社会化系统工程即广义翻译教育学基础研究成果。 我这次应邀去美国出席科学年会展示我自己的研究成果是:我发现的信息基本定律(它与物质和能量的基本定律的地位是类似的,对于人类而言,它们都处于最基本、最关键和最重要的地位)--它具体包括:序位逻辑基本定律即本真信息存在公理,广义文本相互转换的两个基本法则(即具体的形式信息分别在同义且同意两类并列情形下的对应转换务必遵循的两个基本定律:一方面是双语数学孪生矩阵具有相同的序位结构,另一方面是广义翻译在上述序位逻辑和双语数学的约束条件下只要具有智慧能力的主体及其智能代理彼此同意即可建立相应的广义双语对)。信息基本定律:广义双语处理的基础理论 http://sciforum.net/conference/isis-summit-vienna-2015/paper/2914/download/pdf 。 它是理论融智学的序位逻辑信息学基础研究成果、工程融智学的言识软硬形式化系统工程即双语数学语言学基础研究成果和应用融智学的教管学用社会化系统工程即广义翻译教育学基础研究成果。
个人分类: 双语信息处理|651 次阅读|0 个评论
【李白之16:小词负载结构与小词只参与模式条件之辩】
liwei999 2017-1-6 18:52
白: “是他杀的张三”是一个完整句子吗? 主谓宾都在哪儿? 我: shi S Vt de O ==》SVO 很常见的句式,主谓宾齐全, 是 S V 的 O == S V 的 O == SVO 不过其中 “SV的O” 有歧义,因为与带定语从句的NP同形。 不过加了强调小词 “是” 在句首以后,似乎歧义就消失了。 白: “是”当什么?自己没有主谓宾? 我: 是数学我不喜欢。 是在北京他们开的董事会。 是1990年我毕业的。 句首的“是”,是强调小词。 类似于英语的强调表达法: it is X 。。。。 it was in 1990 when I graduated It was in Beijing where we got the deal 白: 可否认为“张三是他杀的”,然后“张三”后移到句尾。 我: 张三是他杀的 ==》 是他杀的张三 ? 张三他杀的 ==》 他杀的张三 白: “是他杀了张三”可以这么做。“是他杀的张三”不能。 “是他杀了张三”跟“有人敲门”是一个性质,在坑论里是两个谓词合并,共享一个萝卜。 但“是他杀的张三”不好套用这个结构。没办法把二元关系进行到底。不仅“的”捞不出来,连“是”还得搭进去。 我: “的” 字的两个用法:1 定语标志(或所有格);2. 肯定语气 表示肯定语气的 ”的“,通常位于句末,也常与表示肯定或强调的 ”是“ 搭配使用: 是 XP 的 貌似由此衍生出表示肯定的 ”的“ 用于谓宾之间。 “是他杀的张三” 说的是对过去或完成的肯定,但是却不允许用助词 ”了“ 或 ”过“,原因可能是这个位置被 “的” 占据了。另一个原因是 这种肯定语气蕴含了完成。肯定的行为动作不可能是没有发生的事件。 在 pattern 中,只要能列举出这种即可,很容易捕捉,除非是歧义。 白: 表达什么先不管,谁跟谁有关系是首先要解决的。 我: 没有句首“是”的pattern “SV的O” 的确有歧义,但是这种歧义是 consistent 的。对于consistent 的歧义,其实不难处理,可以将错就错。直到错到某个点,系统觉得应该校正了,就校正。现在的处置是,开始 parsing 的时候,一律做定语从句看。 白: 有套路,就把构成套路的词摘到二元关系之外,语言学上不够简约。 前面说到的踢出机制试了几个例子,很好玩,基本通了。 我: 有套路,就把构成套路的词摘到二元关系之外,没有问题啊。因为小词已经在套路(patterns)起到了该起的条件作用,譬如 “是+S+V+的+O”,在这个 pattern 中,没有歧义, SVO 被确定,逻辑语义被解构,一抓一个准,完事了,把 “是” 和 “的” 这种句法辅助小词挂起来。这是pattern的天经地义。pattern 比起二元关系环环相扣的 parsing 有不同的优缺点:pattern 可能比较长,上述 pattern 是个五元组,实词的元是XP,所以实际的跨越可能是很长的 string,用的是长度来换取确定性,牺牲了某种抽象性,或换句话说,带来了一些规则的冗余度。二元关系环环相扣的做法,可能更加简约和概括。 白: 做系统咋都行。做句法。感觉非常实用主义,理论上不连贯。 我: 句法标配说的是 sv 语序,多数系统都用的。你的系统先不用,是例外。 白: 我这不用。至少matcher不用。以后语义模块用另说。 我: 虽然汉语语序很操蛋,孤立语中它自由得简直不讲道理,但是 sv 是默认,有统计性依据,也有心理认知的依据。这一汉语句法标配的形式痕迹,不用白不用。 白: 用了也有误导的时候。 我在尝试踢出边的功能:一个强搭配萝卜进来,在坑饱和的情况下,踢走一个已经进坑的萝卜,自己跳坑。如果没有不占指标的额度的话。一进一出,不破坏结构,不重构结构,也不改变结构对外部的联系。与所谓“回溯”大不一样。拔出来的萝卜再进什么坑,全看后续发展。 我: 所以句法结构的时候 可以不利用语序,因为这个结构的标签暂时不不用给出。其实这是跳过句法标签,直接在下一步进入逻辑语义标签。但传统做法是区分 arg1 arg2 arg3,现在是不区分 只说这是arg,有别于 mod 就可以了。 白: 但是各个arg如果subcat不同的话,需要锁定,免得互相串了。 我: 所以是标签隐藏在后面,暂时不露而已。 对,免得互相串了 是必须的。 白: 如果连另一个可能性都没有指出来,焉知落地想要的不是另一个? 我: 这个问题哪里会有?是落地的需求 drive 开发呀。世界上哪里有飘在天上搞开发的呢。何况开发这事儿也不是一锤子买卖。今天没有的可能性,明天加上可能性也是可以的。系统不可能是一成不变的。pattern 不变的话,在结论上增加点什么,连重新测试都不需要就可以搞定,有何难哉?更何况 我们 patterns 用完小词以后,还发扬了革命人道主义,并没有扔掉敲门砖,还用 X 把小词给挂上呢。所有的痕迹都在,过河没拆桥。不过是不让过了河的桥和敲了门的砖占据我们的语义核心地位而已。 小词负载结构,我的理解,本质上也就是一个过渡,一个粘结剂,一个特定的 parsing 算法所依赖的一种手段,并不是一种必需。小词成为条件,则是一种通用的必需,因为没有小词,结构关系就很难搞定,这是小词存在的理由。 白: “杀人犯把卖盐的杀了化妆成卖盐的在那卖盐。”杀人犯是卖盐的? 我: 那句话一时看不懂,但 point 明白了。你是在诘问 把“S是V的”处理成 SV 的做法。它们不等同,不仅仅是 affirmative 的差别,还有另一个差别在。这个差别是,“S是V” 的 可以回答 “S是谁” 的问题,而 “SV” 不能回答 “S是谁” 的问题。好,这是一个典型的语义落地决定如何表达的例子。现在的问答系统的语义落地有对这两种结构做区分的需求,那就让第二个pattern在输出表达中,把这种需求满足即可。譬如,可以让第二个pattern (S 是 V 的)输出这样的结果: arg structure: S V feature: affirmative answer: who is S 白: 杀人犯不是卖盐的VS杀人犯不卖盐 这些零碎副词加在affirmative上还是加在普通谓语上怎么区分? 我: bottom line is pattern1 和 pattern2 是两个独立的捕捉,二者该怎样处理都可以,加在哪里都可以。加在哪里落地好用,落地觉得有用,就加在哪里。这都不是事儿。媳妇都娶回家了,怎么打扮还不是男家一句话吗? 白: 那就是说实际上做了两个谓词,简化成一个谓词是伪命题。而小词负载结构,只不过把两个谓词显性化而已。 我: 早早年的parsing,其原始定义记得是没有parse tree的表达的。什么都没有。就是一个合法非法的结论。所谓合法的结论,就是 parser 把那个句子从头到尾都吃进去了。 白: 判定问题 我: 后来的 tree representation 或其他的表达,全部是 parsing 过程留下的痕迹,或副作用。这样看parsing就明白了娶媳妇是核心,打扮媳妇是具有任意性和功利性的副产品。小词负载结构如果能在语义上表现出贡献,那么这种贡献可以等价地由 pattern 给出。换句话说,如果某种用小词作为枢纽来区别谓词的表达法,对于语义落地有益,那么没有人可以阻挡pattern的编写者,输出同样的表达。但实践中,我们知道,其实绝大多数时候,这些小词丢掉了,核心语义没啥损失。譬如 小词 “把”点名了宾语的所在,借助它表达出宾语的核心语义以后,“把”的使命也就完结了。 白: “把”和述补结构连接,绝不是只有“宾语”这一个含义。参照“他把眼睛哭肿了。” 我: 小词负载结构的语义贡献注定是有限的小词的本质就是句法的显性形式,在句法走向逻辑语义的过程中,形式走向内容。表层走向深层。言语走向逻辑。这种趋向决定了小词负载结构基本是边缘的语义。换一个角度看这个问题,小词是 language specific 的,而语义的本质是人类共通,language-independent 的。language specific 的东西不会在语义里面唱主角。 30 年前,董老师提出,以人类共同的逻辑语义作为机器翻译的基础,而不是在句子表层实施转换。这样一来,不仅用了不同小词和词序的主动语态和被动语态被认为是相同的,而且动词与deverbal的名词也被认为是相同的。因为其 arg structure 的核心逻辑语义都是相同的。用它指导 MT 就是: I translated A from B into C == A is translated from B to C (by me) == my translation of A from B to C == 我把A从B翻译成C 当时觉得董老师的做法的确抓到了要害,但也觉得表层的小词和细微差别(譬如语态)也不能就这么扔了。最后的体会和结论是: 在语义落地的时候(譬如MT),逻辑语义是主要的,表层结构是辅助的。做到了逻辑语义的转换,基本任务可以算是完成了。但是要想做得更好一点,还可以参照表层结构或features,再做一些细节上的调整。譬如 英语是被动态的,也许也翻译成被动态更合适(其实,由于两个语言的显性被动表达形式具有不同的使用频度,只能说,部分的被动态用汉语的显性被动为宜,其他的被动态可以用隐性的被动形式,最后还有一部分被动其实更合适用汉语的主动态来翻译,这个要细细研究的话,可以针对不同情形结合表层和深层结构写一大篇来)。 总而言之,小词和表层,顾不上来的话,扔掉了也没啥大不了的。这些边缘的语义色彩,对于语义落地的不同场景或许可以有参照作用,但不是核心。 白: 实际情况是,逻辑语义也是人参照表层写出来的。本族语表层研究不到位,就只好迁就着走。就好像grandma不知道是姥姥还是奶奶。并不是他们说英语的人逻辑上不能定义和区分爸爸的妈妈还是妈妈的妈妈。我们要高频率地使用,就不能绕着走。 我: 这样看也是一个角度,有其道理。 理论上,逻辑语义应该是参照多数的人类语言提出来。基本立足点就是,人类的概念和思维是共同的,理解也应该是共同的,只是表达的时候穿了不同的外衣。当然,语言对思维也有反作用,因此人类思维和理解的共同性,只可能是大同小异,而不可能是完全一致。 白: 共同性体现为外衣的并集 如果主要外衣缺失,就谈不上共同性了 【相关】 【李白对话录系列】 中文处理 Parsing 【置顶:立委NLP博文一览】 《朝华午拾》总目录
个人分类: 立委科普|3011 次阅读|0 个评论
浅谈类型论——开场白
saif 2016-12-27 01:32
信息时代,计算所带来的科技革命彻底改变了我们的生活。一些人,一只手机在手忘记所有;一些人的网瘾堪比毒瘾,戒网戒手机已经成为21世纪初叶的心灵鸡汤,但这种景象在30年前还是难以想象的。 如果你喜爱电脑,或许你还会喜欢编程。如果你喜欢编程那你一定会有心仪的程序语言;如果你懂编程语言,你或许知道面向对象和函数式编程;如果你恰好懂得函数式编程,有很大的几率你知道lambda演算,monad,但是你知道类型论吗?懂得类型论的人肯定不多,但是所有人都知道“类型”意思。 类型,是一个常用词,分开看,类,物以类聚,人以群分,所以相似的对象、观念、思想我们可以归类;型,相当于一个模子,归纳一系列相似的行为、操作、流程,所以“型”又叫模式。这样看,类型其实是人类认识世界最有效的工具,用类型我们可以将世界上成千上万数也数不清的“东西”归纳成让大脑可以容纳的“类”,而“类”的性质、行为、动作可以归纳成“型”——模式,也就是我们常说的“行为模式”。类和型放在一起,就可以看做是有相同或相似行为模式的类的聚集。 如果你恰好对计算机编程感兴趣,那么类型对你就有了更实在的现实意义。你知道同样是3,它的类型可能是字符也可能是数字。任何一个普通名词都可能是一种类型。从哲学的角度,类型回答了一个本体论的核心问题:什么是存在?一个实体的类型就是它存在的理由。而且客体所具有的类型越多对我们人类来说就越容易认知。如果把“幸福”当做一种类型,能说清楚它的真正意义的大概只有哲学家,而把“有车有房”当做一种类型的话,那么人人都是哲学家。 但是,什么是“类型论”?这里,我们先说它不是什么。它不是人生哲学,不是心灵鸡汤,不是致富法门,更不是命理算术。 类型论是一门精密严谨的科学,它即枯燥又有趣,对它的学习过程,是一种典型的“痛并快乐着”的体验。 类型论在科学花园中的位置,大概处于数学、逻辑、计算和语言学的交界处,可以说它生于逻辑,长于数学,开花于计算机科学,结果于语言学。用不那么修辞式的直白说法就是:类型论是20世纪初为为解决逻辑悖论问题提出的解决方案,但是对类型论的形式化研究一直是在数学领域,类型论研究直接导致了一种计算模型的出现,成为理论计算机科学中一个重要分支。对类型的哲学讨论,虽然可以追溯到古希腊亚里士多德时代,但是近现代哲学、特别是数学哲学对类型论的讨论被认为是从弗雷格开始。而Richard Montague从上世纪70年代开始提出了基于内涵逻辑和类型论的语义学,从此类型论成为语言学中重要的工具。 作为和图灵机并列的计算模型,类型论在计算机刚刚面世的10几年中并未如前者成为理论计算机科学的支配性模型,它大器晚成,直到上世纪60年代之后才逐渐为人所重视,并有所发展。其中最重大的成果就是将逻辑学中的证明论和类型论统一为一种理论。如果说图灵机是在无限长度纸带的读写过程,将计算的模型归结为是自动机,一种机器模型,那么,类型论则把计算模型当做可计算函数,它所研究的就是抽象意义的函数,它抽掉了通常数学意义的函数概念,没有数的概念,它抽掉了函数的处理过程的概念,研究函数的本质,将函数这个概念,上升到一种哲学的高度。对类型论的形式化表述,是一种介于数学和逻辑的语言,称作λ-演算,或者lambda演算,或者全中文:兰姆达演算。而在当代,这种模型逐渐成为显学,具体的表现形式就是另一种编程范式——函数式编程在上世纪80年代的兴起。 类型论的出现,打破了学科之间的藩篱,让一些表面看上去毫无关联的是东西表露出其实是一件东西的本质。类型论使得函数概念不再是数学和逻辑的专利,它使得函数深入到哲学、语言学等领域。 如果能对类型论有一定的理解,那么也会让我们以一种统一的模式看待数学、逻辑、计算、语言学和哲学。这也是科学的进步本质之一:用更加统一的、更加简单的模式理解这个复杂世界。 本系列小文,将探讨类型论的前世今生,但不会讨论函数式编程,更不会讨论特定的编程语言,因为这方面的资源很多。我们只讨论类型论的演进过程,在历史和现实中的作用,以及它的基本内容。如果你恰好也想了解类型论的理论,那么这将是一次激动人心之旅,因为我们将看到数学、逻辑、哲学、计算和语言学中许多不同的概念如何可以统一在类型论下。 中世纪的经院哲学家托马斯·阿奎那曾经说过: One should realize...that if we consider these four, namely wine, king, woman, and truth, in themselves they are not comparable because they do not belong to the same genus. Nevertheless, if they are considered in relation to some effect, they coincide in one aspect, and so can be compared each other. (应当认识到,当我们在孤立地(in themselves)谈论这些概念,亦即,红酒、国王、女人和真理时,它们是没有可比性的, 因为并不属于同一类别。但是如果将其放在某种效应的关系上谈论,这些概念将在某个方面重合使得我们可以对其相互比较。)
个人分类: 计算|4486 次阅读|0 个评论
人类知识基本范畴体系顶层设计的最大本体
geneculture 2016-10-3 03:35
内心的选择,口头的选择,笔头的选择,行为的选择(这是一个由内而外的收敛过程)一个比一个受到局限。由此可见,内与外,心与物,思想(认识或认知)与行为(活动或做),位于两极。语言(说)与文字(写)位于两极之间。于是,在外在的物体与内在的意念之间,中间的文本也就随之被凸显了出来。这就是物意文三大类现象信息被逐步认知的历程。至于其后的本真信息直到最后才被完整地发现并被认知也就不足为奇了。本人有幸在洞悉到了本真信息之后的若干年内就得到了联合国教科文组织赞助的第七届世界本体论学术大会(西班牙•神塞巴斯坦)的正式邀请到会宣读了自己的这一重大而根本的发现--它不仅得益于经验科学的可预言性验证,而且,还得益于理性哲学的可反思性论证。基于它本人建构了人类知识基本范畴体系顶层设计的最大本体,从而,最优化了顶层分类架构。其影响是深远的,其作用是巨大的,其价值和重要性是空前的。这在我谈信息科学基础研究、信息哲学和五个文明的多篇文章中都有某种阐述或介绍。--邹晓辉Geneculture 图1是(由语义三角与文法的结合以及意义的形式化拆分发展而来的)融智三棱锥或信息四面体示意图。 附录:【 德国哲学家叔本华曾说过:“人人都在生活,好像生活在同一个世界上,但是实际上每个人眼中的世界是不一样的,每个人都只能按照他的内心世界的限度来看世界。”而你的内心世界是丰富还是贫瘠、是多彩还是单调、是温柔还是残暴、是小确幸还是大无畏……或许都能归结到一件事——你爱不爱阅读。 读书不仅能养心还能养颜 周国平 为什么要读书,我觉得这个问题和一个人为什么要活着是分不开的。如果说一个人对于人生怎么有意义地度过是无所渭的,那么这样的人当然可以不读书。可是,如果你对人生的意义是在乎的,要把人生的价值体现出来,不愿意虚度这一生,那么,读书对于你就非常重要。 其实我们平时可能都在读书,但是有不同的目的,我分析了一下,大约有三种目的。 第一种是为了实用的目的,譬如说你的专业,你的职业需要你读一些书,或者你读一些炒股的书、养生的书,如果你光有这样的读书,我不认为你是一个有阅读习惯的人。 第二种目的是消遣,工作累了,业余的时间翻翻报纸,上上网,看看八卦新闻,或者拿一本书在手里,纯粹是为了放松一下,这也不属于我说的阅读。 那么在我看来,第三种阅读才是真正的阅读,就是作为精神生活的阅读,通过阅读,你感到精神上的愉悦,得到精神上的提升,从书籍中汲取精神营养,让自己在精神上成长,内心变得丰富、充实,只有这样才是我们所提倡的阅读。】
个人分类: 学术研究|704 次阅读|1 个评论
【语言学小品:送老婆后面的语言学】
热度 2 liwei999 2016-7-4 21:57
谁会误读?为什么误读?研究一下背后的语言学 and beyond。 双宾两个坑 human 默认的坑是对象 “老婆”是“送”的对象,这是正解。 对于心术不正的人 human 也可以填受事的坑,“老婆”跟礼物一样,成了“送”的受事。 这是 “送” 的歧义,到了 caption 里面的合成词 “送给”,subcat 有细微变化,就没歧义了。为什么 “送-个” 也没歧义呢?因为“个”是不定的,而对象这个角色通常是有定的。 这里面细说起来还有一摞的语言学。 (1)双宾句型的对象一般是有定的,不定的对象不是绝对不可以,譬如: “我把一大批书送(给)一所学校了。” “一所” 是不定数量词,作为对象。 汉语中的 “一+量词”与光杆“量词”通常认为是等价的,范畴都是不定(indefinite),后者是前者省略了“一”而得。但是二者并非完全等价。 对象这个角色默认有定(definite,虽然汉语没有定冠词),如果是有定,不可以省略“一”,或者说,不可以由带光杆量词的NP充当。 汉语句法里面可以总结出这么一条细则:带有光杆量词的NP只能充当直接宾语,不能充当间接宾语(对象)或其他。 (2)再看合成词 “送给” 里面的语言学。 汉语反映双宾概念的语词,常常可以进一步与“给”组成合成动词,意义不变,但注意合成前后的subcat的微妙变化:“送” vs “送给” (寄给,赠给,赠送给,等) “送”的 subcat patterns: (1) 送 + 对象NP + 受事NP: 送她一本书 (2) “把”受事NP+送+对象: 把一本书送她 (3)受事NP+送+对象: 这本书送她了 (4)送+受事NP: 送个老婆 (5)送+对象NP(human,definite):送(我)老婆。 请留心(4)和(5):两个patterns有相交竞争的时候,于是歧义产生。当“送+给”构成合成动词后,subcat 的 patterns(1)(2)(3)(5) 保持不变,而(4)基本失效(退出)了。说基本失效,是因为:虽然 “送给老婆”只能循 pattern 5,但“送给个老婆”(稍微有限别扭,但仍在语言可接受之列)似乎仍然需要理解为 pattern 4,这是怎么回事呢? 这就是语言的微妙之处:pattern 4 本来应该退出,因为“给”已经决定了后面是对象而不是受事;但是因为汉语有另一条很细但是很强的规则说,光杆量词的NP只能做受事,不能做对象或其他。在这两条规则(pattern 5的对象规则与光杆受事规则)发生冲突的时候,后一条胜,因此“送给个老婆”就不得不做 pattern 4 的受事解了。这叫规则与规则打架,谁胜谁输也是语言学的一部分,电脑实现的时候可以运用一个priority的机制来model。 上图还涉及一个常见的促销句式: 买NP1送NP2 买iPhone 6 送耳机 买 Prius 送三年保修 这个语用句式的存在,加强了NP2作为受事的可能性,使得 human 本来默认为对象的力量受到制衡。这似乎涉及语用与句法的交界了。 这些算是语言学。Beyond 语言学,也可以从文化上看这个误解或歧义的现象: 对于来自落后农村的人,老婆作为受事的理解几乎是理所当然,因为农村的封建落后使得娶不起媳妇的光棍汉太多,白捞一个媳妇的渴望诱使他们更多向受事而不是对象方面联想,何况手机对于他们是天价,卖肾才可得之,因此对于促销句式也就更加敏感。反之,对于一个知识分子或富裕阶层人士,“送老婆”可能更偏向于理解为对象。 就跟王若水老老年谈桌子的哲学类似,这则小品主要是想谈谈日常的语言学。哲学家满眼都是哲学,语言学家以语言学看世界。语言人人会说,背后的语言学却不是老妪能解。语言如水如空气,一般人熟视无睹了,语言学家来揭示。这是 real life linguistics,琐碎而不乏规律,似海却仍可见底。 【相关】 《立委随笔: 语言学家是怎样炼成的》 《朝华午拾》总目录 【关于立委NLP的《关于系列》】 【置顶:立委NLP博文一览(定期更新版)】 【 立委NLP频道 】
个人分类: 立委科普|3674 次阅读|3 个评论
以汉语为例的普通语言学研究的核心基础问题终于可谈透彻了
geneculture 2016-2-14 15:44
今天收到了回信。 徐师母:新年好!谢谢您! 代问您全家新年好! 代问来看您的其他各位徐老师的学生和同行们新年好! 现在,我终于可以把徐老师提倡的以汉语为例的普通语言学研究的核心基础问题谈透彻了! 2016年,我争取能在北大中文系或汉语研究中心做两场专题报告: 一、徐通锵教授以汉语为例的普通语言学研究的核心基础问题研究汇报 从“字本位”到“言本位”:字与词的迭交原理得以突显 二、以言和语为例的语言学与以中文屋为例的语言、心智和社会的反思 从“中文屋”到“汉字棋”:言和语的序位关系为何重要 --邹晓辉Geneculture 于珠海家中 手机:15916241709 和15300239971 微信:18611789581 http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=953283 在2000-2006年期间徐老师不知不觉地就已经把我带进了以汉语为例的普通语言学研究领域,而且还把我的研究心得即应邀投递给青岛会议的三篇论文经过徐老师多次指导修订为“字本位与汉语形式化”收入《汉语字本位理论与应用》中(2008年山东教育出版社),徐老师还把我撰写的“字本位与中文信息处理”推荐给了周上之教授,因而,2009年我应邀出席了上海汉语独特性会议,我的论文 “与其说是字本位,不如说是言本位”也收入《世纪对话:汉语字本位与词本位的多角度研究》(2013年1月北京大学出版社),2010年我应邀去美国哈佛大学,后来到了伯克利大学,还见到了徐老师当年在伯克利大学访学的美国教授,2011,2012,我多次应邀出席美国科学促进会的年会,我的研究是语言学和信息学的迭交原理,还有教育学和管理学的迭交原理,以及逻辑学与数学的迭交原理,它们就是我提出的融智学“工程、应用、理论”三部曲所关注的核心问题,其中,字,作为一个基本的类,被我定义为:单音节的言;字组,即:双音节和多音节的语,都被认为是由字的组合变换而派生出来的,它们可以是“辞、链、块、读、句”(我的这一套做法,即:“字”单音节的言是基本结构形式单位,“字组”双音节和多音节的语是由字的组合变换而成的派生结构形式单位,它们可以是“辞、链、块、读、句”,很好地继承了徐老师的基本语言观及其相应的基本方法论,我进一步称之为:言和语。我的研究重心在于:言和语的序位关系。这就是徐老师的其他学生以及同行都没有关注和探索过的,而我却认为:唯有如此,才有可能摆脱语言学界以及中文信息处理领域既有的思想束缚,真正延续探究徐老师所关心的以汉语为例的普通语言学基本研究对象以及派生研究对象的问题,这就必然涉及以汉语为例的形式语言学和计算语言学共同的基本研究对象以及派生研究对象的问题,于是,我的交叉学科背景也就在这些方面发挥出优势来了) 值得注意的是:我这样处理之后,原有支持和反对徐老师字本位的专家们几乎都认为我的形式化表述是无歧义的。 遗憾的徐老师的学生们和同事们当时并没有重视我的这项真正延续徐老师字本位精髓的研究成果,最不公平的是居然把原本在2007-2008年我在北大做访问学者期间的“语言与信息”的专题报告会(王洪君教授与我商订好的)也给拖下来了。 再就是“汉字棋”即我在徐老师的字本位以及塞尔老师的中文屋两方面的研究基础之上通过追述汉字中文的渊源,借助计算机辅助手段,发现并发明的“双字棋盘” 这一研究成果,更是把字本位的精神实质给表达得淋漓尽致。也就是说,既可把理论问题说透,又可在基础理论、应用研究和实际应用三者之间开辟了通途。 2013年我又应邀出席了上海第二届汉语独特性会议,我的论文和发言已经引起了陆俭明、潘文国、王洪君、李娟、周上之、等各位在场专家们的关注: http://news.shisu.edu.cn/schoolannounce/2013/2013,schoolannounce,022556.shtml (我与陈宝亚教授被安排在一起主持分论坛,遗憾的是他没有到会,否则,我与他就可直接交流如何进一步发展徐老师的字本位理论的事宜) 2013-10(上海:第二届汉语独特性理论与教学国际研讨会) 言和语的关系及其应用 邹晓辉,邹顺鹏 美国加州大学(伯克利) 中美塞尔研究中心 中国地质大学(北京)高等教育研究所 北京市海淀区学院路29号,100083 【摘要】 本文旨在通过“中文棋盘”及其应用的介绍,即:以书面汉语即中文的“字”与“字组”的序位关系数据库及其应用举例,阐述言和语的序位关系及其应用。其实施方略就是用一个超级特例及其可能派生的一系列具体示例来论述其中蕴含的原理和法则。其结果就是便于从形式化的角度来优化汉语“字本位”理论及其应用,进而,以便于人们在应用中体会纯形式的“言本位”之功用。其意义是它以统一参照系(a)和一系列智慧秤“天平”(b)的方式来对语言文字、思想概念、软件对象及其综合体现的人类心智活动进行大规模的定量分析,从而,可有效提升计算机辅助(汉语)教学和研究及其成果应用普及的质量。 【关键词】词本位;字本位;言本位 http://m.blog.sina.com.cn/s/blog_65197d930102vy8k.html “字本位与中文信息处理”(全文) http://survivor99.com/entropy/2006entropy/20060408paper/2006-4-8.pdf 专家评语: http://m.blog.sina.com.cn/s/blog_65197d9301010mgx.html “与其说是字本位,不如说是言本位” 邹晓辉,邹顺鹏 中国地质大学(北京)高等教育研究所 北京市海淀区学院路29号,100083 摘要:本文回顾了汉语研究的几次“本位”转换,认为这就是前辈在探寻汉语理论体系建构的逻辑起点。如果必须在字与词之间做出选择,那么,赵元任“字是中国人心目中的中心主题”的论断,以及徐通锵“‘词’不能代表‘字’而成为汉语的一种基本结构单位”的论断,都选择了字。而之前,其他人分别选择了词(马建忠1898)、句(黎锦熙1924)、词组(朱德熙1982)。这是为什么呢?难道赵、徐两位语言学教授都不懂字和词的常识性义项吗?显然不是。他们是根据学术直觉作出上述断言的。有没有可支持他们这种学术直觉背后的学术性义项呢?这是笔者提出的问题和思考。本文从宏观的类与微观的例两个层面多个角度,分析了字与词的学术性义项,发现常识性义项往往是造成非学术性争议的起因。本研究采用史论结合形式和学术分类方法,通过对“语”与“字”两个亚系统的二八分类,凸显了音节、字、言“迭交”的特点,得出了“汉语就是组字成语的典例系统”的论断。陆俭明、冯志伟都说如果字本位换成语素本位,也就不会有人再反对字本位了。因此,为避免字本位提法所引起的非学术之争,与其说字不如说言是汉语的基本结构单位,从而便于我们集中精力论述字素关系(周上之)、字词关系(潘文国)、字语关系即言和语的关系(邹晓辉)几组术语及其关系(这是字本位内部尝试统一认识的努力之一)。 关键词:普通语言学、形式信息学、汉语形式化、汉语研究的逻辑起点、字本位、言本位 2009-12(上海:第一届汉语独特性理论与教学国际研讨会 论文集: 2013-1-1 《北大出版社:世纪对话:汉语字本位与词本位的多角度研究》) (本文及与之密切相关的另外两篇论文摘要) http://m.blog.sina.com.cn/s/blog_65197d930102vy8k.html (全文影印件) http://m.blog.sina.com.cn/s/blog_65197d9301018eed.html 信息的关键不在脑(硬件)而在心智(语言、知识、软件) http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=950956 发自我的iPhone ------------------ 原始邮件 ------------------ 发件人: dadi3308 dadi3308@sina.com 发送时间: 2016年2月4日 17:06 收件人: 949309225 949309225@qq.com 主题: 祝贺春节 dadi3308 邹晓辉老师:谢谢你给我邮来详细的论文目录,这主要是你的研究成果,为谨慎起见,我就不搜录了,特告。并祝 猴年大吉 快乐健康 万事如意 代问全家好 丁宁真
个人分类: 学术研究|4 次阅读|0 个评论
HPSG理论方法论基础:语言学理论的性质和研究方法
热度 1 saif 2016-2-12 06:02
HPSG理论,亦即,中心词驱动短语结构语法,本质上是对《句法结构》思想的继承和发展,也是继生成语义学派之后第二次对Chomsky理论的反思。其结果是彻底抛弃“转换”(transformation)的概念以及由此产生的派生理论,在承认语言研究是研究【语言知识】(linguistic knowledge)的基本理念下专注于对语言理论的形式化、精密化和严格化的尝试。如果说《句法结构》只是在理论上提出了语言学应当走向更加严谨的精密科学问题,HSPG就是在这个思想下一次伟大的实践。关于这一点,如果有兴趣可参考本人《我的句法结构读书笔记》。 HPSG全面继承了被后来的主流理论所抛弃的《句法结构》的这个基本原则,并有所发展,将这个原则理论化、系统化,在采纳了其它形式语法理论、数理语言学和数学、逻辑学、理论计算机科学、人工智能的工具和方法之后为语言学理论建立了一个全新的、可以媲美任何其它自然科学的基础框架,使这个框架具有了科学研究的第一要素:可证伪性。 语言学理论走向形式化、精密化,它的一部分特别是句法、语义等核心内容应当成为形式科学一部分,这一理念首先是在《句法结构》中提出来的: “为语言结构建立精确的模型本身就可以在发现过程中起很重要的、正反两方面的作用。用一种精确的、但不适任的形式化阐述推导出一个无法接受的结论来,那么我们往往由此能揭示不适任的真正根源因而也获得了对语言材料更深刻的理解。从更积极方面来说,一种形式化的理论,除了能解决理论设计明确要解决的问题之外,或许还可以自动解决许多这些问题之外的问题。而模糊不清的、囿于直觉的概念即不能引出荒谬的结论也无法提出新的、正确的结论,因而这类概念在两个重要方面都没有用处。精确严谨地阐述所提出的理论并把这种理论严格地应用到语言材料上而不想靠靠临时凑合应时的调整或不严谨的阐述来避免那些难以接受的结论,这样的研究方法可能会更有成效,而有些语言学家无法认识到这一点,质疑精确、严格语言学研究的价值。” 这段论述可以说是生成语法理论的总纲,基本路线。遗憾的是,乔氏本人并未严格遵循这一点。从标准理论开始,理论的定位从语言结构理论变成了人脑中的内在语法、语言能力的研究,语言学的研究被渲染成“认知学的革命”。从上个世纪70年代末到80年代,随着更多的学者加入到生成语法理论的研究,研究的深度和广度不断扩大,一些更基础的深层次的问题被提了出来。首先,什么是转换?什么是生成能力?这些概念的正当化基础在哪里?生成语法作为一门自称是“精密科学”的理论,它本身的理论基础又在哪里?随着乔氏做过贡献的形式语言理论在计算机科学的成功,一些人开始用同样的方法研究转换语法:试图为这个理论找到一个像短语结构语法那样的数学模型。在“乔姆斯基层级 ”理论(Chomsky Hierarchy)中,有限状态语法和上下文无关语法在形式语言理论中都得到了充分的研究,而乔氏提出的新语言结构模型--转换语法却无人给出一个相应的数学模型。按理说这是乔氏本人的任务,就像他以前对前两个语言模型所做的研究一样。不过遗憾的是当时的乔氏的兴趣已经转向,更热衷于人脑和语言的关系,将生成语法的地位上升为对人类获得、产生、理解语言过程的一种外在建模,并认为这种意义上的转换生成语法是17世纪Port Royal理性主义语法学派“新的觉醒”。 而探讨“转换语法”的理论基础问题已经提不到乔氏的日程。这样,直到1970年代,才有人开始认真严肃地研究这个问题:他们就是Stanley Peters和R.W. Ritchie。二人的研究方法和乔氏一样,试图为新的语法模型--转换语法找到一个相应的数学模型。Peters和Ritchie在1973年的论文《On the Generative Power of Transformational Grammar》中,第一次形式化的证明了所有递归可枚举字符串的集合都属于转换语法所生成的语言(every recursively enumerable set of strings is the language generated by some transformational grammar)。 从此“转换语法”从科学理论的神坛上跌落下来,到了上世纪1980年代,一批独立思考的生成语法学家开始抛弃“转换语法”,首先是回归短语结构语法,因为这个语法的数学模型--上下文无关语法(CFG)自1950年代以来在理论计算机科学中已经十分成熟,上世纪1970/1980年代非常著名的计算机编程语言Algol 60就是第一个基于CFG设计的,并且大获成功,从此CFG在理论计算机科学领域深入人心。在这种情况下语言学界提出回归短语结构语法自然赢得了许多学者的共鸣。其中最著名的就是由Gazdar、Klein、Pullum和Sag提出的“广义短语结构语法”(GPSG)。这个语法理论的最大特点,就是在坚持“生成语法”基本原则的同时,彻底放弃了“转换”的概念,重申了《句法结构》中的宣言:语言学的任务就是建立关于自然语言的语言结构一般性理论,通过该理论得到明确的对特定语言的描述。这个理论的基本框架应当具有证伪性,而研究方法则采用了数理逻辑中模型论:首先定义对象集,再递归定义对对象集的操作,以及表达式的“良形”(well-formedness)定义,最后对符合良形定义的表达式赋予语义解释。 以GPSG为代表的的反主流理论的生成学派,第一次明确宣告:生成语法理论的精神实质在《句法结构》所设定的目标:形式化、明确化、精密化,使语言学研究迈向自然科学的方向,因而生成语法理论的发展在理念上要向《句法结构》回归,在理论框架上要向短语结构语法回归,在方法论上要向蒙塔古语法回归。反过来,GPSG认为乔氏当时的GB理论并不属于GPSG作者们所定义的“生成语法”,理由是: there are little signs of any commitment to the explicit specification of grammars or theoretical principles in this genre of linguistics。 继承了GPSG传统的HPSG完全接受了这个理念,这个理论一开始就把语言学理论的精确、明确和严格作为第一要求,从1987年第一次提出这个理论开始到1994完成理论的系统构建,全面完整地提出语言学理论的基本性质和科学方法论的理论。 1. 语言学理论必须要和其它自然科学、特别是物理学一样,严格定义研究范围(empirical domain),研究对象以及相应的方法。具体地说就是: 1) 设定要研究的“现象”(phenomenon),得到所要研究的范围(empirical domain);对确定了的研究范围装入(populate)研究对象; 2) 利用数学(特别是近世代数中的结构概念)对这个研究范围中的对象建立模型(modeling)。 3) 得到对这个模型的原始数据,对这个模型进行研究形成理论(theory)。 如果表示(representation)这个理论的语言是自然语言,则这个理论是非形式化的; 如果用一套严格的形式语言将理论表示(reprensenting)出来,则这个理论是形式化的。最极端的形式化,则是以一阶谓词逻辑为语言的公理系统。 4) 理论的作用是对来自研究范围中的新数据进行预测(prediction),看结果是否符合预期。 总之,任何科学理论的基本要素都是:研究对象(研究范围)、模型、形式化理论。一旦建立了模型,理论将不再直接研究现象本身而是研究建模的结构,或者说建模的结构解释、阐述理论。 在《Head-Driven Phrase Structure Grammar》(Pollard Sag: 1994,以下简称PS-94)中,作者以天体物理学中太阳系轨道运动物体为例,对上述的原则进行了具体的说明: 在这个图中,研究范围是多体(或称N体)系统的运动问题,通过建模(modelling)过程得到的模型是Hamilton向量场;研究对象是多体质点,它们的质量、速率、方向等运动属性。而理论则由①多体系统微分方程;②公理化集合论;③一阶形式语言构成。从这个图可以看出整个研究的方法是这样的: 确定研究范围和研究对象,建立理论,用理论对其建模,其方法论用的是数理逻辑中的模型论方法,得到的是一个向量空间;从对研究范围的对象的初始研究得到对新事实的预测能力。 理论的关注点在于模型,但是能够对研究对象本身的规律产生预测能力。PS-94的结论是,就方法论而言,语言学理论应当具有和这个多体力学相同的研究范式(paradigm)。 有了这样的类比,HPSG提出包括语言学理论在内的一般科学的研究方法论就是三要素:理论、模型和研究范围(impirical domain)。具体到语言研究,HPSG理论的研究范围只限于句法和语义的研究,在这个范围内,语言对象是特定的话语(utterance)片段。建模的结果相当于多体力学中向量的概念,在HPSG中称作【sign】。【sign】是研究所有语言对象的最基本单位。描述【sign】的工具就是【特征结构】,而【特征结构】的基础是【特征逻辑】(feature logic) -- 一种在在上世纪1980 -1990年代发展出来的新的逻辑系统。按照这样的描述,HPSG的语言研究范式就有了和上面天体力学研究范式相似的构造和关系: 在这个图景中,对语言对象直接的描述是HPSG本身的语法理论,递归理论和特征逻辑。语法理论包括了若干“普遍原则”(universal principles)、“规则程式”(rule schemata);递归理论用来构建多层次的复合“特征结构”;而“特征逻辑”则是描述【sign】的工具。 现在我们关注的是方法论和研究工具而不是这些细节。 2. 和其它科学一样,HPSG在方法论上的另一个原则称作“概念节俭”原则 (ontological parsimony)。这个原则的基本思想就是“简化”(simplicity),理论应当用最少的概念说明尽可能多的事实(这个事实应当是模型中出现的事实),尽量不要设定观察不到或没有实证可能性的概念。当然,这一点不是禁忌,如果为了说明理论必须要设定则尽可能少用。具体到生成语法理论,早期的理论设定了大量的短语句法规则和转换规则,每一个规则都要用到相应的中间概念,因为根据乔姆斯基范式(Chomsky normal form),在一个产生式的推导过程中,如果给定两个规则 (1) A → BC (2) A → α 那么派生所用的资源则是: 1.长度为n个字符串需要n次A → α 的派生,因此需要n个语法变元; 2.n个变元需要n-1次A → BC 的派生(从S开始,每次派生增加1个变元,增加n-1次); 3.由1和2得知,长度为n且满足乔姆斯基范式语法的字符串需要2n-1次派生。 (关于乔姆斯基范式的介绍,引用了维基百科的内容) 这里,每一个“语法变元”实际上是为派生该字符串所使用的中间概念,也就是说是在模型内观察不到的概念,这显然是与“概念节俭”原则相违背的。 3.语言学理论应当将语法和语言处理的理论分离,将二者看做是有联系但完全不同的理论体系。由语言学理论所提供的语法,应当是对语言处理中立的(lanuage process neutual)。为什么?因为“语言处理”的本质是语言的使用,而作为语言知识存在的语法在语言处理的过程中只是其中的一个要素之一。语言处理,包括了话语产生(utterance producing)--说话者;话语理解(comprehension)--听者;话语转换(translation)--改述、翻译者;话语操作(manipulation)--语言游戏、修辞等,但基本方面就是话语的产生和理解两个侧面。如果语言的语法是面向处理的,那么偏重产生和理解两个方面任何一个方面都是不经济的,因此语法的设计应当是不考虑话语的产生和理解过程的。换句话说,一个语法只是静态地描写语言对象的语言信息,这些信息应当是高度描述性的,和研究范围内的话语的成分结构(constituent structure)无关,语法应当是语言知识模型,是对具体话语结构高度抽象。这一点和面向对象的编程范式非常相似:面对现实世界千变万化的各种不同问题,这种范式只设定了若干最基本的概念,如“类”、“对象”、“接口”等,以及对这些概念关系的定义:继承、相关、包含、注入等。这样高度形式化、抽象化的结果使得一套编程语言、加上设计模式和软件工程的方法就可以应对从电信到金融、从卫星控制到学生成绩管理等性质完全不同的问题。 将语法与语言处理分离理论的另一个理由,如上所述,语法应当是对语言对象的语言信息的静态描述,而语言处理则是语言使用的动态操作,其中各种信息交织在一起,包括语言知识、百科知识、上下文知识、话题焦点知识等。如果将语法与语言处理绑定在一起,那么就面临着艰难的选择:语法是描述话语产生还是描述话语理解?因为这两个过程从顺序上正好是相反的。从语言学的角度,人们对语言处理机制的了解远不如对语言结构的了解。 基于这样的理由,语法的设计,其基本元素必定是对处理中立的(process neutral or unbiased)。而已知的最好的处理中立的方式就是将语法设计成一个声明式的制约系统。 所谓声明式,就是只规定某个语言对象具有某个属性,至于这个对象的这个属性在句法操作中有什么样的作用则一概忽略。其实现代web编程的三大利器:HTML、CSS和Javascript和这样的语言理论非常相似:HTML是一种语言,定义了一个web应用其本要素,相当于我们这里语法;CSS则规定了这些应用元素的外在表现形式,相当于我们语法中的规则程式;而Javascript则定义这些web元素的行为,就像我们刚在谈到的语言处理理论。 早期的生成语法理论恰恰是没有理顺这样的关系(当然早期的计算机编程也是如此),例如转换语法,是一个典型的瀑布型的语言处理理论,从一种结构到另一种结构,是利用转换操作进行的,而转换规则的使用必须服从严格的顺序规定。而且这个语法模式完全是偏重话语产生模式的,如果利用这个语法模式处理理解过程,则必须反向使用这些转换规则,这基本上是一个无法完成的工作。 因此声明式语法,将为以后的语言处理理论提供坚实、灵活的语言知识框架。HPSG理论,至少1994年的版本不会直接提供语言处理的基本框架,但这个理论整体必须满足语言理论的可确定性条件(decidability)。亦即,某一特定语言中的待定表达式能否被语法赋予一个良形结构(是否合法)必须是由算法可确定的,换句话说就是通过有限的、被定义的步骤就可以确定的。由于严格的算法只能对精确定义的语言对象有效,因此能否展现理论的可确定性完全取决于所选的的形式语言,例如HPSG的形式语言是【特征逻辑】语言。 正是这个可确定性条件将语言理论中的语言知识和语言处理部分分离。 HPSG对语言知识的定义是:递归可定义的语言类型系统(a recursively definable system of linguistic types)。关于这个定义的确切含义我们会在后面详细谈到,这里只提示一点:语言知识研究的不是某个特定的语言事件(event)或token(用标),而是从个别语言事件和token(用标)的抽象出的类型。 而对语言类型的哲学属性我们这里不做评论,在历史上的争论大致分为两派:唯理论和实在论,争论焦点是语言类型应当属于心智对象还是心智外对象?索绪尔、乔姆斯基属于前者,而布龙菲尔德、卡茨和巴威斯当属后者。 参考资料 《Head-Driven Phrase Structure Grammar》- C. Pollard I. Sag 1994 《Information-Based Syntax and Semantics Volume 1》 - C. Pollard I. Sag 1987 《An Informal Introduction to HPSG》- Wolf Paprotté 维基百科《乔姆斯基范式》 维基百科《Chomsky normal form》 (完)
个人分类: 语言学|4038 次阅读|1 个评论
为何要等到事后再重新被发现?汉字棋(由虚到实、由隐到显)
热度 2 geneculture 2016-1-31 17:21
汉字棋,从虚拟隐形(发现)到实在显形(发明),既有宏观的类,更有微观的例,这可不是一般的发现和发明(其中蕴涵:两大类形式化方略,双字棋盘,双语信息处理方法及原理, 三大信息基本定律,语言学和信息学的迭交原理,教育学与管理学的迭交原理,逻辑学与数学的迭交原理,理性哲学与经验科学的迭交原理,个性化艺术与标准化技术的迭交原理,…)
个人分类: 双语信息处理|878 次阅读|4 个评论
两则答疑:1.关于信息,2.关于协同。
geneculture 2015-12-26 08:32
1. (2015-12-26 08:22邹晓辉科学网答疑):要正确理解信息这个词的含义和用意,必然涉及跨学科、跨领域、跨行业这样的大跨度的思维转换。举例来说,《通信的数学原理》(被称为:信息理论,简称:信息论)如果不被误解,那么,它就是纯形式化地统计分析,因此,可应用于任何存在概率的研究领域。再一个典型的例子,《可计算数(原理)》(被称为:计算理论,又称:递归论)也属于纯形式化的数学研究领域,由于它所描述的图灵计算机已经物理化为实用的数字计算机,因此,凡是计算机辅助(以软件产品的形式体现)或计算机编程(以软件服务的形式体现)可以涉及或渗透的领域,都有其或隐或现的身影。上述两个数理科学的典型,与图书情报信息(操作层面的)和信息哲学(思辨层面的)以及语义信息或语用信息(语言学与信息学发生交叉的复杂系统层面的)等几个领域的思考范型是相当不同的(关于什么是信息的不同见解主要发生在这三个领域也就是可以理解的了)。 2. 关键词:自组织;协同。提示:协同与自组织的联系十分突出。自组织区别于他组织(通常被人们所说的组织其实主要是他组织)。教育和管理的最终目的是:自我教育和自我管理,在这两种情况下,教管主体是完全协同的。教管活动的迭交与协同最终可归结为教管主体的迭交与协同。思想政治教育和思想政治工作管理追求的极致应当也是自我教育和自我管理,可以说,一旦达到了自我教育和自我管理的程度或境界,离政治文明也就不远了。
个人分类: 生活点滴|568 次阅读|0 个评论
泥沙龙笔记:三论世界语
热度 5 liwei999 2015-10-6 23:59
Nick: 世界语是不是更接近西班牙语? 是,Esperanto 与拉丁族的语言(西班牙、法语、意大利语)蛮近,听起来更像。当然,词尾简单多了。 汉语被称为孤立语,一个词一个词(古汉语的“字”基本就是词)都是独立的,合成词就是词与词(严格说叫词素)的简单相加。 世界语虽然是印欧语简化而来,具有词尾变化(叫屈折语),还有很多类似于土耳其语(叫黏着语)的语缀叠加来帮助制造新词,但是柴门霍夫在简化的过程中,制定的原则与孤立语(汉语这类)一致。 Nick: 个人感觉世界语可能会更popular的两点理由: 1,人类生活习性趋同,哪都有淘宝KTV;2, by2025年,加州第一大语言将会是西班牙语。当然,这两条也恰会是世界语不流行的理由。欧洲按现在态势,阿拉伯语会很快是第一大语言。 换句话说,尽管老柴不懂汉语,但是他悟性高,语感好,懂得孤立语的优点在哪里,所以有意识的 follow 孤立语的造词原理。汉语这样的缺乏形态的所谓孤立语的造词原理极其简单,就是词素是独立的,把词素和词素简单相加就成了合成词。世界语也一样:原则上,所有的词素都是不变的独立的形式,词素可以简单相加,譬如,后缀也不妨做词干, 只要 making sense. 从这个角度,可以说世界语也“照顾”了汉语的特点。 最典型的例子就是数字系统的造词,与汉语一致,完全是逻辑的:digit+unit 的简单相加: 5 kvin 55 kvin-dek kvin 555 kvin-cent kvin-dek kvin 5555 kvin-mil kvin-cent kvin-dek kvin etc 五 / 五十五 / 五百五十五 / 五千五百五十五 ...... 高: 啊,我要重新开始学习世界语 kvin-mil kvin-cent kvin-dek kvin 不就是 五千五百五十五 嘛. 简直和汉语一一对应 @高 你会喜欢世界语的,而且会从中得到语言学的启发。推荐手机 app duolingo,可以轻松学语言,我闺女使用并强烈推荐的。 Nick: duolingo是科大的人做的吧? 洪:duolingo是cmu年轻hci大牛luis von ahn的第三个 startup,前两个都被Google收购了 因为汉语的数字造词是逻辑的,造词方法是简单的相加,每个词素都是独立的,所以世界语自然而然与汉语吻合。大多数欧洲语言在数字系统中都有一些古怪的表达法,法语的95硬要说成 4*20+15 这样的繁复表达,英语算好的,但是在 11-19 中破例了:不说 ten-one 而说 eleven,后面的数字也还有该透明组合却不透明的地方,不说 three-ten-five 而说 thirty-five,thirty 就不怎么透明。 黏着语(土耳其语、韩语这类)与孤立语(汉语)有一个共同的特点:词素是独立的,一个意思就用一个(基本)不变的形式,它们可以一路加起来表达复合的语义。而屈折语(多数印欧族的语言属于屈折语)的词尾形式往往包含了好几个意思(词法范畴)的融合,词尾也不能独立,譬如一个尾巴(形式)可以是性数格三个范畴的某种组合。 世界语的设计脱离了印欧语系占主导地位的屈折语的窠臼,其造词采用的是黏着语或孤立语的原则(硬要归类的话,世界语属于黏着语的类别)。造词是一个语言丰富性的重要一环。所以从这一点看,虽然说是世界语来源于印欧语系,有很深的印欧语系的烙印,但是其造词的设计,倒是更接近东方语言韩语和汉语。白老师可能没想到世界语方案里面的这种“照顾汉语”的“巧合”吧。 因此说,柴门霍夫这样的天才,怎么夸赞他都不过分。 他几乎就好像把全人类的语言都咀嚼了一遍,吸收了各类语言的长处,然后简化。并且在简化的同时,使其表达法丰富而灵活。语言形式上看,没有任何纯自然语言有世界语这样的灵活、丰富、任性。 这个不是(至少不仅仅是)一个粉丝的主观结论,而是一个职业语言学家的客观研究结论。为此,我的那篇“ 世界语语言学特点 ”的论文,论述了整整一章,有理论阐述,也有许多的例示。等退休有时间了,我应该把那篇世界语写的论文翻译成英语和汉语。 世界语是穿衣的还是(如汉语般)躶体的? 形象地说,它看上去是透明的,真空透明那种,几乎就是躶体的。穿的是一层薄薄的肉色真丝透明纱。有不少神似汉语的地方。 RW: 刚下载装了一个,不过里面好像没有什么半透明的什么体? 那是你的人品问题,视而不见。 透明装说到底就是这么一个极小的语尾形式集合:-o -i -a -e -j -n -as -is -os -us -u that's all 实词需要用上面几个真丝透明内衣包裹一下才出来,否则不成体统。说透明,是因为就这么几个非常有限的内衣,里面也有透明的元素,譬如:-is (过去) -as(现在) -os (将来)里面的 s。再如: -ojn 里面的 -o (名词) -j (复数) 和 -n (宾格)。这些都是透明的(黏着的)真空包装,sexy,isn't it? RW: Great, 伟哥好好欣赏。 世界语与古汉语特别神似的地方是实词的活用。譬如(逻辑)名词活用为动词,这类现象现代汉语也有不少,但是古代汉语更甚,几乎随心所欲。世界语呢,也是随心所欲地“变(词)性”、活用。不过,它活用的时候还是穿了真空透明内衣的,因此高出古汉语一筹。我在 论文 中举的例子是: 三人行,必有我师 / 其狼人立而嗥。 名词“人”的活用可以逐字翻译,只要穿上透明内衣: La lupo hom-e staras ...... hom-e 加副词词尾。 另一例: 其物净且清 / 净其身,食其肉,乃去。 这个形容词“净”第一句里是做谓语(无需 BE 动词的表语),描述性的,第二句做及物动词, 使动的用法:使得...干净。那就多穿一层轻纱好了: pur-ig-is -ig- 使动,-is 过去。 现代汉语的生造词现象也与世界语很像。很多词典没有的汉字组合。读 冰心 的书,也发现很多她生造的二字词,非常别致优美,但是就是没有进入现代汉语词典。冰心的时代是文言像白话过渡时代,所以生造词以文言的角度就是类似短语的开放单位,所以是不是词典的词条,也就不必要求了。汉语的词法句法界限本来就不清晰。 有很多生造词最终没有被语言共同体所接受,但是并不影响这些生造词在交流中的作用。生造词现象在纯自然语言中出现得少很多,而且一旦出现就常常受到老师或者同人的纠正。但是,世界语的灵活性使得人人都在生造,因此生造词对交际的正面功能加强了。这是个很有意思的现象。 在我发表在西班牙的世界语论文中,我不仅详细描述了这个现象,而且也现身说法,生造了很多词,差不多到了长袖善舞,随心所欲的程度。语言学把这种叫做 productive compounding,生造以后,逐渐被大家普遍使用,那就成了词典里的新词条。 毛老有意思,世界语的道,你成见先行,就缺乏“闻道”的虔诚心,从你这几天对世界语的反应看。 毛: 别的道我也想闻的。世界语只是优先级低一点。 恩,与乔姆斯基对世界语的反应如出一辙。不少人老说世界语及其运动实践是负面的理想主义,我要说的是,它是很良善的,良善到几乎 naive 程度的理想主义。柴门霍夫就是一个长不大的孩子一般,天真虔诚,耐性无限,苦口婆心。 毛: 了解世界,适应世界,改造世界。世界语属于改造世界,那是应该放在最后的。 兄弟会改造世界与阶级斗争改造世界,是完全不同的境界。 毛: 渐进和激进之分。 白: 还是技术改造世界最靠谱 我也认可技术派,尽管技术冷冰冰的,缺少温情和浪漫。 昨天又进一步查了资料,发现索罗斯本人有意释放自己的母语是世界语的信号,虽然后来有人考证说他其实还是先母语匈牙利语,后被世界语熏陶。当然他的世界语与母语也差不多。无论如何,他的父亲是一个很有影响力的世界语人物,他家成为世界语人聚会的所在,来访者络绎不绝,他少儿时代有那个语言环境。有人希望他留一笔世界语基金,回馈曾对他以帮助的世界语(他青年时代到英国,第一件事就是寻找世界语俱乐部和同志,是通过他们开始立足的),看样子没这个迹象。这个世界再美好的理想也是空想,很多事儿还是需要金钱去推动。如果索罗斯给世界语基金会捐一大笔钱,就如巴菲特给盖茨基金会捐巨款一样,把世界语当成人类增进理解的世界和平慈善事业,促进其推广,没准会改变英语一统世界的不合理局面。 RW: 昨天白爷提到了五线谱-- 实际上这个世界已经有世界语,数学 + 音乐。伟哥说的是希望语,理想国里说的。 Nick: 毛老下周聊一期java stream,也顺便教教伟哥怎么一句话连着说140字。然后伟哥系统讲下subcat。 白: 140字比NLP难多了。 140 字有何难处?不就是对镜贴花黄穿戴打扮齐整了再见客么?要是改用英语(or Esperanto),就更容易了,本来就是不裸奔的本性。 尼克,谁说你伟哥不会用 140 字说话?内衣遮羞,再穿洋装,打个领带,皮鞋裎亮,人五人六地闪亮出场,这谁不会啊?并不需要贵族出身。此前的意识流不过是一种风格,彰显我大唐语文的躶体特性。 毛: 以前立委开口说话都是三个字五个字往外蹦,不意昨晚竟有如黄河之水天上来。 裸体者穿衣很容易,穿衣的往往有皮袍下面的小,再脱就难为他了。 毛: 裸体者穿衣很容易,那是单纯技术观点,问题在于人家不肯穿衣。 试想,如果都用那种裸体语言,没有所谓西化语式,你能讲清楚NLP、能讲清并行并发、能讲清。。。量子力学? 同意。其实可以倒过来想这个穿衣必要性的问题。语言是传达思想的。而思想是结构化的,在大脑中,可以想象成至少是二维的存在。坏就坏在语言是线性的。线性的形式承载二维的思想,非得借助小词啊、词缀啊等等形式,才庶几可以把二维表中的关系反映出来。 躶体的意识流倒好,它呼呼地往外拽概念的节点,就是不给这些概念一个显性的联系,不用关系词,不穿衣,性感是性感,思想却模糊了,如雾里看花。别说量子力学了,就是一个说明书也写不好。 毛:对,这有点像 Object 的串行化和去串行化。 双方必须有protocol。但是不穿衣的那些 protocol 都不是良定义的。 是麻烦制造者。挑战的是 NLP,或者宅心仁厚,怕我们失业。 【相关博文】 泥沙龙笔记:再聊世界语及其文化 2015-10-04 泥沙龙笔记:聊一聊世界语及老柴老乔以及老马老恩 2015-10-03 科学网—灵感有如神授,巧夺岂止天工 泥沙龙笔记:漫谈语言形式 2015-10-03 泥沙龙笔记:汉语就是一种 “裸奔” 的语言 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|5281 次阅读|5 个评论
泥沙龙笔记:再聊世界语及其文化
热度 1 liwei999 2015-10-4 04:01
谈世界语和老柴老乔以及老马老恩: http://blog.sciencenet.cn/blog-362400-925052.html 南: 没注意到,你们居然谈esperanto…… 这个群几乎是啥都有人在行,无语 白: 爱死不难读。 不是,白老师,是爱斯(才)不难读的: 《立委随笔: Esperanto: 爱斯不难读 》 , 所以我几天就学会,两个月就拿它写论文了。 这个事迹,我师姐写过,《师弟轶事: 疯狂世界语 》 白: 哈哈, 爱得死去活来,自然不难读了 南: 爱死佩兰拖 Nick: @wei 你得编段世界语鼓词十八摸,让鹏爷场,否则他不会买账的。 不过,白老师说世界语是垃圾,我还是很诧异。 一般搞语言的人,或者无视它,或者喜欢它,厌恶它则有点蹊跷。 南: 我初中时赶时髦学过一阵子,但是觉得没啥意思最终没有坚持下来。 但奇怪的是我同时期就开始喜欢编程语言。 毛: 爱死不来读 我女儿学了,跟我说,有啥用啊。 她会西班牙语,学起来容易。 我说,没啥用,就是因为没用,学起来才没压力,没功利,纯粹是 fun 和对语言的新奇。 现在我们父女对话, 倒是不怕别人看到, 反正一般人不懂。 南: 编程语言在解决问题过程中能体会到思维的美丽。 世界语,我感觉不到语言表达的美丽。 纯个人感觉,没有啥理由。 表达的美丽在我这里是表达的自由。 我学语言学,对于世界语的表达丰富性体会特别深。 同样的意思,爱怎么表达都可以。 这个语言学特点我正经写过文章发表的, 作为一个 chapter, 用世界语发表在 Li, Uej (Wei) 1991. Lingvistikaj trajtoj de la lingvo internacia Esperanto. In Serta gratulatoria in honorem Juan Rgulo, Vol. IV. pp707-723. La Laguna: Universidad de La Laguna 不仅仅是语序的自由, 而且其他的语言形式也是比“纯自然语言”来得丰富。 因为纯自然语言常常是倚重一种形式, 或者是倚重语缀, 或者是倚重小词。 二者同时倚重的很少,总是大体有个不同的比例,因此语言才分成不同的类型。 但世界语是人造的,柴大师为了表达的丰富性,有意吸取尽可能多的不同语言形式,这样来自不同类型语言背景的人可以找到自己倚重的形式来表达。 其结果是,同一个意思,表达的方式多于纯自然语言。 语序的自由加上同一个意思既可以用小词来表达,也可以用语缀来表达,是世界语的一个特别有意思的语言学特点。 南: 可能是我还没有学到可以自由运用的地步,无法体会。 对于普通人,可能不会涉及那么多形式,可对于我,这种丰富性和表达的自由,让我觉得空前的语言学满足。 洪: 记得巴金一直提倡世界语 是 巴金是国内最老的世界语之友了,年轻时学过。 同情和支持世界语的还有 蔡元培 冰心 鲁迅 胡愈之 陈毅, 高尔基 托尔斯泰 罗曼罗兰。 还有爱因斯坦 铁托。 毛泽东也被忽悠了一阵子。 见《 中外名人论世界语 》 。 社会语言学家和出版家 陈原 可以流利用世界语演说 我听过 生动的很 也幽默。 我的导师刘涌泉也是世界语之友。 一不小心,我后来也被编入《中国世界语名人录》里了,有本书收了我《我的世界语国》系列。 北: 我愿意做一个坚定地反对世界语的人 你和白老师的反对都没听到坚实的理由。 不过是说因为人造的,显得单调,丑陋。 这个理由是仁者见仁智者见智。 北: 对啊 人造的语言就是反人类的事 我觉得美是我真地感受到美,而且我有这个条件去领略其表达丰富性,我不仅能写,也能说。 你觉得丑也是你的感受。 比起语音上类似的意大利语和法语, 世界语听起来也的确单调多了。加上很多人说 起来生硬,磕磕巴巴。 因为老柴是在简洁和单调中玩平衡, 所以会牺牲一些听觉的美感。 北: 没错 所以您宣传 我反对 两不妨碍。 但是好的世界语朗诵也真地很好听,国内有几位优秀的世界语电台的播音员。 听他们说世界语是一种听觉上的享受。 毛: 世上本没有路,走的人多了,就成了路。 北: 那也只是您觉得好听 我相信觉得好听的人很少很少。 实际上 我觉得法语也很难听。 不是每个人说都好听,毕竟大多数世界语者都是拿他做辅助工具。 不过电台播音员和一些出身在世界语者家庭一生下来就说世界语的人, 他们的世界语与其他语言从听觉上 和语音上, 基本处于同一个水平,绝对没有生硬和难听的感受。 北: 即使您说好听的播音员 我相信觉得好听的人仍然很少。 我说的丑陋不是语音上的 是文化上和内涵上的单调。 这种丑陋与人工设计出来的某某主义制度如出一辙。 对于我来说 这都是突破底线的 完全无法接受的丑陋。 或者说 与主义制度一样 是反人类的。 文化上没有民族的根基, 这一点是有道理的。 以前有说,民族的才是世界的。 没有根基就显得贫乏。 这个批评我同意有点道理。 为了弥补这一点,世界语运动中,以及柴门霍夫本人, 为世界语逐渐创造了另一种文化的基础。 就是那种普世的、大同的、理想主义的文化。 北: 这种文化与某某运动一样 已经为世界人民所抛弃了。 本来语言是语言,文化是文化,可以勉强分开来。 毛: 好好,小孩子别吵了,再吵城管叔叔可就要过来了。 就是拿它纯粹当工具。 有些理呆喜欢世界语,就讨厌其类似国际共产主义的文化背景。 但是真正的世界语者却一直在强调理想主义的一面,有意识把这种文化基因, 发扬光大。 也正因为此,世界语也招来了一些非议。 因为作为工具,顶多是好用不好用的争论, 没人会带有那么大情绪去厌恶或热爱。 但是一旦融入了文化因素, 好恶就开始作怪。 我个人一方面是语言学家,拿它当做工具去领略其美妙。 另一方面又是文傻和骨子里的大同主义者, 或社会主义者。 所以对其特有的世界大同文化背景心里是认同并为之兴奋的。 柴门霍夫本人创造世界语就是有崇高的大同动机,这一点他多方面阐述过。 Philip: 是不是 Java 才是普世码农的共同语言? 北: 语言的文化属性远远强于其工具属性 所以从一开始,世界语就不单纯是工具,而是作为一种主义和运动的形式在发酵。 北: @Philip php才是最好的编程语言! 我要说的是,世界语文化上有先天缺陷,因为没有民族根基。 但是它比起其他纯工具的方案,还是更多一些特别的文化基因,更具有人文主义情怀,世界语圈子里也弥漫这种人文格调和自我优越感,曾一度深深吸引我。 这种文化就是世界大同的理想。 白: 站在印欧语视角的世界大同,就是世界印欧语化。 白老师,那也是没办法的事儿。 世界语几乎做到了极限。 技术上,很难找到一个方案, 非印欧化, 但又不能排斥印欧。 毕竟,印欧语言在世界语言的比重和影响是无法超越的。 北: 所以我反对世界语就在这里 打着工具主义的旗号 行文化同化之实 大奸大恶不过如此。 没有人需要这样一个普世方案。 白: 所以当我们面对看书、看电影、看演出的时候,世界语并不会给我们同一个看。 并不照顾汉语母语者哪怕半分。 “照顾”了也,客观上看。 譬如 数字系统与汉语是几乎完美一致的。 不像法语, 也不像英语(11到20不规范), 世界语的数字系统与汉语几乎一一对应。 另外,汉语的句子如果词对词翻译成世界语, 比起翻译成任何其他印欧语言, 其结果是更加顺达。 因为世界语的表达力在小词和语缀间是兼容的。 而大多数印欧语言是一种繁复的语缀形式。 倚重的是语缀的繁复,结果就离汉语更加遥远。 RW: 所以,汉语更接近世界语? 白: @RW 不可能有这样的结论 世界语的语缀可以极其简单,很多时候可以用类似汉语的小词(主要是介词) 来表达各种语义。 比起印欧纯自然语言,汉语更接近世界语。 这个结论没错。 虽然世界语的来源是印欧语言的 公约数, 但是它与汉语的距离, 比起任何单个的印欧自然语言的确更近。 这个我可以做语言学的证明。 北: 有个有趣的问题 我国官方队世界语什么态度呢? RW: 我想表达的是,汉语有汉语的优势 中国政府和党一直是支持世界语 把它作为一个御用的部门。 中国老世界语者独立性很差, 一直有点媚上的味道, 也是生存之道,无可厚非。 RW: @wei 能否比较粗犷地说,世界语是拉丁语的简化版? 北: 奥 不过这些年知道世界语的人很少了 有人说,世界语是简化的拉丁语, 这么说主要是从拉丁语在历史上是 事实上的欧洲世界的书面共同语的角度, 觉得世界语也抹平了印欧语言可以做共同语言。 严格地说,不是拉丁语的简化, 因为拉丁语只是印欧语系三大旁系之一。 而世界语的确是吸收了三大旁系(拉丁、日耳曼和斯拉夫)的所有的长处,并加以简化的。 白: 官方态度那是因为世界语很弱。如果像天主教或者绿色和平组织那样成为跨国大NGO,你试试。 柴门霍夫的天才怎么赞誉也不过分。 RW: 然后就和汉语神似? 可见汉语不差嘛 真地与汉语相对接近。 RW: 柴老精通中文吗? 但是那不是因为设计时候考量了汉藏的因素, 柴大师不懂汉语的。 北: 这就是关键的差别之一 @wei 老师,我就认为语言只有特点,无所谓长处短处。 但是因为人类语言是有很多共性的, 而柴门霍夫是追求共性的大师。 追求语言形式的多样化, 在这种追求过程中, 自然而然地,与汉语接近了。 RW: @wei 我绝对可以想象世界语的简洁和中文神似 @RW 你的想象没错, 我可以验证。 RW: 我想说的是中文有它的先进性 根据我的语感和经验, 的确有神似的方面。 我以前的世界语语言学特点的论文中也举例过(举的还是文言的例子呢),好像也阐述过这个类似的意思。 RW: 我女儿可以说很好的拉丁语,非常优美。 中文的 “先进性”,简洁是一。 印欧语言不简洁,是因为叠床架屋。 这种叠床架屋的繁复语缀, 有它严谨的一面, 也有它不简洁的缺点。 不简洁的结果是, 冗余信息多, 这个对交流和通讯工具是有好处的,可以抗干扰,消歧义。 但是却失去了简洁的 “美”。 RW: 但中文也有其无法比拟的优美感! 这么说吧, 在 90% 的情况下,冗余是不必要的,是多余的,但是作为语言的文法规定,你还是必须要冗余。 但是在 10% 的时候,你会发现这些繁复带来的冗余是非常有利的。 它消除了歧义。 语言因此严谨。 而中文倒是简洁,既没有语缀, 而且小词也是能省就省, 甚至语序也是有相当自由度的。 这样一来,中文的表达显得特别简洁和自由, 最大程度地不依赖显性的语言形式(语序,语缀,小词), 而是靠上下文 去”意合“ 。 这对于人 通常不是问题, 而且成就了简洁和自由的美, 但是却丧失了严谨性。 同时 在 10% 的情形下 造成了理解上的困扰。 RW: 但缺点也显而易见,中文的系统性越来越少。 英语实际上是个很不错的平衡。 语言不能太累赘,梵文有十几个变格,是很精确,但不能传下来。 同意,英语是个不错的平衡, 就那么三四个语缀, 词尾 -ed -ing -s, 但是这三四个语缀可是顶了大用的。 世界语的词尾也不多,格也只有一个(宾格),比起拉丁语是简化太多了。 ~~~~~~~~~~~~~~~ 白: 目前看,五线谱成为音乐世界语,地位比爱死不难读牢固多了。 查: 直接对应钢琴的键 简单直接 笑得最后笑得最好,现在断言爱斯不难读的结局还为时过早。 大数据的信息化时代,不定哪一天人类突然聪明了,超越了国家政治和民族差异,要建立一个松散的全球共同体。那个时候要选一个有根基有实践有底蕴的中立语言作为 official 工作语言的话,除了 Esperanto,也没多少选项了。 白: 那时候机器翻译早就过关了吧, 我对机器翻译过关的信心都比这个大。 你看如今 TPP,还有好多这个P那个P的经济共同体,弄得人眼花缭乱,本质上就是世界大同前的种种迹象。 机器翻译与世界语可以并行,二者互补,为世界大同服务。关键的一条是,选择任何自然语言都是明显偏向某些民族的,也是政治不正确的。Esperanto 的中立性,奠定了自己独一无二的有利地位。当然,历史上出现过200多种人造语方案,基本都是中立的,但是有这么多实践的人造自然语,唯此一家。 查: 世界语是yy吧 有正常人用吗? 我心中的理想社会与柴门霍夫完全相同:从此一个人一辈子只需要学两门语言。 一个是跟父母和社区自然而然学出来的母语,一个是面对世界需要学的国际辅助语言。 把现在学第二外语(英语、西班牙语等)的宝贵时间解放出来以后,人类的科技进步和生产力会大大解放。 反复的 benchmarks 结果表明,世界语的学习一般只需要我们现在学第二外语的五分之一的时间。 查: 世界语还是洗洗睡了吧 谁用啊 浪费那时间还不如学黎曼几何 虽然也没用 如果人的一辈子在最美好的青少年时代,平均为学英语等第二外语花费了一万小时的话,我们说的是每个人就会节约 8000 小时的青春。 查: 呵呵 你这是理科生思维@wei  八小时算一天,那就是节省生命1000天,而且节省的是生命最美好的年华。 查: 学习英文也是一种享受。 对于愿意学其他外语作为享受的是另外一回事。这里说的是,为了生活和工作,不得不学的外语。 查: 假设你说流利的世界语 哪个学术会议你听得懂? 查理,乱弹琴,我说的是理想社会,你跟我说现实,不是捣乱么。 白: 机器翻译也是理想,到时候学一种语言就够了。 理想社会是需要n代人的过度最后确立的。 查: 理想社会那就用edi吧 还要语言干吗? 现实的不合理,是显然的。我为什么花那么多时间学英语? 白: 这不过是个技术问题。语言之间的大同,放到机器里去吧 就是一个工具而已,好用就行,花费的时间应该越少越好。 查:以后所有的交流都采用edifact 就不需要语言了@wei  白: 不花时间岂不更好? 当然,机器翻译也是一个路。 也许真地就只要学一门语言就管一辈子了。比世界语的大同更好。 白: 大鼓可能还是翻译不了,不过大鼓也翻译不成世界语。 查: 联合国标准 不需要翻译@wei  那都不是事儿。 以后的世界学一门以上的语言的人,都是专家。是真正爱好语言的,而不是被迫学习外语的人。这些人可以用来对付机器翻译难以胜任的任务。 查: 现在孩子会三门语言很普通。你对未来的预测是错的@wei  也许吧。目前来看,机器翻译的大同胜过世界语大同的概率,更大一些。不过这两个预测都是建立在批判目前的强制性外语教学的基础之上,浪费了太多的青春。 有人天生喜欢学语言,就跟有人喜欢学多门乐器一样,另当别论,不能与被迫学外语以求生存相提并论。 最最可悲的是,很多人学外语劳而无功。赔了夫人折了兵,外语还是学不会,学不好。毛泽东就是一位,找再好的老师也没用,他老人家就不是学语言的材料。直到老,据说就是学会了几个孤单的不成句的哲学术语, 什么辩证法之类。 【相关博文】 泥沙龙笔记:聊一聊世界语及老柴老乔以及老马老恩 2015-10-03 泥沙龙笔记:三论世界语 2015-10-06 科学网—灵感有如神授,巧夺岂止天工 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|2006 次阅读|1 个评论
听天命,尽人事(穷则独善其身,达则兼济天下)
geneculture 2015-6-20 04:56
我认为这个期刊(sci,ssci,ahci同时检索)比较适合我的研究成果系统地向学界和业界介绍。 现在的问题是: 1,无论是普通语言学,还是形式语言学或计算语言学,都几乎从没在乎过中文。因此,国际学术惯例是不读中文而只读英文。虽然在言和语的关系及其形式化方面,在语义信息的表达和处理上,中文都有着英文所不具有的独特优势,但是,由于自古希腊哲学和艺术到近现代科学和技术,几乎都与中文无关。因此,中文非主流(英文是主流),知识缺原创(原创主要是古希腊和近现代欧美),软件无根基(根基主要是英美),这三大瓶颈,严重地制约着以中文为母语的族群学界和业界的发展。 2,虽然我的研究成果--发现(如:融智三棱)以及发明(如:双字棋盘),分别已经在认知的宏观框架(基本范畴的顶层设计及其分类和对第二层知识框架的分类)与操作的微观序位(信息基本定律)以及宏微贯通的方法架构(三大系统工程)上都已胜出。但是,其推广应用却需要高校和公司的参与,以及政府与民间的参与。因此,唯有采用双融策略和O2O交互并行的方式,才有可能加速普及。 3,于是,我的努力方向即工作目标,也就自然要以从上到下(学术引领)和从下到上(市场应用)双管齐下的方略来实现。因此,我能做的就是:听天命,尽人事(穷则独善其身,达则兼济天下)。 这个期刊就是: http://journals.cambridge.org/action/displayJournal?jid=NLE
个人分类: 双语信息处理|955 次阅读|0 个评论
乔姆斯基批判
热度 8 liwei999 2015-6-15 00:01
【立委按:微信泥沙龙,谈笑鸿儒,高朋满座,信马由缰, 言无所忌, 摘之与同仁分享。】 【泥沙龙对话录】 今儿个咱要吐槽乔老爷,不吐不快。 开题:乔姆斯基,对领域的误导,或负面影响,与他对语言学的革命性贡献,一 样大。 他的hierarchy,是天才绝顶的理论,是不可泄露的天机,从而奠定了形式语言的基础,用来创造、解释,或编译计算机语言,是完美的指导。 可是,完美往上走一步,就可能成谬误。乔姆斯基拿这套理论,硬往自然语言套,导致整个领域,在所谓自然语言是free,还是sensitive,还是 mildly sensitive等不靠谱的争论中,陷入泥潭。 太多的人被引入歧途,理所当然地认定,因为自然语言复杂,因此需要 powerful的文法。这个 powerful,是世界上用的最误导的词。 工程师发现,有限状态好用,但经不起理论家的批判:你那玩意儿太低级,不够 powerful,只能拿来凑合事儿。 实际上,做过大工程的人都明白,对象的复杂,并不是使用复杂机制的理由,有本事使用简单机制对付复杂的对象,才是高手。 乔姆斯基最大的误导就是,用所谓自然语言的center递归性,一杆子打死有限状态,他所举的center递归的英语实例,牵强和罕见到了几乎可笑的地步,绝非自然语言的本性。结果一代人还是信服他了,彻底地被洗脑,理所当然以为必须超越有限状态才可以做自然语言深度分析。 为了所谓语言的递归性,人脑,或电脑,必须有个堆栈的结构才好,这离语言事实太远,也违背了人脑短期记忆的限制。世界上哪里有人说话,只管开门而不关门,只加左 括 号不加右括号,一直悬着吊着的?最多三重门吧,一般人就受不了了。就算你是超人,你受得了,你的受众也受不了,无法 parse 啊。说话不是为了交流,难道是故意难为人,为了人不懂你而说话?不 make sense 嘛。 既然如此,为什么要把不超过三 层 的center循环,硬要归结成似乎是无限层的递归? (毛老:递归成了他的宗教。) 不错。乔老爷的递归误导语言学,坑了NLP太久。我对他的语言学不感冒,对他对NLP的误导,更感觉痛心。一个如此聪明强大的人,他一旦误导就可以耽误一代人。被耽误的这一代是我的前辈一代(上个世纪70年代80年代),他们在自然语言理解上的工作几乎一律为玩具系统,在实际应用上无所作为,从而直接导致了下一代人的反叛。老一代被打得稀里哗啦,逐渐退出主流舞台。 在过去30年中,统计NLP的所有成就,都是对乔姆斯基的实际批判,因为几乎所有这些模型,都是建立在ngram的有限状态模式的基础之上。 (洪爷:从乔姆斯基的所作所为,就能分出构造机器智能和解构人类智能难度上的差异。他五十年代略施小计就把形式语言夯成了计算机的Cornerstone,可是穷毕生精力,总是在重构其语言学理论。 毛老:如果没有乔老的那些理论,人们能做出计算机语言编译吗?) 洪爷:语法mapping到语义,总是要做的,不必须用形式语言,就像现在做nlp的人也不必须懂语言学。还是 David Marr,David Rumelhart 等立意高远,总想找到人机等不同智能实现上的共通计算机制。 刘老师:Marr 也是人神级别的 毛老:跟上面问题类似的是:如果没有图灵和冯诺依曼的理论,人们会造出计算机么? 洪爷:Babbage的分析机可行,Ada的程序/算法也早可行。其实,问题不在于出冯诺依曼还是马诺依曼,问题在于,不管他们的理论表面上如何不同,可能都受同样的约束,能力上可都能都等价。而Chomsky 研究的是这些约束能力。 毛老:那图灵不是更加么? 洪爷:Turing 从机器一侧,Chomsky从人一侧。) 洪爷说的是事实,过去三十年不懂语言学做NLP的占压倒多数。但那不是健康状态。不过,语言学里面也很混杂,进来的人很容易迷糊。但是,语言学里面确实有一些指导性的东西,了解与不了解大不一样。比如索绪尔,就值得琢磨。索绪尔说的大多是原则性的,有哲学的意味,是传统的非科学性的语言学,特别具有宏观指导意义,可以提醒自己不至于陷入细节的纠缠,而忘记了方向。他谈的是共性与个性的关系,语言和言语,规则与习惯,共时与现时,都很洞察、到位。 (白老师:我觉得线速、柔性很关键,多层次递归和远距离相关必须搞定。方法不限,八仙过海。) 那些已经搞定了,伪歧义也不是问题,都搞定了。有一种叫做cascaded FSA的方法,与软件工程的做法极其类似,就能搞定这些。前提是指挥者架构者不能失去全局,要胸怀索绪尔,而不是乔姆斯基。架构和interfaces设计好,下面就是模块的开发,匠人的干活,可以做到很深,接近逻辑表达,比chomsky的文法深。传统规则系统受乔姆斯基CFG影响太大,很不好用,而且也无线性算法,所陷入的困境与神经网络以及一切单层的统计系统类似。正如多层的深度学习被认为是AI的突破一样,有限状态一多层,一 cascade,以前天大的困难,递归啊远距离啊伪歧义啊,就消解于无形。 (白老师:数学上的函数复合。) 就这么一个简单的道理,结果至今批判规则系统的人,还在打稻草人,以为规则系统都是CFG那么愚蠢和单层。 乔姆斯基对nlp的误导,还在于它的短语结构的表达法。那个phrase structure破树,叠床架屋,为了追求所谓语言共性,太多的assumptions,既不经济也不好用,却长期成为 community standards,误导了不知多少人。起码误导了 PennTree,通过它误导了整个领域。, (白老师:某种意义上,nlp是应用驱动的。与应用匹配,Ngram也不算误导。与应用不匹配,HPSG也算误导。抽象的误导不误导,让语言学家掐去吧。一个topic问题,扯了这么多年。) 语言学家打烂仗的事儿多了,说起来这与乔老爷也有很大关系。有个 self,相关的所谓 Binding Theory也是论文无数,大多垃圾,这与老乔的负面影响直接相关。为追求 universal grammar,和脱离语义的generalizations,走火入魔,大多是无谓的口水战争,既不能推进科学,也不能推进应用,唯一的好处是帮助了很多语言学博士的选题,培养出一茬接一茬的语言学博士。可是,毕业了还是找不到工作。老乔由于其超凡的智力和名气,帮助提升了语言学的地位,但他没有能力影响市场,结果是全世界语言学家过剩,懂得茴字五种写法的落魄腐儒,如过江之鲫,谁能给他们就业机会? 这里面的要害在,所有的语言分析,不可能为分析而分析,都是为了求解语义的某种需要,可老乔强调的语法纯粹性,要脱离语义才好研究终极的机制,这个argument有历史的革命意义,有某种学术价值,但非常容易形而上学和片面化,结果是语言学家脱离了目的,脱离了需要,在争论一种分析,或一个模型与另一种的优劣。其实这些相争的方案,只要系统内部相谐,都大同小异,根本就没什么本质区别,而且没有客观的可量度的评判标准,那还不打成一锅粥。 (刘老师:摆脱语义,直接进入语用?) 哪里,乔老爷是要直接进入共产主义,要世界大同。他对语义不感兴趣,更甭提语用。语义在他属于逻辑,不属于严格意义的语言学。句法语义是分割开来的两个范畴,句法必须自制。 (白老师:句法自制是错误的。) 对传统语言学完全不分家的那种分析,老乔有革命意义,也确实推进了结构研究,但凡事都是过犹不及。句法自制推向极端,就是本末倒置,失去方向。 我做博士的时候,在一个小组会上,举一些汉语的例子,作为证据反对一刀切的句法自制,说老乔有偏差,看到的语言事实不够,结果被我导师劈头盖脸批了一通,言下之意,不知天高地厚。我当然口服心不服。 问题是,我一辈子只思考一个问题,只要醒着,头脑里除了语言,就是文法,除了词汇,就是结构,突然有一天觉得自己通达了,看穿了语言学上帝,乔姆斯基。 原来,智商高,不见得离真理近,智者乔老爷,也不例外。 (洪爷:老乔不是上帝,他只是让咱看到来自造物主的理性之光。) 形式语言理论,非人力可为,绝对属于天机,单凭这,乔就是人神。 吐槽乔老爷,一次抱怨完,明儿依旧是偶像。 【后记】 到了我们的年代,俄语退居其后了,所以我本科的二外选的是法语,到研究生才选了俄语做三外,不过全还给老师了。虽然语言是还给老师,体悟到的语言学却长存,所以也不冤。到 30 年后的今天主持 multilingual program,带着参考书,我还一样可以指导法语和俄语的 NLP 研发,语言的不同,换汤不换药也。 不管我怎么批判乔姆斯基,我还是服他到不行:他老人家的威望可以把 Universal Grammar 这种乍听很荒唐的观念,转化成一个让人仰视的语言哲学理念。UG 的真理之光由此不被遮蔽。当然最厉害的还是他的 hierarchy 形式语言理论,那几乎不可能是人的理论,那是上帝之光,尽管乔老爷在描述的时候,不免机械主义,hence 造成了极大的误导。 【相关博客】 巧遇语言学上帝乔姆斯基 泥沙龙笔记:从乔姆斯基大战谷歌Norvig说起 Chomsky’s Negative Impact 泥沙龙笔记:再聊乔老爷的递归陷阱 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|7986 次阅读|10 个评论
[转载]2015国家社科基金年度及青年项目立项公示名单(语言学)
carldy 2015-6-11 09:31
2015 年国家社科基金年度项目和青年项目立项名单的公示 名单(语言学) 重点项目 中国典籍英译的传播与评价机制研究 罗选民 清华大学 口译训练功效的认知及神经机制研究 董燕萍 广东外语外贸大学 汉语“乡土语言”英译实践批评研究 周领顺 扬州大学 基于语料库的两岸三地百年女性文学翻译史论 刘泽权 河南大学 上海市方言地图集 陈忠敏 复旦大学 地理语言学视阈下的环渤海方言比较研究 王临惠 天津师范大学 四川省藏区语言生态与和谐语言生活的创建研究 尹蔚彬 中国社科院民族学与人类学所 概念场视域下的南北朝隋-唐五代词语演变研究 王东 郑州大学 乾嘉学者段玉裁《说文解字注》、王念孙《广雅疏证》中科学方法和理念研究 冯胜利 天津大学 汉语语法化词库编撰及语法化模式研究 李小军 江西师范大学 基于语言观更新的汉语复音词疑难问题研究 沈怀兴 宁波大学 中国北方人口较少民族语言资源保护的理论与实践研究 丁石庆 中央民族大学 侗语方言土语的再调查研究 石林 贵州师范学院 一般项目 实现优选论视角下的形态学研究 徐政 上海交通大学 基于句法终端成分特征的论元结构理论研究 阚哲华 韶关学院 基于互动观的构式语法理论与应用研究 施春宏 北京语言大学 语言符号学视域的中医语言体系研究 李崇超 南京中医药大学 功能语言学与认知语言学融合视角下语法隐喻研究 丛迎旭 宁波大学 类型学参照下的作格语义句法互动研究 郭印 青岛理工大学 对语言范畴感知的ERP研究 程冰 西安交通大学 基于事件结构理论的汉英动词体特征比较研究 杨玲 安徽大学 基于语料库的英汉反讽对比研究 杨庆云 北京师范大学 英汉位移构式演化的历时比较研究 程丽霞 大连理工大学 现代汉哈文新译《论语》及其双语对比研究 周金声 湖北工业大学 语义信息守恒原理下词汇、语义和句法三位一体的汉英简单句的句义比较研究 司联合 南京师范大学 基于语料库的英汉非限定小句的功能类型研究 杨炳钧 上海交通大学 汉、英双宾结构的构式化和语义表达专门化进程语料库比较研究 张国华 中南财经政法大学 佛典汉译传统与圣经翻译传统的对比研究 汪东萍 池州学院 翻译研究的马克思主义哲学途径 朱健平 湖南大学 清末民初西学术语译介与接受研究 张景华 湖南科技大学 晚清翻译界的国民性思潮及其当代价值研究 苏艳 华中师范大学 钱锺书翻译思想研究 蓝红军 暨南大学 二战后中国哲学在美国的英译、传播和接受研究 谭晓丽 衡阳师范学院 口译的语音加工研究 曹瑞斓 安徽工业大学 基于ERP的中国高校学生口译增效策略研究 康志峰 复旦大学 基于翻译过程语料库的汉英翻译单位认知研究 王福祥 曲阜师范大学 汉语作为外语在美国发展的综合研究 刘元满 北京大学 基于平行语料库的法律翻译研究 程乐 浙江大学 苗族英雄史诗《亚鲁王》英译及研究 李敏杰 中南民族大学 典籍英译国外读者网上评论观点挖掘研究 祁瑞华 大连外国语大学 中国文化典籍英译史研究 范祥涛 南京航空航天大学 宋词英译的框架赋值与构式配置实证研究 李天贤 宁波大学 英语世界中《尔雅》译介研究 李志强 上海师范大学 汤显祖戏剧英译的海外传播研究 张玲 苏州大学 《周易》在西方的译介与传播研究 任运忠 西南科技大学 二十世纪敦煌汉文叙事文献西方英译活动研究 桑仲刚 天水师范学院 基于语料库的毛泽东著作英译中外对比研究 黄立波 西安外国语大学 翻译社会学视阈下中国现当代小说译介模式研究 汪宝荣 浙江财经大学 沈从文小说英译的社会学研究 徐敏慧 中国海洋大学 两广粤客杂处地区方言接触层级特征研究 陈卫强 华南师范大学 域外吴语文献的调查和研究 林素娥 上海大学 湘语和赣语交界地区的语言地理学研究 李永新 长沙师范学院 福建省尤溪县七种过渡型闽方言的调查研究 邓享璋 三明学院 19 世纪以来梅州客家方言历史演变研究 田志军 宜春学院 汉语方言序数表达式的共时分布及历时源流研究 王霞 怀化学院 二声调红古方言研究 雒鹏 西北师范大学 日本伪满殖民语言政策与汉语“协和语”研究 岳辉 吉林大学 区域安全视角下“一带一路”的语言规划和语言战略研究 吴志杰 南京理工大学 构建面向“一带一路”建设战略的外语规划研究 陈美华 东南大学 滇黔桂白族、纳西族、苗族和壮族的双语教育政策和现状对比研究 杨红艳 云南民族大学 中国沿海开放区的语言景观研究 尚国文 浙江大学 民国时期江南语言学家对中国语言政策和语言规划的影响研究 赵贤德 江苏理工学院 粤语代际语料调查记录及变异、显危研究 单韵鸣 华南理工大学 19 世纪稀见英文期刊与汉语域外传播研究 方环海 厦门大学 16-20 世纪初汉字西方传播研究 刘亚辉 浙江财经大学 基于计算机中介交流的跨文化交际能力发展研究 李清平 中南大学 美国汉语传播现状、问题及对我国的启示研究 朱麟 北京第二外国语学院 文化层级差异对汉字演变的影响研究 石勇 广西师范学院 中外法庭辩论的语音特征、策略及其对判决的影响力研究 殷治纲 中国社科院语言所 基于批评性话语分析的网络语言暴力研究 刘文宇 大连理工大学 危机语境下媒体话语的语用研究 冉永平 广东外语外贸大学 中国媒体语言政策社会知晓度及推广策略研究 郭龙生 教育部语言文字应用研究所 政务新媒体语言表达模式建构研究 王建华 浙江科技学院 英汉悖义构式的二语加工及习得研究 徐海 广东外语外贸大学 二语习得中的概念重构研究 曾永红 湖南师范大学 基于加工决定论的汉语母语和二语发展研究 杨梅 华南理工大学 英汉虚拟位移构式的二语习得研究 钟书能 华南理工大学 语料库驱动的二语隐性、显性知识调查与实验研究 陆军 扬州大学 汉语方言研究的实验语音学理论与方法研究 胡方 中国社科院语言所 语音轻化视角下汉语韵律句法互动的实验研究 邓丹 北京大学 听障学生汉语唇读理解能力发展研究 雷江华 华中师范大学 中英西儿童运动事件的语言呈现与心理呈现的对比研究 纪瑛琳 深圳大学 唯递归假说的心理语言学实证研究 杨彩梅 苏州大学 学语后药物神经性聋儿中国手语理解的神经语言学研究 李强 天津理工大学 藏汉双语者及藏汉英三语者心理词汇语义表征的SOA多点测试法与ERP对比研究 黎明 西南交通大学 高校外语教师专业发展动机及其影响因素的生态模型构建研究 刘宏刚 东北师范大学 中国第二语言研究质量评价标准及应用研究 秦晓晴 华中师范大学 国际比较视野下我国西班牙语课程标准研究 于漫 上海外国语大学 英语专业本科生元语用能力的构成及培养研究 姜晖 辽宁师范大学 我国大学生英语口语能力动态诊断评价体系研究 马冬梅 东南大学 语言测试反拨效应理论视角下的高考英语改革研究 黄丽燕 华南师范大学 外语能力标准的国际比较研究 张蔚磊 上海对外经贸大学 中国英语学习者短语能力的评测与诊疗系统研究 黄开胜 中南财经政法大学 信息化时代的外语课堂教学有效性研究 范姣莲 北京邮电大学 非言语情绪交互与外语课堂教学有效性研究 江桂英 厦门大学 以构式为中心的语法教学范型构建及其有效性研究 王洪刚 扬州大学 英语阅读记忆系统的交互性研究 倪锦诚 上海理工大学 基于CBI的大学生认知学术英语能力培养研究 袁平华 南昌大学 对比修辞学视阈下的二语写作及其能力标准研究 鞠玉梅 曲阜师范大学 文本声音构建与EFL学术写作能力发展研究 赵冠芳 上海外国语大学 移动互联环境下的外语学习效能评估与提升路径研究 郭继荣 西安交通大学 基于提示特征影响的综合写作测试效度研究 何莲珍 浙江大学 国际汉语教材中的中国形象调查研究 彭增安 复旦大学 汉语特色句式的优化生成及其中介语加工机制研究 马志刚 广东外语外贸大学 面向学习者的对外汉语学习词典释义模式的优化研究 李英 中山大学 英汉文本特征的计量语言学研究 陈蕊娜 贵州大学 中国英语课堂小组互动口语语料库建设与应用研究 徐锦芬 华中科技大学 基于型式语法及索引行聚类的动词型式自动识别与提取研究 于涛 江苏师范大学 基于大规模标注语料库的兼类词概率分布研究 徐艳华 鲁东大学 基于注疏文献的先秦汉语语料信息处理研究 梁社会 南京师范大学 汉学文史著作平行语料库建设及在中国文化外译中的作用研究 徐彬 山东师范大学 多模态汉英口译语料库的创建与应用研究 刘剑 衡阳师范学院 面向实际应用环境的方言自动辨识研究 张明键 湖南警察学院 近代等韵研究缀补 周赛华 湖北大学 基于朝鲜李朝儒家经典谚文注音的明代汉语语音研究 高龙奎 济南大学 “韵法直横图系列等韵著作”等韵理论的传承、创新与语音史价值研究 李军 南昌大学 《慧琳一切经音义》声类研究 赵翠阳 浙江科技学院 甲骨字释的整理与研究 王子杨 首都师范大学 《四声篇海》整理与研究 张社列 河北大学 曾、楚文字比较研究 孙伟龙 河北工业大学 俄藏黑水城汉文文献俗字整理研究 柳玉宏 宁夏大学 汉字部首法发展史及应用理论的研究 陈燕 天津师范大学 秦汉简帛疑难语句通释 宋华强 武汉大学 宋辽金元石刻异体字研究及新见字字形谱 何山 西南大学 殷墟甲骨文字汇释辨证 陈年福 浙江师范大学 出土文献中上古汉语方言语料汇考 范常喜 中山大学 汉语古典韵文体文学语言颜色词历时演变研究 马燕华 北京师范大学 明清民国方言辞书及其所录方言词研究 曾昭聪 暨南大学 古汉语时间词词汇系统及其演变研究 梅晶 江西师范大学 《事林广记》非汉源名物词研究 闫艳 内蒙古师范大学 唐五代俗语研究 谭伟 四川大学 宋元以来契约文书词语汇释 张丽 安庆师范学院 岳麓书院藏秦简(壹—肆)词汇研究 夏利亚 浙江科技学院 乾嘉学术札记中训诂理论的发掘与研究 曹海东 华中师范大学 古籍注疏与新版《汉语大词典》释义疏误研究 朱城 岭南师范学院 敦煌写本儒学九经异文汇考 李索 大连大学 运用现代语言学方法考释先秦汉语疑难词句的理论与实践研究 杨逢彬 上海大学 释名诂林 任继昉 中南大学 先秦至民国末期汉语代词发展演变史研究 曹炜 苏州大学 基于满汉合璧类白话文献的18-19世纪北京官话语法研究 李焱 厦门大学 汉语受事成分句法位置的选择机制及其制约因素的历时考察 袁健惠 烟台大学 基于语料库的汉语程度副词历史演变与跨语言比较研究 张家合 浙江师范大学 汉语V定N中构式的形成与语法化研究 仝国斌 安阳师范学院 两汉汉语语序地域比较研究 刘海平 赣南师范学院 基于语料库的汉语情态词语义功能研究 曾传禄 贵州师范大学 否定与几个相关范畴的互动研究 尹洪波 北京外国语大学 双宾构式句法语义接口研究与语义地图研究 林艳 北京语言大学 汉语插入语和话语语法体系的重构研究 龙海平 广东外语外贸大学 类型学视野下汉语趋向范畴研究 刘小川 南昌大学 构式视角下的汉语动量组配认知研究 王艳滨 陕西师范大学 程度副词的生成、演化及其当代功能扩展的新趋势研究 张谊生 上海师范大学 汉语空间量范畴的句法语义研究 黄健秦 解放军外国语学院 事件句法视域下的汉语动词多重论元实现现象研究 杨大然 解放军外国语学院 现代汉语全称量化词研究 张蕾 东北师范大学 汉语若干动词的及物性变化研究 左双菊 华中师范大学 汉语“有/是/在”的类研究 薛宏武 重庆师范大学 基于类型学的汉语受事前置结构研究 张怡春 盐城师范学院 基于语料库的汉语全句功能范畴的句法实现位置研究 马宏程 浙江外国语学院 汉语复合词词汇化模式的语义独立性原则研究 颜红菊 湖南科技大学 清末民初新加坡华文报章词汇研究 车淑娅 南京师范大学 来华传教士双语词典史研究(1604-1905) 姚喜明 上海大学 构式语法视阈下汉语常用单音节动词语义的历史演变研究 胡丽珍 湘潭大学 现代汉语反预期范畴研究 刘焱 上海财经大学 互动交际中“什么”反问习语构式网络研究 胡德明 浙江师范大学 汉语语用移情的优选机制及其应用研究 李向华 九江学院 语言接触与满语中的借词研究 长山 黑龙江大学 黑龙江省濒危少数民族语言的记录研究 邬文清 齐齐哈尔大学 青海河湟地区少数民族语言态度及濒危语言保护问题研究 李增垠 青海师范大学 面向信息处理的中国朝鲜语语料库应用研究 金光洙 延边大学 朝鲜语显格助词研究 赵新建 解放军外国语学院 元明时期蒙古语汉语对译词典比较研究 布日古德 中国社科院民族学与人类学所 维吾尔语和汉语中的概念隐喻认知对比研究 斯迪克江 · 伊布拉音 新疆师范大学 维吾尔语句义的类型学研究 赵江民 新疆师范大学 回鹘汗国时期古突厥文碑铭语言的词汇研究 艾尔肯 · 阿热孜 中央民族大学 汉语侗台语词义比较研究 陈孝玲 广西民族大学 面向语言信息处理的藏语短语研究 才藏太 青海师范大学 藏文字发展史研究 维马泽里 西藏大学 藏语安多与康巴方言语音对比研究 龙布杰 甘肃民族师范学院 濒危语言卡别话记录与研究 杨艳 玉林师范学院 中外苗族文字史比较研究 蒙昌配 贵州师范学院 语言知识与统计模型融合的英语功能小句句法分析研究 马建军 大连理工大学 中国英语学生词汇联想表征与语料库分布的句法-语义耦合研究 张萍 华南师范大学 平衡语种样本视阈下时-体范畴的类型与共性研究 于秀金 曲阜师范大学 默认意义的语用-句法研究 张延飞 山东大学 超学科视域下的分析语词类问题实证研究 王仁强 四川外国语大学 基于构式语块分析的句法与语义互动关系研究 刘世理 信阳师范学院 文学语篇认知语用文体研究 刘风光 大连外国语大学 短语学视阈下中国学者学术英语语篇研究 雷蕾 华中科技大学 基于大型语料库的中国学术话语“声音”体系研究 刘世铸 山东大学 言语行为的会话分析研究 于国栋 山西大学 常用修辞格的论辩性语篇功能研究 袁影 苏州大学 吴方言区英语学习者的口语语篇节奏模式研究 于珏 同济大学 会话中预设的动态认知研究 廖德明 西华师范大学 话语研究的主体可及性分析模型研究 张玮 西南财经大学 RUTHWODAK 政治语篇分析的学术思想研究 杨敏 中国人民大学 基于背景化理论的日汉非限制性关系从句比较研究 孙海英 北方工业大学 两岸三地现代汉语对日语借词的吸收及创造性使用研究 谯燕 北京外国语大学 日语语篇分析研究 李远喜 华南理工大学 历时类型学视角下的日语示证范畴研究 杨文江 南开大学 日本汉字问题与语言政策研究 陈月娥 上海财经大学 中日法律语言对比与互译研究 陶芸 中央民族大学 俄汉关键评价概念场整合对比研究 陈勇 解放军外国语学院 俄罗斯语言学的本土化研究 薛恩奎 黑龙江大学 基于汉俄句型对比的外宣翻译研究 于鑫 天津外国语大学 俄语语篇整合性研究 安利 中央民族大学 青年项目 汉语数词的句法和语义界面研究 李旭平 浙江大学 量级结构理论下结果构式的跨语言研究 李文超 浙江大学 系统功能类型学视角下的汉英情态对比研究 杨曙 华南农业大学 基于自然语料的德、汉语投射性构式对比研究 陈琦 上海理工大学 基于新型历时复合语料库的翻译汉语特征研究 庞双子 天津外国语大学 汉英同声传译语序差异处理能力及其发展研究 郭靓靓 同济大学 清末民初“译名”问题研究 方仪力 西南民族大学 中国电影外译史研究 金海娜 中国传媒大学 系统功能语言学视角下英汉文学原著与简写本易读度比较研究 陈瑜敏 中山大学 《老子》在德国的译介传播及其与德国哲学“呼应式对话”研究 朱宇博 解放军外国语学院 鸳鸯蝴蝶派通俗文学期刊译介史研究 修文乔 中国石油大学 闽东方言的语音特征及其历史演变研究 袁碧霞 华侨大学 中缅中老边境地带汉语方言及少数族群语言生态调查研究 肖自辉 暨南大学 苏北江淮官话的地理语言学研究 冯青青 盐城师范学院 国际比较视野下面向拉美地区的语言传播战略研究 曹羽菲 上海外国语大学 伪满语言制度与汉语变异研究 李逊 厦门大学 系统功能语言学视角下的微博话语规范研究 于洋 中国地质大学 频率分布和二语构式习得有效路径研究 张晓鹏 北方民族大学 维族双语儿童英语学习者语音意识及其读写能力获得和发展的关系研究 韦晓保 华东理工大学 南部吴语发声类型多维特征参数实验研究 宋益丹 南京师范大学 汉语二语者拼音加工机制的实证研究 陈琳 中山大学 中国初中英语教师评价素养量表研制与验证研究 林敦来 北京师范大学 隐喻视野下的学术英语写作认知过程反思性学习模式研究 万婉 华侨大学 面向自然语言处理的构式自动判别模型研究 田臻 湖南大学 基于力触觉交互设备进行对外汉字书写方法的研究 熊敏 重庆大学 传抄古文整理与研究 李春桃 吉林大学 中古近代汉语同形字考释与研究 张文冠 江苏师范大学 汉代铜镜铭文综合研究及数据库建设 鹏宇 清华大学 东汉魏晋南北朝道经词汇研究 忻丽丽 内蒙古大学 两汉方言词与汉语史研究 吴吉煌 中山大学 《思溪藏》与《碛砂藏》随函音义比较研究 谭翠 中华女子学院 汉语重动句的起源与历时演变研究 赵林晓 天津科技大学 基于语料库和出土文献与传世文献相结合的汉语连词发展史及其语法化研究 范桂娟 重庆师范大学 汉语否定标记跨方言比较研究 陈芙 河南财经政法大学 汉语紧缩句的多维研究 赵雅青 华侨大学 现代汉语涉量构式中量的整合认知研究 王倩 吉林大学 面向计算的现代汉语动词的叙实性研究 李新良 浙江工业大学 基于认知的汉语词义引申完形解释 吴芳 三峡大学 基于事件与话题链的汉语篇章结构研究 孙坤 浙江外国语学院 类型学框架下满语静词形态结构的认知模式建构研究 贾越 黑龙江大学 内蒙古科尔沁地区蒙汉双语使用现状调查研究 阿如娜 内蒙古民族大学 现代语音学方法下的蒙古长调发音机制研究 胡阿旭 西北民族大学 彝语动态电子腭位和语音数据库及其相关基础理论研究 陈顺强 西南民族大学 藏族译学史研究 那加才旦 中央民族大学 黔江白宏哈尼语参考语法研究 张鑫 内蒙古大学 藏语命名实体识别及实体知识库构建研究 加羊吉 西北民族大学 土家语原生态自然话语典藏与研究 鲁美艳 吉首大学 海南回辉话与印尼伊班语的对比研究 张会叶 云南民族大学 基于海量语料的多词表达提取研究 黄志娥 福建工程学院 中华文化关键词俄译的语料库实证研究 信娜 黑龙江大学 莫斯科语义学派句法语义理论框架下的俄汉语焦点副词语义研究 郭丽君 山西大学 http://www.cssn.cn/zx/yw/201506/t20150610_2029142.shtml
个人分类: 语言学探讨 Linguistics|9239 次阅读|0 个评论
[转载]【翻译】让我们说说话
MengXiangxi 2015-6-6 01:08
按:看到校友夏笳发在Nature Future上的小说,觉得很有趣,忍不住翻了一下。仅为翻译的练习和实验,没有获得相应的授权。 原文: http://www.nature.com/nature/journal/v522/n7554/full/522122a.html 让我们说说话 夏笳 Ken Liu编辑 非得劳烦语言学家在深更半夜出面解决的问题,一定是个大问题。 凌晨三点,我被电话声惊醒。一个阴郁的声音说,让我立刻过去。我脱口而出答道:难不成有外星人来临? 在一个诡异的阴暗房间,我和几个诡异的人一起看了一段诡异的录像:一群白色的海豹宝宝蜷成一堆,喧声迭起,听起来有点儿像在动物园,还夹杂着车库和幼儿园的噪声。 “这是什么鬼?”有人率先发问。 我们听到了这样的解释:某实验室设计的这些智能玩具能够像新生婴儿那样从零开始模仿学习人类语言。设计资料说这些海豹宝宝能够最终掌握相当于五岁儿童的语言能力。 实验室员工将一百个原型机打包,准备快递给公测用户。然而,它们的包裹被贴上了错误的标签。当这些快递包裹被定位、追回、开封之后,工作人员发现,这些本应安安静静趴着的海豹并未被关机,而是在发出奇怪的吵闹声。 “它们就像在用什么我们听不懂的外星语言相互交谈似的。”一个迟疑的声音穿破黑暗。 “这正是我们需要搞清楚的。”主持会议的黑衣男子面无表情的向我们点点头,说道。“这是否可能?谁教会了他们?请记住,这些海豹一直在包裹里面。” “海豹宝宝包海报”,我自言自语道。幸运的是没别人听到。 “我知道一个类似的案例。ISN,尼加拉瓜手语,”刚才那个黑暗里的声音答道。“这是二十世纪七、八十年代西尼加拉瓜一些学校的聋儿中产生的手语。” “讲下去。”黑衣男子显然对此产生兴趣。 “呃,在七十年代之前,尼加拉瓜的听障人士鲜有交流。然后他们建立了一些职业学校并招收了几百名听障儿童。其中语言课程本来打算教会学生们几个西班牙语词汇的唇语,但是收效甚微。然而,学生们把校园、街道和校巴变成了成果丰硕的试验场,自己研究出了相互沟通的方法。尼加拉瓜手语,一种结合了手势和他们个人的、独特的、原生的符号体系的新型手语就这样迅速诞生了。这是我们唯一一次实际见证了一种语言如何凭空产生。” “也许不是,”另一个声音打断道。“实际上,后来有人开发了能够发展出自己语言的机器人。他们让这些所谓的‘语言机器人’走迷宫,同时让他们根据预设的各种音节发明新的词汇来描述不同位置。它们还得和其它同类交流各自的信息,于是又发展出关于方位和距离的新词。” “我们怎么知道‘语言机器人’们说的是什么?”第三个声音说。“会不会一个听起来人畜无害的单词实际上,比如说,意味着‘武装叛乱’?” 简陋的机器人密谋造反似乎挺搞笑,但是谁都没有笑。 “还有什么意见?”黑衣人环视四周。 “为什么是海豹宝宝?”我大声问。 “什么?” “它们长得太奇怪。你们为什么不选择小猫或者小狗?” “我觉得这不重要。”他耸耸肩。 “或许设计者想让他们显得尽可能的腼腆和无害,”我若有所思的说。“这是否意味着我们下意识的害怕会说话的生物?” “你的意思是?” “我想说,我们为什么不可以关掉屏幕,走出暗室,和这些……这些东西当面谈谈。我们不是相信它们已经发展出自己的语言了么?所有语言学家都知道学习一门未知语言的唯一方法就是与母语人士交流,指着一个物体提问,并且也回答他们的问题。如果我们不先叩开密封包裹的大门并致以问候,我们就自然不会懂得他们在说什么。” # 我跨过门,所有的海豹宝宝都安静下来用水晶般的大眼睛看着我。谢天谢地,海豹宝宝比有尖牙利爪的生物好太多了。我和第一次田野实践时候一样,伸出双手告诉他们我没有藏着的武器,尽管这个动作在他们的语言体系里可能什么意思都没有。 机器人不可伤害人类,而机器人必须保证自身的存在。 如此遥远,如此临近,如此充满未知。 “你好”我用母语问好,然后耐心的等待。 离我最近的海豹宝宝把毛茸茸的爪子放在我平摊的手掌上,开口说话——听起来像大大的哈欠。 我尽力去模仿。这可能是在问好,或者仅仅是打哈欠。无论怎样这是一个不错的开头。 “让我们说说话?”我温柔的问道。我们说说话,好么? 感谢kusurisu@bdwm、张斯文等的指正。
4845 次阅读|0 个评论
昵称,是一个值得研究的课题
心有余而力阙兮 2015-5-3 02:50
看到过各种各样有文采的、有政治含义的、幽默的、辛辣的、热情的、冷峻的、乐观的、厌世的……昵称,因此很早就有个想法:关于现在的各种昵称可以做篇博士论文。不知道有没有人写或研究过。昵称中的问题涉及到社会学、心理学、语言学、民俗学、文学、政治学、传播学、情报学,甚至哲学、科学等等极其广泛的学科领域。而个人对昵称的选取,又与其学历、学问、年龄、性别、兴趣、性格、阅历、民族、经济基础、社会地位、婚姻状况、地理区域等等都有联系。昵称,实在是个饶有兴趣值得研究的课题!
个人分类: 社会|3911 次阅读|0 个评论
重温“一种知识信息数据处理方法及产品”可见自然语言表述的利弊
geneculture 2015-4-9 08:15
回顾并重温自己1997开始撰写2000年公开发表的“ 一种知识信息数据处理方法及产品”可见自然语言表述的利弊。无怪乎古希腊时期亚里士多德要撰写《工具论》试图采用形式逻辑的方式来消除听说双方在语言表达上的歧义。一词多义是自然语言的基本特点。西方语言以具有多义性的词作为基本结构单位来研究自然语言着实是一件不得已的事情。无怪乎近现代语言学创立者索续尓要感叹或抱怨语言学没有确定的研究对象。塔斯基试图区分对象语言和解释语言(又称元语言)来消除自然语言在形式逻辑推演过程中难免遭遇的逻辑悖论,乔姆斯基试图也从形式语言学的角度在生成语法的形式分解(如S=NP+VP)及其一系列推演处理上来排除自然语言的歧义,从而,开辟并逐步形成了人机对话的第一大类形式化方略--涉及从形式语言到计算语言乃至 自然语言处理 。 如果说《易经》的基本符号形式体系与西方数学符号体系中的2的n次方乃至无穷次方异曲同工而在理论上可算是殊途同归,那么,从布尔代数到弗雷格集大成之后试图采用数理逻辑的方式来消除数学表达的歧义,同时消除机器语言在数理逻辑推演过程中产生的逻辑悖论,这样的努力也遭遇了在排除歧义和化解悖论这两大类问题上相继出现了类似“五十步笑百步”那样的问题或笑话。因为,在此我们是可以把形式逻辑试图排除 自然语言多岐与数理逻辑试图排除机器语言二岐这两类情形比喻为“百步”与“五十步”的情形的。 (如果以上所述基于自然语言的形式逻辑与基于机器语言的数理逻辑在本质上是等价的,那么,以下基于广义双语的序位逻辑就不仅与上述两种逻辑等价而且还在严谨性、精准性和兼容性等方面超越了上述两种逻辑。这是一个与超越基于直接形式化的图灵机的图灵测试与基于间接形式化的塞尔屋的中文房间的基于两大类形式化方略的晓辉秤的双字棋盘比翼齐飞的巨大创新和创造。) 直到后来我在一些列“双列表”记录中直接把算术与中文按照“同义并列对应转换”法则枚举出一字、二字、三字和四字等这样的 一些列“双列表”记录之后,即广义的双语在人机或机人之间可实现协同智能--智慧数据仓库及若干数据库之时,奇迹终于产生了--为进一步采用“三类双语”化解“三大瓶颈”的教管学用社会化系统工程奠定了坚实的基础 附录: from: http://survivor99.com/pscience/zxh/zxh2.htm 一种知识信息数据处理方法及产品 邹晓辉 本发明涉及人工智能、计算机和通信技术的交叉综合领域,属于一种语义信息及真实文本的数字处理技术, 进一步是一种知识信息数据处理方法及产品。 现在,虽然在知识工程、信息技术和数据或数字技术等方面有很大的发展,但是,由于人类关于语义信息的定性分析、定量分析和结构分析长期未能获得实质性的重大突破,因此现有技术至今仍无法解决以下一系列知识信息数据处理的难题。 数据或数字处理作为现有技术的核心,对形式信息的量化处理虽然十分有效,但是,对语义信息的量化处理却难以直接派上用场。因此,各种各样的中介技术方法及产品,便介入并参与了对知识信息及真实文本的量化处理,尽管其效果大打折扣。在受限范围现有技术虽有较大进展,然而,在非受限范围却一筹莫展。因为, 现有技术只能对受限范围的知识信息及真实文本进行局部的量化处理,所以,不能从根本上解决冗杂文本、非标形式、垃圾信息、知识爆炸和怪圈悖论等难题。 目前,还没有能够一揽子解决上述难题的技术公开。可以说,就解决上述难题而论,不仅现有技术与相关技术的整合优势没有形成,相反,各自为政、一盘散沙的劣势却无处不在。根本谈不上,在人工智能与人类智能、电脑与人脑、电信网与神经网之间实现协同效能或优势互补。 协同智能的发展在知识信息数据处理领域受到了现有技术的瓶颈制约。至今为止,尚无与本发明相同或相似的方法及产品问世。 以下进一步举例说明现有技术的缺陷或不足。 以知识信息数据处理为例,无论是直接的模数转换还是间接的编码转换,要么由于真实文本未经提炼就直接转换为数字符号 (例如:数字图书馆技术) ,根本谈不上对知识信息的量化处理;要么由于真实文本与数字符号之间的中介程序太多太杂 (例如:计算语言学及其应用技术) ,根本无法形成对知识信息及真实文本进行量化处理的统一标准,现有技术只能是一盘散沙、各自为政。 进一步,以编码转换为例(涉及语言形式和知识内容的处理),一方面,现有的语言信息处理系统(包括 机器翻译、自动识别 以及 广义文本通译 等), 还存在各种语言形式之间的通译和同种语言的非标形式的识别等一系列技术瓶颈 ;另一方面,现有的语义信息处理系统(包括 机器分类、自动浏览 以及 知识基因提取 等), 也还存在诸如冗杂文本、垃圾信息、指数爆炸和怪圈悖论等一系列难题 。现有 软件工程 及 知识工程 体系 还缺乏从受限范围到非受限范围的转换机制,缺乏总体标准。 再进一步,以金融监管(涉及证券、期货、外汇交易各方对价格信息的量化处理)为例,造成失误或失败的原因虽很多,但 根本原因是:人们还没有找到能够对各种价格变化所包含的激励或预警信息进行及时而透彻分析的有效方法(包括定性分析、定量分析和结构分析)。人们普遍认识不到:金融的本质是智融,缺钱的实质是缺智。 现有的专家系统,无论是终端还是网络形式,都不具备协同量化处理知识信息及真实文本的功能;现行科教体系熏陶或培养出来的专家,即使是最有知识的专家,也只能处理非常有限的知识信息及真实文本,而且,还常常伴随着以偏概全的议论或见解。 由此可见, 人工智能和人类智能,都面临着协同智能的严峻挑战。 推而论之,在不同方面、不同阶段、不同层次和不同系统,都能轻而易举地发现现有的教育、科技、经济、政治、外交、军事、法律、医疗卫生和日常生活等 几乎任何一个领域都面临上述难题和挑战。 在如今这样一个充满竞争且快速变化的 竞智时代 ,试想一想: 如果一个人、一个单位、一个国家,总是处于冗杂文本、垃圾信息、指数爆炸和怪圈悖论的包围之中,既搞不清楚自己所收到的这么多知识信息的本质含义,又不知道如何准确无误地发出自己应该发出的有的放矢的知识信息,也不明白自己所处的内、外、大、小环境中实际存在的各种重要的知识信息(包括正面的激励信息和反面的预警信息)的基本内涵,这时,如果这个人、这个单位、这个国家又处于不利的竞争地位,甚至面临危机,那么,其处境或命运将会是怎么样的一种状态或过程呢?其结果是可想而知的。如果一个系统,包括智能网络及终端乃至独立的机器人,总是被非标形式或垃圾信息所阻止或干扰而无法正确应变,那么,其结果也是可想而知的。 现有技术的发展还受到当前的语义学理论和语义信息处理理论的发展制约。产业界对知识信息及真实文本的量化处理技术的效率,之所以如此低下, 这与学术界对语义信息的本质认识或阐述不清,是息息相关的。不仅仅是普通人把形式信息与语义信息混为一谈,而且绝大多专家也都常常把衍生形式与本真信息混为一谈。至今为止,还没有人明确地区分本真信息、形象符号、载体载能和意向意识,并且 以此作为重构人类整个知识概念体系的基础框架。 虽然个人计算机和互联网技术接二连三地推动着信息技术不断地向前发展,但是, 语义信息的本质究竟是什么?至今仍未见有令人信服的报道公开。对语义信息的定性和定量表述,还无法令人满意。 人类的整个知识概念体系,特别是语义信息理论体系,至今仍然是一个大杂烩,其根基是不牢固的。例如:以唯物论、唯心论和形式论 三个基石 为不同支点而形成的各种基本观点,以及在它们的基础之上构建的人类知识概念体系及其各个分支理论,都忽略了本真信息的根本地位,甚至把本真信息与载能载体、意向意识、形象符号等衍生形式之间的基本关系本末倒置。在这种情况下, 要发明量化处理知识信息及真实文本的有积极效果的新技术,首先就必须要找到能重构人类整个知识概念体系的新理论,否则,就根本不可能超越现有科技框架而获得真正的重大突破。 本发明的目的 是提供一种知识信息数据处理方法及产品,包括:文化基因工程方法以及相应产品的生产及使用方法;全域数码定位系统及其派生产品。 通过对全域基因文本元素的完全归纳和对已知域及目标域基因文本组合的相对完全归纳,解决知识信息的计量及测度的难题,促使人工智能与人类智能优势互补,形成效率更高的协同智能,促成形式信息革命向语义信息革命的时代飞跃。 如果说信息论创始人 仙农 提出了 形式信息数据处理技术及标准 ,那么,本发明的目的就是提出 语义信息数据处理技术及标准 ;如果说 全球定位系统( GPS)、柔性加工系统(FMS)和横断扫描仪(CT) 是 针对载体载能进行的全球数字定位、柔性加工和横断扫描 ,那么,本发明的全域数码化的网络、出版物和终端就是 对知识信息进行的全域数码定位、柔性加工和横断扫描 ;如果说 人工智能、电脑和电信网 在形式信息数据处理技术的支持下获得了极大的发展 ,那么,本发明就是要 使以协同网络、协同终端和出版物为特点的协同智能在语义信息数据处理技术的支持下获得前所未有的发展, 早日迎来 智能主体进化发展的新阶段——协同智能时代。 本发明的具体任务 是:一、提供 文化基因工程方法 即 全域数码定位方法 ;二、提供 全域数码定位系统 , 产品形式包括: 1、纯形式的全域数码化网络,即知识信息数据处理领域的“GPS”;2、纯文本的全域数码化出版物,即知识信息数据处理领域的“FMS”;3、纯数码的全域数码化终端,即知识信息数据处理领域的“CT”。 本发明 依据 融智概念体系和信息基本定律而设计并实施。 所谓 融智概念体系 (注:涉及对人类现有的整个知识概念体系的量化重构),是指以义、文、物、意为基础而构成的协同智能主体的知识概念体系。其量化形式采用能够通过复数域及复平面乃至曲面出入多元数系及多维空间的四元数形式。义,指本真信息;文,指符号形象;物,指载体载能;意,指意识意向。文、物、意统称本真信息的广义文本。形式信息涉及文、物,其中,文,包括图、文、数(注:数字信息技术属于此范围)、表、音、像等形式,物,包括立体、活体等形式;语义信息涉及义、意(注:现有的意义理论及语义信息技术没有明确区分义与意)。 以曲、棋、语言为例,对上述概念及原理的基本含义说明如下:曲、棋、语言的机理(含:法则),是本真信息,即义;展示其机理的文化形式,如:乐谱、棋谱、文字或字母或动作等,是符号形象,即文;展示其机理的物化形式,如:琴、棋、传感器官(含使用过程)等,是载体载能,即物;演奏者、下棋的人、智能主体的选择(包括以虚拟或实体的形式体现的意),是意识意向,即意。 所谓协同智能主体,是由人工智能和人类智能构成的新一代智能主体。其功能是对体现义的基因文本元素及组合(包括程序、结构以及框架等)进行完全归纳及相对完全归纳,以及,由此发展的知识信息数据处理(包括广义及狭义的处理)能力,具有专家系统与专家群体的整合或综合优势。 所谓 信息基本定律 ,即:本真信息,唯一守恒;基因文本,对应转换;基因通式,序趣简美;特式特例,非非各平(即:非对称、非同步、各自平衡)。 唯一守恒法则,体现本真信息的唯一性和守恒性;对应转换法则,体现图、文、数、表、音、像等本真信息或基因信息的多元基因文本(注:因为文、物、意,都是义的展示,具体表现为多元基因文本元素及其派生的各种基因文本组合)只要同义即可并列;序趣简美法则,体现在文化基因通式及基因文本通式之中;非非各平状态极其转换或变化过程,是指各种各样的特式或特例与通式相比较,具有空间上的非对称性和时间上的非同步性,以及特式特例各自平衡及趋动的特性。 本发明的目的是通过下述 方案 实现的。 基本方法: 一种知识信息数据处理方法,是对语义信息及真实文本进行定性、定量及结构分析的文化基因工程方法,其特征是:从广义真实文本中提取、剪接或重组文化基因,步骤是:以完全归纳的全域为基准参照系对基因文本元素的复用次数或复制件数进行自动统计,以相对完全归纳的已知域及目标域为应对参照系对基因文本组合的复用次数或复制件数进行自动计量,其中,基因文本元素及组合均采用码式并列的形式,包括式隐码显或以码代式与码隐式显或以式代码等特殊形式,即在全域数码文本体系与多元基因文本体系之间建立对应转换关系。 相应的基本产品的生产方法: 一种知识信息数据处理产品的生产方法,是以码代式进行知识信息数据处理的方法,其特征是:选择纯数字形式和纯载体形式并使之相结合构成全域数码定位系统,步骤是:采用(a+bi…)的具体数字作为指代基因文本元素的标准代码;采用卡、表、库、网、端的具体载体作为承载基因文本元素及基因文本组合的标准载体;以全域标准代码构成基准参照系;以已知域及目标域标准代码组合构成应对参照系。 相应的基本产品的使用方法,同时,也是派生产品的生产及使用方法: 一种知识信息数据处理产品的使用方法,是以式代码进行知识信息数据处理的方法,其特征是:使用并依托全域数码化网络的基准参照系及应对参照系,步骤是:通过码式并列,把广义真实文本中的基因文本元素及组合全域数码化,构成实用的多元基因文本,即全域数码化出版物;通过码隐式显以及多元基因文本分析,支持实施知识系统工程。 进一步的派生产品的生产及使用方法: 一种知识信息数据处理产品的使用方法,是以码代式进行知识信息数据处理,步骤是:使用并依托全域数码化网络及全域数码化出版物,通过式隐码显,构成数字的一元基因文本,即全域数码化终端,支持实施网络及网际知识产权监管和端到端的默契通信。 相应的基本产品: 一种知识信息数据处理产品,是由码、卡、表、库、网、端构成的全域数码定位系统,包括纯数字形式和纯载体形式,即全域数码化网络,其特征是:纯数字形式,采用(a+bi…)的形式语言编制源程序,采用(01)的形式语言编制目标程序,(a+bi…)与(01)的交集即编译程序;纯载体形式,采用卡、表、库、网、端的具体形式承载码。 相应的派生产品: 一种知识信息数据处理产品,其特征是:由全域数码化网络支持的全域数码化出版物,包括已知域集大成共享基因文本和目标域集小成独享基因文本,含公开或保密、标准化或个性化、通用或专用的多元基因文本出版物。 进一步的派生产品: 一种知识信息数据处理产品,其特征是:由全域数码化网络及全域数码化出版物支持的全域数码化终端,含交换机及服务器和用户计算机及其它终端装置或载体的一元基因文本终端。 详细步骤进一步综合说明如下: 1、确定基准参照系(化无限为有限)和应对参照系(变抽象为具体),步骤是: 第一,确定基准参照系:逐方面、逐阶段、逐层次、逐系统地分解目标域广义真实文本的元素组合,直到确定基本元素及其构成的全域,并以此作为反过来判定元素组合的基准参照系,第二,确定应对参照系:从已知域的元素组合中选择具体的进化形式,涉及基本元素的时间序列和空间结构乃至元素组合的整合架构或框架,作为进一步判定复用的元素组合的具有明确针对性的应对参照系。 对目标基本元素在基准参照系中的波、粒、场特性进行全域定位,对目标元素组合在应对参照系中的时空变换特性进行自动对应,判定本真信息元素及组合与相应的符号形象、载体载能、意向意识的基因文本元素及组合之间的相互关系,进而识别并理解广义真实文本所表达的本真信息以及主体的意向意识。 基因信息元素,通常以符号形象或载体载能的某一种或多种形式体现,例如:26个英语字母(文字基因文本元素),又如:4个核苷酸碱基(生物基因文本元素)。 全域,由所有的基本元素构成,是对一定时空条件下基本元素构成的元素组合进行定位分析的基准参照系。例如:通过统计字母在字母组合中的序位和统计字母以字母组合被复用的次数,可以区分字母组合在相应的时空条件下的词素、词、词组、句、段、篇、章等具体进化形态。同理可以区分由核苷酸碱基构成的密码子、氨基酸、蛋白质、细胞、微生物、植物、动物、高等动物、人类等具体进化形态。 2、以本真逻辑为序(化无序为有序),步骤是: 第一,采用实数(a)指代本真信息,第二,采用虚数(bi…)标识广义文本(涉及:符号形象,包括图、文、数、表、音、像等多元基因文本类型),第三,在基本元素的层次上确立体现本真逻辑的文化基因通式(a + bi…),使其它所有的符号形象及载体载能乃至意向意识的各种进化形式体系统统简化成为文化基因通式的某一类型的广义基因文本组合。 (a + bi…)的代数形式是多元数系、几何形式是曲面空间、分析工具是曲面坐标,四元数及复数都是它的特例形式。 基因文本的全域数码化,相当于给每一个基因文本元素镶嵌了一个唯一的“体表特征”——全域数码,基因文本组合随之也由全域数码组给大上了相应的烙印。 由此可见,全域数码体系是统一多元基因文本的标准参照系。这就是对广义真实文本进行协同操作的依据。有了它,不仅人类智能主体对各个具体的形式体系进行协同操作成为可能,而且,人类智能主体与人工智能主体协同运行也成为可能。 3、明确代码与载体(变失控为可控),步骤是: 第一,给多元基因文本元素镶嵌全域数码,并设置相应的单元载体,即:由式到码(文)到卡(物),进而,随着时空变换,由码(全域数码)到组(全域数码组),由卡到表。这就是对广义真实文本进行去冗存要处理(含广义和狭义的处理)的定位工具。 第二,明确产品形式:1、只处理数字化的全域数码的网络(包括全域数码化出版物和终端),2、用于自然人识别的全域数码化出版物(包括:公开和保密、专用和通用、共性化和个性化的出版物,3 、用于机器识别的全域数码化终端。 图1是本发明的数学模型原理图。 图2是本发明的物理模型原理图。 图3是本发明的技术性能一览表。 图4是本发明的知识工程示意图。 图5是本发明的产权监管示意图。 图6是本发明的默契通信示意图。 本发明的有益效果或好处是: 建立基准参照系及应对参照系,解决因知识信息错位而引起的冗杂文本、非标形式、垃圾信息、知识爆炸和怪圈悖论等难题。 打个比方来说,上述这些难题就好比是一团乱麻。采用现有理论的范式和现有技术的办法就是:要么是快刀斩乱麻,这是从整体介入的通常作法;要么是慢慢地去理,这是从局部介入的通常作法;要么是:先把这团乱麻分成一堆一堆的小团,再分别从各个小团的内、外两个方面逐步深入地去理或斩(注:最后能否解决这团乱麻带来的所有问题,就要另当别论了!一方面,要看这团乱麻本身乱的性质及程度,另一方面,则要看你是否真正想要解决问题或打算把问题解决到什么程度),这是先整体、后局部,乃至不断往复逐步深入的方法。 本发明采用的方法则是:好比是先给这团麻绳一根一根地染上色,有的甚至再编上号(即:从全域基因文本元素的统一编号入手),然后,再针对具体情况(如:已知域基因文本组合)并考虑实际需要(如:目标域基因文本组合),既有根据又有针对性地,选择不同的颜色及编号(如:确定具体的参照系乃至参照系的组合),或分、或斩、或理(悉听尊便!)。 这实质上指出了解决知识信息的计量及测度难题的最佳途径,并且,从方法及产品两方面给出了简明的示范。例如:基准参照系的应用及其效果,充分体现了人工智能主体以高速运算和海量存储支持的演绎及完全归纳优势,表现为对数据的狭义处理和广义处理的发散或收敛的精密性或专一性;应对参照系的应用及其效果,则充分体现了人类智能主体以跨时空的联想、想象、灵感、直觉支持的类比及非完全归纳优势,表现为对知识或信息的狭义处理和广义处理的发散与收敛的易变性或多元性(实质上也就是粗放性或通用性)。有必要通过协同运行,使它们优势互补;从载体方面看,就是要克服物理载体的机械性和生物载体的易变性,即实现人机之间的取长补短。 由此可见,本发明的重要性、必要性和可行性,不仅易于理解而且容易证实。 如果能够逐方面、逐阶段、逐层次、逐系统地实施本发明,那么知识信息的计量及测度这一国际难题的解决必将成为现实。那时,人类利用知识信息的整体水平和综合效能必将显著提高。进而,必将促使人工智能与人类智能的优势互补,形成效率更高的协同智能,促成形式信息革命向语义信息革命的时代飞跃。 从性能方面看,本发明,既可在信源端一劳永逸地解决非标形式的识别难题,又可通过信道实现默契通信以及借助交换终端实现一通百通的形式变换(包括多种语言乃至多元基因文本形式的通译)排除冗杂文本的干扰,还可在信宿端利用一元基因文本直接走短程捷径(防止或避免垃圾信息、知识爆炸和怪圈悖论),进一步,还可利用本发明对广义真实文本中涉及的知识信息进行自动测评,包括数量计算和价值评估。 总之,本发明通过人工智能与人类智能、电脑与人脑、电信网与神经网的优势互补,不仅能够显著地提高协同智能主体的效率及效能,而且能够显著地改进现有技术这种在总体上仍是高消耗、低效率的知识信息处理方式。因此,本发明不仅是工业化向信息化转换的利器,而且是形式信息革命阶段向语义信息革命阶段转变的利器,其应用涉及算、产、学、研、用等各个方面,适用于一切需要加速信息化进程以及需要进一步提高信息化工程的质量的国家或地区的法人及自然人。 实施例1 全域数码化网络,是由码、卡、表、库、网、端构成的融智网络(RZ-net),其中,码与其它具体的式之间具有对应转换关系,整个系统表现为纯数字形式和纯载体形式的交集,其特征在于:以码代式进行知识信息数据处理;纯数字形式,采用(a+bi…)的形式语言编制源程序,以(a+bi…)与(01)的交集作为编译程序;纯载体形式,采用卡、表、库、网、端的具体形式承载码。 纯数字形式,由基准参照系和应对参照系构成。其中,包含纯数字系统的全域基本元素通式与元素组合特式的演绎法则,即:全域基本元素0、1、2、3、4、5、6、7、8、9构成基准参照系,其它所有的数字都可由前述阿拉伯数字的组合构成,包括根据已知域运算符号及公式等数学法则及原理由基本元素衍生或派生各种各样的组合形式,涉及相应的时间程序和空间结构以及它们的整合架构或框架,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成应对参照系。只要识别上述通式或基准参照系,同时,又选择适当的特式或应对参照系,就能使电脑与人脑的优势互补,而且能使一劳永逸地复用已建立的基准参照系及应对参照系。 实施例2 全域数码化出版物,是由码 + 式、卡、表、库、网、端构成的融智出版物(RZ-print for client/server),由于码与其它具体的式的对应转换或联系,整个软件系统表现为纯数字系统的子集与其相应的具体的式的子集的交集或并集,如:以(bi…)表示的图、文(注:狭义的文)、数、表、音、像等各种具体的基因文本形式,其特征在于:码式并行的知识数据处理方式,即从广义真实文本中提取的多元基因文本元素及其组合构成的基准参照系及应对参照系,与纯数字系统中相应数元的基准参照系及应对参照系一一对应,其中,码式并行还表示每一个具体的基因信息元素及组合都是被相应数元的码式并行地为卡所承载的。 因为义、文(注:广义的文)、物、意,分别与(a + bi + cj + dk)一一对应,所以图、文(注:狭义的文)、数、表、音、像,分别与(bi…)一一对应。其中,广义的文,包括图、文、数、表、音、像;狭义的文,包括各种各样的语言文字或符号体系。 由此可见,实施例1与实施例2是“编号排位”与“对号入座”的关系。 全域数码定位方法,就是给基因信息及基因文本“编号排位”。其步骤是:(1)“编号”:在(a + bi …)代码体系与(0 1)数字体系之间建立一一对应关系,从而,构成全域数码体系,即本发明的系统软件;(2)“排位”: 在码与卡之间建立一一对应关系,进而,构成卡、表、库、网、端一体化的全域定位体系,即本发明的硬件形式,其中,卡为码的物化展示单位,表为码的物化操作界面,库、网、端是码的集中、分布、整合的物化结构形式。如:实施例1的纯形式系统。 纯文本系统及纯数码系统,就是在纯形式系统中,对已知域及目标域真实文本涉及的基因信息及基因文本进行“对号入座”。 也就是在融智网络中使其它基因文本元素及组合“各即各位”。其步骤是:(1)“对号”:在全域数码体系中给其它多元基因文本元素及组合进行代码定位;(2)“入座”:在全域定位体系中给其它多元基因文本元素及组合进行载体定位;(3)从真实文本中提取已知域基因文本,构成集大成共享基因文本(包括:数码文本)数据系统;剪接或重组目标域基因文本,构成集小成独享基因文本(包括:数码文本)数据系统。如:实施例2及实施例3。 动、静态一体化的融智出版物,主要有两种产品类形:(甲)是常例,即已知域集大成共享广义文本,通常以融智网络交换端服务器共享数据库(server:GXsjk)的形式发挥集中式全域数码化多媒体图书馆或百科全书的作用;(乙)是特例,即目标域集小成独享广义文本,往往以用户端计算机或其它终端机独享数据库(client:DXsjk)的形式发挥分布式全域数码化多媒体百科全书(如:摘要、选集、分册、简写本等个性化图书)的作用。 一方面(甲)是由(乙)聚汇并合并同类项而成,另一方面,(乙)是对(甲)有选择的复制或复用;(甲)和(乙)都可依托融智网络的支持,对真实文本协同实施域位解析,从而,均可自建相应的全域数码化广义文本数据系统;不仅(甲)与(乙)之间,可互为信源和信宿,而且,(甲)的子集之间或(乙)的子集之间,也都可以互为信源和信宿。 通过在纯数字系统相应数元的基本元素通式及元素组合特式与其它相应的多元基因文本元素通式及组合特式之间建立一一对应关系,即可实现任意一个基因信息元素及组合的同义的多元基因文本元素及组合相互之间的一通百通或并列通译。只要识别通式或基准参照系,同时,又能选择适当的特式或应对参照系,就能把电脑的演绎能力与头脑的直觉能力相结合使本发明产品在处理知识信息时发散与收敛得更到位,从而,可以准确无误地判定每一个知识点及表达式在整个知识及基因文本体系中的地位、作用和意义。 如果说知识系统工程的任务是建立其它相应的多元基因文本元素通式及组合特式,那么文化基因工程的任务就是在纯数字系统相应数元的基本元素通式及元素组合特式与其它相应的多元基因文本元素通式及组合特式之间建立一一对应关系。实施例2关于知识系统工程的任务及对策或办法举例说明如下: 1、以基本几何图形构成纯图形文本的基准参照系,根据已知域几何图形组合及其变换法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯图形文本的应对参照系。 应用示例:建立广告图案(特别是其中的商标类)、工业制图、电子地图、建筑制图、模型图、速写、素描、油画、国画等具体的基因文本共享数据库。 2、以基本字母或基本笔画构成纯文字文本的基准参照系,根据已知域字母或笔画组合(如:词素、词、词组、句、段、篇、章)及其原理或法则以及相应的标点符号及使用法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯文字文本的应对参照系。 应用示例:通过对用现有技术制作的字典、词典和各种各样的语料库进行改造使之全域数码化,建立词素、词、词组、句、段、篇、章等各种语言文字的基因文本共享数据库。除此之外,特别需要对各个学科、各个产业、各个领域的知识信息文献(包括教科书、专业著及论文、普及读物等)进行全域数码化改造,建立版权类、Know-why类、专利权类、Know-how类的基因文本共享数据库。 3、以基本数字(如:阿拉伯数字0、1、2、3、4、5、6、7、8、9)构成纯数字文本的基准参照系,根据已知域数字组合(如:不同数系的数以及数学形式)及其原理或法则以及相应的数学符号及使用法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯数字文本的应对参照系。 应用示例:建立从小学到博士后不同层次的几何类、代数类、分析类的基因文本共享数据库。 4、以基本表格或图表构成纯表格或图表文本的基准参照系,根据已知域表格或图表组合及其原理或变换法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯表格或图表文本的应对参照系。应用示例:建立各种程序、结构以及框架的简表及详表共享数据库。 5、以基本音素或音阶构成纯声音文本(语音或音乐)的基准参照系,根据已知域音素或音阶组合(如:音节及言语片段或旋律及乐曲)及其原理或法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯声音文本(语音或音乐)的应对参照系。 应用示例:建立国际音标、音节、不同语言的词语以及言语片段等版权类基因文本共享数据库;建立不同音调的音阶以及各种各样的旋律及乐曲等版权类基因文本共享数据库。 6、以基本透视图及三视图和基本色彩及色调构成纯视像文本的基准参照系,根据已知域视图组合和色调变换(如:各种自然物及人工物的立体或活体影像)及其原理或变换法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯视像文本的应对参照系。 应用示例:建立广告、工业制图、电子地图、建筑制图、模型图、教学演示、经济模型、产品模型、虚拟模拟、电影电视节目等版权类基因文本共享数据库。 7、以基本粒子构成纯立体文本(物质)的基准参照系,根据已知域粒子组合(如:原子、分子以及各种具体的物质)及其原理或法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯立体文本的应对参照系。 应用示例:建立全域数码化博物馆、文物馆或历史馆、太空馆等共享系统。 8、以碱基构成纯活体文本(生物)的基准参照系,根据已知域碱基组合(如:密码子、氨基酸以及各种具体的生物)及其原理或法则,派生出更多的更复杂的组合形式,各个具体的应用系统选择相应的目标域基因文本组合形式体系构成纯活体文本的应对参照系。 应用示例:建立全域数码化生物馆、标本馆等共享系统。 实施例3 全域数码化终端,是由式 码、卡、表、库、网、端构成的融智终端(RZ-client/server),整个系统表现为多元基因文本的一元数码文本形式,其特征在于:以码代式进行信息数据处理,在融智网络支持下,以动态形式的融智出版物的简式或省略形式进行远程协同操作及知识数据处理。 由此可见,实施例3是以实施例1和实施例2为依托进行知识产权监管和默契通信的全域数码化终端,主要以适合与其它终端进行直接通信的形式或方式发挥整合式全域数码化多媒体情报站的作用。如:随时“对号入座”地复用并复制新的或发现并公开新的基因文本元素及组合;在端与端之间互通有无或默契通信。 由于依托融智网络及融智出版物,融智终端可随时复制或复用任何领域的知识信息数据或基因文本,因此,不仅交换服务终端可以根据一元数码文本再现并提供相应的多元基因文本给用户,而且用户终端也只须存储有限的个性化信息数据(而无须重复存储冗余的知识数据,特别是通常无须重复存储冗余的多元基因文本,需要时只须以简式或省略形式)就能够进行海量的知识信息数据处理。融智终端不仅能自动对付冗余文本或垃圾信息干扰,而且能在基因文本的海洋中发现短程捷径。 以下结合附图和实施例,对本发明作进一步说明: 在图1中,(a + bi …)表示多元数系的一般形式,a0+{ a1,a2,…}表示实数或实部的一般形式a0+{ a1,a2,…},(bi …)表示虚部的一般形式。多元数(a + bi …),由实部(a)和虚部(bi …)两部分构成。实部或实数(a),指代本真信息,其中,每一个具体的数字(a)都表示基因信息元素(涉及已知域及未知域)在实数集合中的一个特定序位;虚部(bi …)对应于多元基因文本,每一虚数元(bi)都标识一类基因文本,如:标识图、文、数、表、音、像(包括立体与活体的文本形式),进一步包括标识多语种、多物种或多学科(注:每一个学科都有一套相应的形式语言)。 全域数码定位系统,是由基准参照系及应对参照系构成的全域数码化网络。其中,基准参照系,由全域基因文本元素0、1、2、3、4、5、6、7、8、9构成;应对参照系,通过选择适当的目标域基因文本组合构成,而各种各样的基因文本组合则是根据体现已知域相应的法则的其它数学符号和基因文本元素共同衍生出来的。作为确定具体基因文本的定位工具的参照系,其中,每一个数码都有一个特定的序位,每一数段都对应于一个基因信息元素(a)和多类基因文本元素(bi …)。 本发明对语义信息及真实文本的量化处理,就是借助文化基因通式的简式即多元基因文本通式(a + bi …)对特式或特例的解析而实现的。 在图1中,已知域(m,n)和未知域(x,y),涉及指代义、文(注:物可以被视为立体与活体文本,也可以用动态的音、像文本虚拟表示)的全域数码;目标域(a,b),涉及意——智能主体选择基因信息(即本真信息)及基因文本(即形式信息)的过程及状态。(a,b)尽管通常只是(m,n)的子集,但也可是(m,n)的并集,还可涉及(m,n)与(x,y)的交集。(m,n)与集大成共享基因文本数据库GXsjk属于同一范畴;(a,b)通常与集小成独享基因文本数据库DXsjk属于同一范畴。基因文本元素集合是完全归纳集,基因文本结构集合则多数是相对完全归纳集(因为它也有一部分是完全归纳集)。 全域数码集合具有完全归纳(或完全演绎、或完全类比)的特性。 设:a = b + c + d +… ,则:a 〉b c d … ,即:本真信息元素集合是唯一的全集,属于完全归纳范畴,广义文本的多元基因文本各子集即基因文本元素集合也属于全归纳范畴。又:(a + bi)(a + cj)(a + dk)… ,或:(a + bi)=(a + bi cj dk …),所以,(a + bi)是(a + bi + cj + dk + …)或(a + bi …)的复部,即:复数域暨复平面是智能主体出入多元数系暨多维空间(包括四维时空)对文化基因及其代码进行选域定位的转换界面。 本发明通过一系列量化转换界面出入多元数系暨多维空间对基因信息及基因文本的元素及组合进行选域定位。选域是选择虚数元,从而识别基因文本类别或通式;定位是在通式中确定具体代码的位置、位移及轨迹,体现为一系列代码组或特式。 图1表示全域数码文本形式的文化基因通式(a + bi cj dk)的最简表达式(a + bi …),这一数学模型集几何类、代数类、分析类于一体,涉及全域数码的异义排列、同义并列、经纬阵列、多维选列,在图2中表现为物理模型即量化转换界面。文化基因通式中包含许多具体的多元基因文本类型(bi …)。 同一基因信息的多元基因文本(包括标准与非标形式),可以通过同义并列实现通译或对应转换。无论是借助一元数码文本通式及其量化转换界面,以最简单且最经济的方式,直接处理本真信息(即:走思维捷径),还是选择具体的多元基因文本通式及其量化转换界面,以具体的用户最熟悉的形式,间接处理衍生形式或广义文本(即:寻找联想短程线),都必须依托统一的文化基因通式,因为它的全域数码包含了所有的多元基因文本通式(包括已知域及未知域)。 具体智能主体的DXsjk或(a,b)的聚会,可简化通约为GXsjk或(m,n)。(m,n)逼近(x,y)的过程是通过用户对相应的(a,b)具体操作实现的。借助共享网络(GXnet)和相应终端的协同运行,通过具体的计算、复制、复用、交换(或交流)、共享,任何一个DXsjk与GXsjk之间,都能够在全域数码化的条件下进行比较甚至互换。选域定位、协同操作和去冗存要,就是建立在这种可比性的基础之上的。正是基于此,对语义信息及真实文本的定性分析、定量分析和结构分析,才能通过文化基因通式及其量化转换界面对每一特式或特例的定位分析而实现。 在图2中,活页卡(K)和活动表(B)构成文化基因通式的最简物理模型。自动统计基因信息元素与自动计量基因信息组合,是通过基因文本元素及组合(如:结构、程序、框架等)的复用次数(注:统计全域数码和计量全域数码组)或复制件数(注:计算活页卡的数量)的自动统计及自动计量而实现的。 码、卡、表,是计量并操作基因文本元素及组合的基本工具。人(个、群、类)关于各物种、各语种、各学科的知识(意)与宇宙万象(物、文)及其机理或其运行法则(义)是否一致?只有在文化基因通式中通过对基因信息及基因文本的协同量化处理,才能做到既见树木又见森林。码、卡、表、库、网、端的有机统一,使智能主体可以对语义信息及真实文本进行高效率、低消耗的协同量化处理。 本发明对广义真实文本中的基因文本元素及组合的选域定位、协同操作和去冗存要,就是通过一系列记录并承载基因信息元素及组合的量化代码及活页卡的处理而实现的。 图1和图2是通过实施例1从纯形式的角度说明本发明。 由码、卡、表、库、网、端构成全域数码定位系统是完整的产品形式,包括: (1)全域数码系统软件(其中的量化转换界面是协同操作系统)及硬件,由实数代码及虚数标识与二进制数字一一对应而构成的全域数码化网络; (2)基因文本元素子系统,是存储与全域数码体系各子集相对应的图、文、数、表、音、象等基因文本元素的原型或样品的代码数据系统。它是以码、卡、表的形式表达的基因文本元素及组合的共享全域数码数据库(与实施例2所述的多元基因文本数据库相对应)及硬件,即全域数码化出版物,其内容是编译程序(其各个子集则分别与相应的多元基因文本元素构成的各个全域一一对应); (3)用户应用子系统,是用户选择的已知域基因文本系统(如:集大成共享基因文本数据库和共性化共享基因文本操作系统及载体)或目标域全域数码系统(如:集小成独享全域数码数据库和个性化独享全域数码操作系统及载体)的全域数码化终端。 在图3中,根据集小成独享数码文本数据库(DXsjk)与集大成共享基因文本数据库(GXsjk)之间的关系(即:它们所指代和承载的基因信息之间的等量关系,通过计算相同的全域数码及全域数码组的数量而判定),从算、产、学、研、用几个方面,说明本发明的以下基本技术性能及功效。 1、计算全域数码组即基因文本组合,当DXsjk等于GXsjk时,机器自为,即以自动统计的计量方式,进行代码化文化基因的演绎或完全归纳或完全类比推理。 2、复制全域数码组即基因文本组合,当DXsjk大于GXsjk时,人教机为,即以一劳永逸的生产方式,由用户指导机器学习——基因文本标准化,即对位识别。 3、共享全域数码组即基因文本组合,当DXsjk小于GXsjk时,机教人为,即以短程捷径的学习方式,由机器启发用户顿悟——基因信息载体化,即定位理解。 4、交换全域数码组即基因文本组合,当DXsjk不等于GXsjk时,人机共为,即以默契通信的研究方式,调适人机各方直觉——主体行为法制化,即约定交流。 5、复用全域数码组即基因文本组合,当DXsjk小于GXsjk时,机代人为,即以一通百通的应用方式,有关子系统协同联想——选域定位自动化,即移位表达。 图4表示现有科教知识体系支持的知识工程与本发明的文化基因全域数码文本通式支持的文化基因工程之间的关系。 在图4中,全域数码(No.)及全域数码组(Nos.)分别指代多元基因文本元素及组合。全域数码化的活页卡(K)专门承载基因文本元素及组合。箭头表示各个方面、各个阶段、各个层次和各个系统的知识信息以全域数码化和活页卡片化的形式进入集大成共享基因文本数据库或集小成独享数码文本数据库。协同智能主体通过活动表(B)展示量化处理语义信息及真实文本中的基因信息及基因文本的过程,如:对本真信息一劳永逸的复用、对基因文本一通百通的复制、对标准与非标形式的基因文本的并列通译。1/n是代数符号。“=”表示GXsjk与n(DXsjk)在网络的支持下基因信息总量的动态守恒。 由基础知识、专业基础知识、专业知识等构成的层次阶梯,表示以码、卡、表、库、网、端的形式对现有知识体系进行全域数码化改造的内容。 图4通过实施例2从多元基因文本的角度说明本发明。 图5和图6通过实施例3分别从网络(整体)与终端(局部)两方面说明本发明,涉及网络知识产权监管(图5)和终端之间的默契通信(图6)。 图5表示由已知域及目标域基因文本支持的网络知识产权监管体系。在图5中,n 和1/n是代数符号。共享数据库(gxsjk)、独享数据库(dxsjk)、国际互联网(internet)和局域网或内联网(intranet)是现有技术。它们均采用真实文本与二进制数字一一对应的数据转换模式或处理方式。由二进制数字和逻辑电路构成的共享通信网(GXnet)是连接现有技术与本发明技术的纽带。本发明采用全域数码及全域数码组与逻辑电路一一对应而构成的协同智能通信网或融智网络(RZ-net),是以集大成共享基因文本数据库(GXsjk)和集小成独享基因文本数据库(DXsjk)为支持的知识信息数据处理系统。等号表示在连网的条件下GXsjk与DXsjk可以是并集。本发明对网络知识产权的监管,是通过对全域数码及全域数码组的监管而实现的。对已知域、未知域、目标域的基因信息及基因文本的知识产权监管都是以公开或许可的方式体现的。其步骤是:首先,从真实文本中提取基因文本;然后,再将基因文本全域数码化,以便对复用或复制的数量进行统计或计算。 这就把网络中繁杂的语义信息及真实文本的知识产权监管简化为对全域数码及全域数码组的自动统计和监管。 图6表示由已知域及目标域基因文本支持的各终端之间的默契通信。 在图6中,信元装拆设备(CLAD)和异步转移模式(ATM)是现有技术。它只传输与真实文本一一对应的信元及信息段(即:二进制数字),而与文化基因全域数码及全域数码组无关。本发明技术则传输与全域数码组一一对应的二进制数字,通常不必直接传输全域数码文本以外的其它多元基因文本,更不必直接传输真实文本。信道只传输二进制数码,终端才存、处全域数码组(Nos.)以及相应的多元基因文本,并根据用户需要再现真实文本或重构目标文本。用户可以根据实际需要,至少在以下三个层次实现全域数码组以及基因文本组合与真实文本之间的对应转换,即:在交换机之间;在交换机与终端机之间,包括在CLAD与非ATM终端机之间;在终端机之间。 本发明的又一种表述如下: 本发明是处理语义信息及真实文本的文化基因工程方法及产品,具体包括: 一、文化基因工程方法,其步骤是: 1、在复数代码体系与二进制数字体系之间建立一一对应关系,从而,构成对指代文化基因的全域数码及全域数码组进行全域定位的数学模型。它涉及已知域及未知域,相当于一个拥有无穷多个座位及编号的超级剧场的“号码体系”; 2、以卡为单元载体,在码与卡之间建立一一对应关系,用表对之进行操作,以库、网、端的形式,构成对承载基因文本的元素卡及结构卡进行全程扫描的物理模型。涉及目标域,它相当于上述超级剧场的“座位体系”; 3、由码、卡、表、库、网、端,构成全域数码定位系统,如:实施例1,它相当于该超级剧场的整个号码座位体系;从真实文本中“对号入座”地自动提取相应的基因文本,从而,构成自由剪接或任意重组已知域及目标域基因文本的柔性加工用户模型,如:实施例2和3,它们相当于该超级剧场的以下“入场情形”,即:“实际入场”(有“入场者”,即已知域其它多元基因文本)和“虚拟入场”(无“入场者”,只有目标域其它多元基因文本的代码)两种情形]。 二、文化基因工程产品的三个实施例:(1)由“号码体系”和“座位体系”构成的纯形式系统产品,它相当于该超级剧场的整个号码座位体系;(2)由“实际入场”的已知域及目标域其它多元基因文本构成的纯文本系统产品;(3)由“虚拟入场”的已知域及目标域全域数码文本构成的纯数码系统产品。 域、位、点、式、码、卡、表、库、网、端的含义及特征: 域,即范围,在此是指:基因信息及基因文本元素构成的全域,即文化基因通式及基因文本通式涉及的范围,包括由派生的各种各样的基因文本组合构成的已知域、未知域和目标域(注:按智能主体对基因信息及基因文本的认知情况而划分)。 位,即位置,在此是指:基因文本元素及组合在基准参照系及应对参照系中的位置或序位。 点,即知识点,在此是指:基因信息元素及组合。 式,即表达式,在此是指:多元基因文本元素及组合。 码,即数码,在此是指:全域数码,包括多元数及其二进制数字形式,其特征是:由(a+bi…)及其(01)形式体系构成全域数码体系,并用它作为协同智能主体的标准语言或符号体系,同时,以复数系及复平面或曲面(a+bi…)的形式作为出入多元数系及多维时空的量化全域切换界面(使基因文本元素可控的基准参照系成为操作界面),通过时空变换产生无数的量化子域切换界面(使基因文本结构或程序以及框架可控的应对参照系成为操作界面)。其中,用实数指代异义排列的基因元素,用虚数标识同义并列的文本形式,用多元数表示多维阵列的多种基因文本。把已知域的其它多元基因文本简化为相应的全域数码文本,以便于人机协同处理,必要时再还原为相应的真实文本(通过基因文本通式给其它各种形式体系及元素选域定位——自动化的识别、理解、表达或通译)。 卡,即活页卡,在此是指:单元化操作页面,包括电子和非电子形式,其特征是:元素卡用于承载多元基因文本元素,附有异义单列的一个实部代码和同义并列的某个虚部标识;程序卡是元素卡的时间序列形式;结构卡是元素卡的空间排列形式;架构卡是程序卡和结构卡的综合形式。 表,即活动表,在此是指:多元化操作界面,即各个终端协同处理知识信息和协同操作载能载体的传感传播界面,其固化形式可是通用和专用芯片或光磁盘等,如:全域数码化的视窗操作界面及其各种应用软件,其特征是:它是由全域数码化的元素卡、程序卡、结构卡、架构卡构成的多码多卡多维阵列(包括经纬阵列或多维选列),附有异义排列的多个实部代码和同义并列的多个虚部标识;用于逐方面、逐阶段、逐层次、逐系统地展示文化基因,并对之进行各种各样的排列组合。 库,即数据库,在此是指:是由图、文、数、表、音、像等多元基因文本元素及组合构成的全域数码化出版物,其特征是:以基因文本替代真实文本作为存储对象,而且,所有的基因文本元素及组合都全域数码化。 网,即通信网,在此是指:是由全域数码体系和全域定位体系构成的融智网络,其特征是:以全域数码替代真实文本乃至其它多元基因文本作为传输对象。 端,即终端,在此是指:是既能以用户最熟悉的某种文本形式进行人机对话,又能在各个终端之间进行端到端默契通信的终端,包括:交换机、服务器、用户计算机、数字电话机、数字电视机、数字家电、传感器、终端芯片、IC卡乃至终端标识(如条形码和非电子化的活页卡)等等各种具体的终端形式,其特征是:以全域数码替代真实文本乃至其它多元基因文本作为处理对象。 上述十个方面的相互关系: 如果把本发明的产品形式比喻为一个超级剧场,那么,域,就是该剧场所有的座位及其编号可能涉及的任何一个范围,涉及各个实在或虚拟的分剧场;位,就是该剧场的各个被实在或虚拟地设置或占用的序位;点,就是该剧场的座位及编号被实际或虚拟地占用的具体分布情形;式,就是该剧场的座位及编号被占用的情形的称谓或叫法,涉及各种称谓体系;码,就是该剧场的座位的编号,它是上述所有的称谓体系中的一种既最全面又最简捷的标准称谓体系或全域数码体系;卡,就是该剧场的最简捷的标准座位形式;表,就是该剧场的座位及编号指南或视频向导;库,是该剧场的座位编号的集中形态;网,是该剧场的座位编号的分布形态;端,是记录该剧场占用情形的装置,包括出入口。 本发明方案涉及的部分创新概念的有关词语的基本含义说明如下: 1、文化基因,是从与物化基因(如:生物基因)对应的观点提出的概念。它包括基因信息及基因文本。文化基因的提取,是以活页卡的载体形式和全域数码的文本形式进行的,实质上就是从广义真实文本中提取其它多元基因文本并对之进行文面表达。文化基因的剪接或重组,是以活动表的界面形式进行的,实质上就是对基因文本组合中各个元素的序位进行剪辑或重构。文化基因的提取、剪接或重组的过程,也就是各个智能主体对基因信息及基因文本进行选域定位、协同操作和去冗存要的过程,即在用全域数码文本表达的文化基因通式中,对具体的基因信息及基因文本的位置、位移及轨迹进行全域数码定位。文化基因的提取、剪接或重组的结果或成果,或集中、或分布、或整合,以便于为用户复用或复制(含交流与共享)。 2、基因文本元素代码,是指代或替代其它多元基因文本元素的代码(a + bi…),如:图、文、数、表、音、像等各类(bi…)基因文本元素代码。 3、已知域基因文本元素,是智能主体(包括:人类智能、人工智能、协同智能等主体形式)已知范围内的基因文本元素,如:图(基本几何图形)、文(拼音字母,汉字的基本笔画)、数(如:阿拉伯数字符号)、表(基本表式)、音(音素,音阶)、像(基本的三视图,三原色)。 4、异义排列、同义并列、经纬阵列、多维选列,是指在文化基因通式中,基因信息的异义排列(a)、基因文本的同义并列(bi …)、文化基因的经纬阵列(a + bi)或多维选列(a + bi …)。 5、基因文本组合代码,是相应的基因文本元素代码的组合。 6、对位识别、定位理解、移位表达、域位解析,是指在文化基因通式(a + bi …)中借助多元转换界面对其它具体的多元基因文本进行“对号入座” 的过程。 7、全域数码,是(a + bi …)代码集合与(0 1)数字集合的交集的元素。采用复数形式的目的是对基因信息及基因文本进行全域定位,采用二进制数字或数据形式的目的是便于人工智能主体对之进行(广义的)处理。 8、去冗存要、去冗处要、去冗传要、去冗馈要,是由广义真实文本到基因文本(包括全域数码),以及由未知域到已知域再到目标域的收敛过程,涉及对知识信息数据的广义处理(即:输入、存储、处理、输出、传输、反馈)和狭义处理 。 9、协同智能,是人工智能与人类智能的协同运行方式。协同智能主体是智能主体的一种进化形态。 10、基因文本元素,是构成基因文本组合的基本元素,如:图、文、数(含全域数码)、表、音、像等各个形式体系的基本元素。 11、全域定位,是指:基因文本元素在其所属的全域中都有特定的序位,所有因各个基因文本元素的时空变换而构成的基因文本组合(涉及已知域、目标域、未知域),在基因文本通式中都有各自相应的序位记录。 12、协同操作,是以量化转换界面(表),把指代已知域图、文、数、表、音、象,以及各语种、各物种和各学科的基因文本,用码和卡进行分解与组合,以库、网、端的形式,进行集中、分布、整合的处理,以便人机协同探索未知域。 13、基因文本组合,是构成广义真实文本的各种基因文本程序、结构、框架,它本身则由基因文本元素所构成,如:图、文、数、表、音、像等各个形式体系的不同层次的程序或结构及框架。 14、横断扫描,是利用全域转换界面,对广义真实文本中包含的基因文本,进行逐方面、逐阶段、逐层次、逐系统的全域扫描或有针对性的搜索。 15、分离与组合,是系统或用户利用全域转换界面,借助码和卡对广义真实文本中的基因文本,进行提取、剪接或重组的基本操作。 16、去冗存要,是指集小成独享基因文本或用户终端(可以是交换机、服务器、计算机乃至其它各种具体的个性化终端等等形式)从广义真实文本中提取基因文本并全域数码化的过程。 17、全域数码文本,是全域数码及全域数码组这一特殊的基因文本形式。 18、柔性加工,在此是指系统或用户借助基因文本对真实文本的随意加工。 19、文化基因通式,是由义、文、物、意四元素构成的融智概念体系的基因形式,其数学形式涉及:复数、四元数(特例)乃至其它多元数的相应形式。 20、人机优势互补,是指:一、人机两方面在知识信息数据处理领域的优势互补,如:推理、学习、顿悟、直觉、联想等人类智能的优势与计算、复制、共享、交换、复用等人工智能的优势的协同互补;二、人机两方面在载体载能形式变换领域的优势互补,如:生物载体的易变性等人类智能主体的特点与物理载体的机械性等人工智能主体的特点之间的协同互补。 21、自动测度(包括自动统计和自动计量),是指本发明对基因文本在全域中的序位记录(涉及复制、复用、共享、交换的数量)进行的自动计算。如:在整个网络中对某些全域数码组或基因文本组合的实际使用和交换数量的自动测量。 22、一劳永逸,是指只要复制一次就能多次复用。 23、短程捷径,是指一劳永逸地共享已知域多元基因文本。 24、默契通信,是指主体之间心有灵犀一点通的默契交流在全域数码化网络以及出版物或终端中的体现,即:实部编号确定本真信息,虚部标号确定多元基因文本的类型,根据全域数码即可再现已知域多元基因文本及目标域真实文本。 25、一通百通,是指全域数码化基因文本一通百通,因为表示同一基因信息的多元基因文本实部编号一致,所以基因文本只要全域数码化就可以随时随地转换成为已知域多元基因文本的其它任何一种形式。 26、本发明的应用涉及电信网(以tel.表示)、广电网(以TV表示)、计算机网(以computer表示)、出版物网(以CPU,IC,CD-room or paper表示)。 http://www.systemscience.org/main/index.htm 系统工程之窗 论文专区(公开发表时间2000-12至2001-5):《一种知识信息数据处理方法及产品》 该发明已于2000年11月29日在国家知识产权局的中国专利《发明公报》第16卷48期提前公开,申请号是 001093800 ,公开号是CN1274895A,全文20088字,六幅图解。 原创者、发明人兼著作权所有人:邹晓辉 注:2001年6月该发明专利荣获北京中国专利博览会金奖,同时,被誉为是创新程度最大的一项基本发明专利。
个人分类: 学术研究|1006 次阅读|0 个评论
我们近三年发表的部分论文(中国知网和万方数据)目录
geneculture 2015-1-19 17:28
中国学术期刊网络出版总库 共找到 7 条 邹晓辉,邹顺鹏. 两大类形式化方略 . 计算机应用与软件 . 2013(09) 邹晓辉,邹顺鹏. 当代中国大学新使命:基于汉语思维与双语处理的文化传承和创新 . 南京理工大学学报(社会科学版) . 2012(05) 邹晓辉,邹顺鹏. 间接计算模型和间接形式化方法 . 软件 . 2011(05) 邹晓辉,邹顺鹏. 虚拟的孪生图灵机——以双语信息处理为例 . 软件 . 2011(08) 邹晓辉,邹顺鹏. 软件工程学科何以独特——形式化方法的双重路径 . 软件 . 2011(07) 邹晓辉,邹顺鹏. 协同智能计算系统——理论模型及其应用 . 软件 . 2011(06) 邹晓辉,邹顺鹏. “云计算”概念的分析研究——协同智能计算系统的一个特例 . 软件 . 2011(09) 中国优秀硕士学位论文全文数据库 共找到 1 条 邹顺鹏. 高校教育学科建设理论探新 . 中国地质大学(北京) 2012 中国重要会议论文全文数据库 共找到 2 条 邹晓辉,邹顺鹏. 言和语的关系——在语言和言语的区分基础上进一步 . 第四届中西语言哲学国际研讨会论文摘要集 . 2012 邹顺鹏,邹晓辉. 论公平视域下当代科学通识教育的前瞻性——从《面向全体美国人的科学》得到的启示 . 第二届首都高校教育学研究生学术论坛论文集 . 2011 国际会议论文全文数据库 共找到 1 条 邹顺鹏,邹晓辉,刘志方. 大学的教育与管理“迭交”模型 . Advances in Artificial Intelligence (Volume 3)——Proceedings of 2011 International Conference on Management Science and Engineering (MSE 2011) . 2011 2014中国知网(cnki) 《中国学术期刊(光盘版)》电子杂志社有限公司 1 间接计算模型和间接形式化方法 (被引用 3 次) 《软件》 - 2011年5期 邹晓辉 邹顺鹏 ZUO Xiaohui ZUO Shunpeng 本文旨在从人机交互界面与协同计算程序结合而构成协同智能计算系统的角度,论述间接计算模型和间接形式化方法结合所支持的优化云计算技术原理.本文在系统回顾图灵可计算理论、克莱尼小字符串形式理论、冯诺依曼数字计算机... 关键词:计算理论 形式理论 人机交互 协同计算 查看全文 - 下载全文 - 导出 - 引用通知 2 两大类形式化方略 《计算机应用与软件》 ISTIC - 2013年9期 邹晓辉 邹顺鹏 Zou Xiaohui Zou Shunpeng 阐述机器翻译的两大类形式化方略。其中,第一大类形式化方略涉及:编程语言和英语(自然语言);第二大类形式化方略涉及:二进制数与十进制数、十进制数与汉字中文、中文和英文(可换)三类双语协同变换,属于形式化及其拓展研究领... 关键词:机器翻译 形式化 双语信息处理 Machine translation Formal method Bilingual information processing 查看全文 - 下载全文 - 导出 - 引用通知 3 协同智能计算系统——理论模型及其应用 (被引用 2 次) 《软件》 - 2011年6期 邹晓辉 邹顺鹏 ZOU Xiaohui ZOU Shunpeng 本研究工作目的是揭示计算机数据与自然人知识两类信息处理方式基础之上派生的协同智能观及其指导下的协同智 能计算系统的理论模型及其应用.它涉及的可验证方法,一方面,在 n2 矩阵范围内,以等价于 2n 的发散方式枚举和... 关键词:计算机 间接计算 间接形式化 软件 查看全文 - 下载全文 - 导出 - 引用通知 4 软件工程学科何以独特——形式化方法的双重路径 (被引用 1 次) 《软件》 - 2011年7期 邹晓辉 邹顺鹏 ZOU Xiaohui ZOU Shunpeng 本文旨在以数字和文字双语信息处理为例论述软件工程的第二路径及其重要意义.具体涉及如下两个问题及其解答:第一,软件工程学科何以独特?在其解答过程中进一步提出了软件工程的双重路径问题;第二,软件工程的第二路径为什... 关键词:软件产品 软件工程服务 双语信息处理 间接形式化 查看全文 - 下载全文 - 导出 - 引用通知 5 当代中国大学新使命:基于汉语思维与双语处理的文化传承和创新 《南京理工大学学报:社会科学版》 - 2012年5期 邹晓辉 邹顺鹏 本文旨在从理论和实践两方面论述当代中国大学传承和创新人类文化的新使命。采用双语信息处理的研究方法,具体包括:广义和狭义、言和语、宏观与微观、世界观与方法论,四组相辅相成的基本划分。其研究结果不仅涉及:信息学、语言... 关键词:形式信息学 形式语言学 高等教育学 科学哲学 协同智能计算系统 双语处理 formal informatics formal linguistics higher education philosophy of science collaborative inteUigent computing system bilingual processing 查看全文 - 下载全文 - 导出 - 引用通知 6 云计算概念的分析研究——协同智能计算系统的一个特例 《软件》 - 2011年9期 邹晓辉 邹顺鹏 ZOU Xiaohui ZOU Shunpeng 本文作者拟从云计算提出的源头及其可能的新发展两个方面来对它做一个系统的分析和展望.旨在为云计算理论与技术的普及和提高开辟新途径.自2006 谷歌101 项目公开提出云计算(cloud computing)至今,信息产业界说它是一种... 关键词:云计算理论 云计算技术 云计算服务 查看全文 - 下载全文 - 导出 - 引用通知 7 虚拟的孪生图灵机——以双语信息处理为例 《软件》 - 2011年8期 邹晓辉 邹顺鹏 ZOU Xiaohui ZOU Shunpeng 本文阐述一种虚拟的孪生图灵机,即:由两个图灵机组成的孪生并行计算机,其特征是其受限模式与派生模式分别由汉语的言即单音节字的基本符号对象和语即双音节多音节字组的符号组合解释为例加以说明.其作用在于基于它可建构... 关键词:图灵机 人机交互 双语信息处理 查看全文 - 下载全文 - 导出 - 引用通知 8 从形式化表述角度论哲学和科学的关系 邹晓辉 邹顺鹏 ,2013 - 首届国际信息哲学研讨会   本文旨在从形式化表述角度论述哲学和科学的关系,实质上就是探讨信息、语义、知识和智慧能力及其作用价值的内在联系。其方法是:首先,采用人机均可理解的算术语言来构造一个虚拟的形式化矩阵,其特征在于其序位关系唯一守... 关键词:信息 语义 知识 智慧能力 作用价值 万方数据知识服务平台--国家科技支撑计划资助项目(编号:2006BAH03B01)©北京万方数据股份有限公司 万方数据电子出版社
个人分类: 学术研究|824 次阅读|0 个评论
言和语的序位关系:在语言和言语的形式化方向前进一步
geneculture 2015-1-19 11:41
言和语的序位关系:在语言和言语的区分基础上从形式化方向前进一步 作者:邹晓辉Geneculture 【摘要】 本文旨在从哲学反思和科学预言两个角度来探讨言和语的序位关系。其科学意义是在语言和言语的区分基础上由自然语言理解的形式化信息处理的方向前进一步;其哲学意义是在理性演绎和经验归纳的结合基础上采用测序定位的逻辑来分析比较在双字棋盘中蕴含的各种最基本最真实的序位分布函数关系从而可把过往一直被认为是高深莫测的心智活动以书面的广义双语的形式直观地呈现方面前进一步。本文的研究途径或方法是:首先,以形式化方式明确一般的语言科学乃至信息科学的研究对象--区分有限的基本研究对象和逐级逐层地可扩展可派生的研究对象,进而,以有限的基本研究对象所组建的中文棋盘作为总参照系测度逐级逐层地可扩展可派生的研究对象在双字棋盘中可测序定位的分布函数即作为本真信息的序位关系,最后,可在锁定的有限域来测量并预测各类用户主体及其人工智能代理在双字棋盘上所做的各类具体选择--实际上就等价于以书面的广义双语的形式直观地呈现过往一直被认为是高深莫测的心智活动。其结果是:第一,发现了从书面汉语中提炼的言(单音节的字)和语(双音节及多音节的字组)所具有的可间接形式化的特点不仅符合自然数的数字化理想集合分类的特征,而且,还可以分别从普通语言学和形式语言学也即普通信息学和形式信息学这两个角度来改进并优化语言研究以及语言信息处理中遭遇的两大类基本问题,即:分与合的诸多问题,以及言和语的定性分析以及划界分类与定量分析的问题。
个人分类: 双语信息处理|830 次阅读|0 个评论
建基于(普通、形式、基础、广义)语言学和信息学的理论融智学
geneculture 2015-1-15 20:37
建基于(普通、形式、基础、广义)语言学和信息学的理论融智学研究焦点: 广义文本及其遵循的“同义并列对应转换”法则;本真信息及其体现的“序位关系唯一守恒”公理。 它们对于以下的技术和艺术两大类实践具有指导作用: 着重于逻辑学和软件学的工程融智学的焦点之一在于“语言、知识、软件、硬件”形式化系统工程; 着重于教育学和管理学的应用融智学的焦点之一在于“教育、管理、学习、应用”社会化系统工程。
个人分类: 双语信息处理|724 次阅读|0 个评论
纪念博客开通
热度 2 bobotianxia123 2015-1-13 02:06
从2007年读研开始,就很喜欢读科学网上的博客,各种真知灼见有醍醐灌顶之功效,但更喜欢的是那些不人云亦云的观点与看法。这种批判性思考是思维真正的力量。 感谢科学网终于给我开通了博客。真的感谢。 然而,我曾与2012年申请过,当时没给我开通,私下里理解估计我是一个学语言学的学生,离科学很遥远。可明明有同一个学校出来的很活跃的人文学者也在科学网上,每每占据头条。 这次,申请再次开通,加上了自己在哥大学习的教育经历,结果,就给我开通了。 我不想是因为这个学校的原因,更多的我真心希望是科学网会给更多的从事社会科学的学生学者一个平台。 当然,社会科学到底是不是科学,这在很多从事理工科学者眼里是有争议的。但是争议是争议,至少给一个我们可以说话和表达意见的地方。 再次感谢科学网终于给了我这样的机会。会好好珍惜,有空多写些博文。 以此纪念博客的开通。
个人分类: 个人心得|1679 次阅读|2 个评论
融智学导论(专著)通俗版(提要简纲)
geneculture 2015-1-1 07:15
(理论、工程、应用)融智学(三部曲)与文化基因系统工程:集人类知识技能之大成的群英实践活动(不仅是中国用“三类双语”化解语言非主流、知识缺原创、软件无根基“三大瓶颈”难题的三大系统工程融大智活动,而且也是国际社会战胜其相应的另类“三大瓶颈”认识理解中华文明文化深厚底蕴的共大享的认知升华活动) 绪言:从字本位与中文信息处理(隐形双语)发展到言本位与广义双文信息处理 1,盲人摸象(普通语言学或普通信息学:西方语言学和中国语言学的世纪冲突) 2,公婆之争(形式语言学或形式信息学:英文形式化与中文形式化的表里冲突) 3,各就各位(语言知识软件硬件形式化系统工程方法:大小字符并行双重路径) 4,各尽其能(教育管理学习应用社会化系统工程结果:AppMOOR与终身教育) 5,各取所需(报告讲座实训实操智能化系统工程探讨:双融O2O体验场馆到户) 6,各得其所(蓝图模型样板推广一体化智慧城乡探索:自然社会人文人心人工)
个人分类: 双语信息处理|840 次阅读|0 个评论
第十三届全国计算语言学学术会议(CCL2014)心得记录
breezezhou 2014-10-26 09:28
CCL2014 会议报告 第十三届全国计算语言学学术会议( CCL2014 )在湖北武汉华中师范大学召开。本次会议共有 4 场特邀报告。 1 特邀报告 1.1 Approximating Semantics 第一场特邀报告是加拿大滑铁卢大学的李明教授做的汇报,他的题目为 “ApproximatingSemantics” 。主要介绍了如何计算语言距离( semantics distance )。目前的搜索引擎和问答引擎基本都依赖于语义和语义距离。但是语义距离是不可定义,难以计算并且多数情况下是模糊的。李明教授等人利用自然语言编码系统验证理论并在 QA 系统上进行了实验。他们的工作旨在为该领域构建一个理论框架。 他们研究工作的基本思想如下图所示:即利用一个中间理论和一个已经定义的理论来计算语言距离。 报告共关注并解决四个主要问题:( 1 ) keywordsvs templates; ( 2 ) domainclassification; ( 3 ) what Isaid vs what it heard; ( 4 ) whatit translates to vs what I meant 最终得出结论如下图: 小结: 李明教授的报告逻辑清晰,将一个复杂问题以一种简单生动的方式讲述。其中给我最大的启发就是 “ 曲线救国 ” 的思想。比如:( 1 )现在我无法定义 A ,但是我可以定义 B 和 C ,并且 A 与 B 是相关的 ,B 与 C 是相关的,那么我就可以通过 A-- à B- à C 来实现自己的目的。( 2 )在进行 QA 系统构建时,需要对问题进行聚类,由于问题是五花八门的难以实现聚类,或者聚类效果不佳,此时可以通过结果聚类,即将答案相同的问题进行聚类,这样可以明显的节约人力物力。 1.2 Boosting 25 年 第二场特邀报告是南京大学的周志华教授做的汇报,他的题目为 “ Boosting25 年 ” 。主要介绍了如何集成学习最著名的算法族 -- Boosting 。 Boosting 作为红极一时的主流机器学习方法,其影响甚至已经超越了机器学习领域自身。各种 Boosting 算法被广泛运用到几乎涉及数据分析建模的各个领域。该报告中周志华教授对 Boosting 及最近的一些理论进展进行了介绍。 周教授开篇先介绍了何为集成学习,并简单介绍了一些高效的集成算法。 由此引出 AdaBoost 的产生以及不同学派(主要为 Margintheory 和 statistics views )对它的不同理解。 AdaBoost 为何有如此高的影响?首先它简单并且高效;其次,它生成了算法的 boosting 家族;然后它已有具有影响力的理论结果。 在接下来的报告中,周教授以一种讲故事的口吻将 Margintheory 和 statisticsviews 两方学派就 boosting 的辩论娓娓道来,既生动又具有科普性。 1.3 Processing Construction-based PragmaticConstraints during Sentences Comprehension 第三场特邀报告是北京大学的周晓林教授做的汇报,他的题目为 “ProcessingConstruction-based Pragmatic Constraints during Sentences Comprehension” 。主要介绍了神经语用学和句子理解等相关知识,以及如何通过心理学实验发现人们在进行语用理解时,大脑神经的状态变化。 汇报人首先介绍了心理学的相关知识。心理学研究的方法主要有三种,自然观察法、个案研究、问卷调查与量表调查和实验研究。其中,实验研究主要是为了探索因果关系,首先控制、平衡无关变量(额外变量),通过操纵感兴趣的自变量,观察因变量上的效应,来建立自变量与因变量之间的因果关系。 语言心理学家主要研究的有这样几个方面: 1. 我们理解并且产生我们所要说或者要写出来的语言的过程,是指某一秒的状态; 2. 这些过程中产生的语言输入和输出的表达,对状态的描述; 3. 完成这些过程所需要的知识; 4. 小孩子是如何发展自己的语言学的知识和说语言的过程; 5. 语言理解、产生和获取的神经科学(认识系统)。 周晓林教授提出某些句法结构除了具有其本身所组成单词的词意,还单独含有的一些抽象意义。语言理解通常被视为一个过程,从语言和额外的语言信息集成信息来源,建立状态或事件被描述的心理表征。因此对于语言处理过程的神经认知研究的目的,一方面是阐明人们在做出语言推理时大脑是如何运作的,比如,根据知识、谈论以及社会化的上下文来挖掘一句话扩展出的意思。另一方面,处理人们语言认知错误或者失败的情况,比如化解人们在语言输入以及语用理解时发生的冲突现象。在研究中,他们使用了与事件相关电位 (ERP) 和功能性磁共振成像 (fMRI) 技术研究大脑如何约束句子理解。在实验中,创建了一个不合适的条件和一个未指定条件和比较两个控制条件的低预期性描述一个事件。研究结果揭示了微分大脑机制使语用推理和处理在句子理解语用失误。 1.4 Linking Text with Data and Knowledge Bases 最后一场特邀报告是微软亚洲研究院首席研究员 JunichiTsujii ,报告题目为 “LinkingText with Data and Knowledge Bases” 。报告主要关于实体链接,句子解析和知识还有段落释义。 首先主要讲了如何从大量的生物医学信息中挖掘文本,将生物医学信息变为医药科学信息。人们主要有两种研究方向,一个是理性主义的理论导向研究,另一个是经验主义的数据导向研究。随着统计机器翻译的提出,越来越多的研究趋向于数据导向,但是这个实际上对研究不会有实际性的改变,因此报告中提出要将数据与理论结合起来。 那么大量的文本和知识之间如何建立关联?一种方式是从文本(新闻,文章)中挖掘出知识,并可以建立成库( Freebase , Yago , MSRA , Wikipedia , KS )。另一种方式是从知识库中 trigger 出文本。文本的 “MS” 在知识库中可能表示 IT 公司 “Microsoft” 或者医学上的 “MultipleScierosis” (多发性硬化),研究者需要将这样的文本在知识库中通过类别 - 实体的形式表示出来,进而从对实体之间的关系挖掘发展到对实体之间的关系表达进行挖掘。 后来 JunichiTsujii 简单介绍了将句子解析存储到文本数据库中的过程。比如一句话 “MSbought last month the company which had been sued by Apple two years ago.” 语义化的表示前半句动作是 buy , agent 是 MS , object 是 thecompany , time 是 lastmonth 。后半句中的动作是 sue , agent 是 Apple , object 是 thecompany , time 是 twoyears ago 。这句话中的两个实体是 {SM, Apple} , 即 E-id-100{MS,Microsoft, MSFT, MSFT Corporation,etc.} 与 E-id-123{Apple,Apple Inc, Apple Computer Inc…etc.} 。共同出现的是 the company , E-id-500{Skype} ,规范化时间 lastmonth{June/2011} , two years ago 未规范。动作识别是 buy , MA(arg1:MS,arg2:Skype). 这个事件连接起来就是 MA(arg1: E-id-100, arg2:E-id-500) ,作为 Event-id-1234 。这样的句子解析虽然提高了精确度,但是速度仍然很慢。最后讲了不同等级的段落释义,分别是语法、语义、推论和世界知识。他们将段落解析成树形结构,对于段落之间的比较也就是树形结构的比较。 通过实验最后得到的结论是,数据引导的技术与理论引导的框架可以结合起来运用到系统中。大量的知识资源可以被人们利用起来,推理的统计模型同样变得易于运用。基于知识的推理与自然语言处理结合起来将会成为自然语言理解的实际框架。 2 分组报告 2.1 一种基于弱监督学习的论坛子对话分类方法 本文的研究对象是 MOOC 平台上的用户帖子,研究思路是将按照时间排序的帖子(线结构)重新排列为按照对话关系排列的帖子(树结构)。 作者给出了这样的研究方法。首先,将 T 个线索的 m 个帖子 {p 0 ,p 1 ,…p m-1 } 组成的每个 p i 对话行为类别标记为 c i 。而对话行为的类别分为 Question , Answer , Reproduction , Other 。在每个类别下,对其对话功能进行进一步划分,比如 Question 这一类进而被划分为 Question-Question , Question-Add , Question-Correction 和 Question-Confirmation 。 作者将论坛中的帖子进行完全标签,选择基于广义期望准则的条件随机域模型为若监督学习方法。选用的特征有,词特征: TFIDF ;结构特征: initiator , position ;语义特征: qmark , emark , url , postSim , TitleSim ;发帖人特征: UserRank 。分别利用结构特征,简单语义特征,语义相似度特征的不同组合对论坛上的子对话分类。 2.2 社交网络账号的马甲关系辨识方法 目前普遍使用马甲关系识别方法有,账号名识别与语言风格识别。而账号在社交网络中的相关信息主要有四种: 1. 账号注册信息,对账号某些相关的信息进行利用; 2. 账号发言文本,通过文本的内容对作者进行识别; 3. 账号的某些特定行为(登陆,点击等)。 4. 账号之间的社交关系。前面两种信息使用的过程较多。 文章中的识别方法的第一步是特征提取,网络文本特征提取:将单个文本中所有字的 n-gram 作为特征统计计算得到的文本对应的向量。账号回复关系的特征提取,将被回复的账号作为特征,统计计算得到关系的特征向量。将每两个用户组成一个 pair(i,j) , i 和 j 均有马甲且属于同一组则判断为正,否则判断为负,最后求出马甲组。 2.3 基于单文本指代消解的人物家庭网络构建 社会关系网络在当今信息化社会中具有重要作用,报告者提出传统的社会关系网络分析( SocialNetwork Analysis , SNA )着眼于以人为个体,忽略了家庭作为一个整体对社会网络的影响。文章从构建家庭网络入手,在新闻语料中挖掘人物家庭关系。 自举学习的过程主要是:模式发现,模式评估,实例发现与实例评估。首先,模式发现是指给定种子 A,B ,抽取文本 “….A 的妻子 B….” ,抽取模式得 “Husband 的妻子 Wife” 。模式评估是指采用 PMI 衡量模式 p 与人物对 {x,y} 之间的关联强度,每个定义模式 p 的 可信度与每个实例 i 的平均关联程度有关。实例发现是指利用已有的模式发现实例,实例评估的过程引入了打折因子。 基于指代消解的人物家庭网络融合有三步:人名精确匹配,重名消歧和多名聚合。将具有相同名称的人名作为连接点,通过连接点将不同的人物对联系起来,同时计算同名人物之间的余弦相似度,去掉低于某个阈值的同名人物,最后在家庭内部采用最小编辑距离的方法进行人物的多名聚合,当人名之间的相似度大于某一阈值,将它们归入同一指代链,并形成最终家庭。句子 “A 的妻子 B” 与句子 “A 和他的妻子 B” 实际上指的是一个意思,但是往往会出现指代错误。另外,文章中还运用英文中的中心理论 { 前向中心,后向中心,优选中心 } ,距离,先行语和指示语特征等。 2.4 基于有监督学习方法的多文档文本情感摘要 该文章利用亚马逊( Amazon.cn 和 amazon.com )上的产品评论进行情感摘要。共采集了中文平路 6000 条,英文评论 15000 条。该文章在预处理阶段集合了多种特征, 包括质量特征(即每条评论的有用性),情感特征等;最终利用最大熵进行了情感分类。 2.5 面向微博文本的情绪标注语料库构建 该文章有徐睿峰老师报告。他们的标注层级共有两级:微博级和句子级。一共标注了 14000 条微博, 45431 条句子。其中情绪类别参考了大连理工的分类方法,共分成了 7 类。其构建的语料库均可以在 NLP-CC 下载。在完成语料库构建的同时,他们还研究了用户的情绪转移和情绪伴随。
4496 次阅读|0 个评论
“接近第二宇宙的速度”???
热度 4 lev 2014-8-11 23:39
“接近第二宇宙的速度”??? 中午看新闻,就不说哪个台了。播音员在介绍探月工程“绕落回”,提到探测器从月面返回时速度“接近第二宇宙的速度”——第二宇宙?俺还以为出了“新理论”突破。 这个“的”字,用的是相当惊天地泣鬼神(估计是卡壳找补上的) ! 当然啦,这跟当年松花江泄露事件中的“三甲基一氯硅烷——盐酸”比,不算什么。也许,正应了 Wittgenstein 说法, 这个问题,那个问题,归根结底都是语言学问题 !
个人分类: 莫名其妙|3117 次阅读|6 个评论
没有语言学的 CL 走不远
liwei999 2014-7-10 13:53
很多人看不上语言学。看不上是因为觉得用不上或没必要,有时候,某些任务基于关键词的系统(实际上是隐形知识系统)与 基于知识的系统(实际上是显性知识系统 ) 同样可以完成,质量可以匹敌,而且前者开发周期短,也更鲁棒。看不上更深一层的原因是不了解,对于缺乏理解的东西,忽视是比较便利的对策。语言学这门学问,要想抓住它,说简单也简单,说难也难,看上去不文不理的,除了田野工作的积累和触发外,还需要某种悟性才能在宏观把握理论精髓,在微观操作知识系统。从索绪尔对语言原则的概括,到乔姆斯基的天马行空,一眼看过,往往不得要领,硬着头皮看下去,又太枯燥,缺乏一种立竿见影的痛快。 见过在 CL(Computational Linguistics)/NLP (Natural Language Processing)这行有年头的部分精算师(统计学家),甚至语言学基本概念都缺乏,令人诧异。但是无视或忽视语言学迟早还是要陷入语言知识的泥坑。一袋子词加上ngram序列的统计模型确实可以逼近和模拟浅层的语言知识,以至于使人忘记了隐藏其后的语言学。但是那里有个天花板,没有语言学的CL是冲不上去的。 【外一则】手工系统和机器学习的两条路线之争 谈两条路线的斗争,也是老生常谈了,但由于有谷歌用手工这个话题,才有更多人愿意听。 此前,很多人包括我自己,都被忽悠了(吴军写过《数学之美》,文章写得极好,富有趣味和煽动性,激励了很多年轻粉丝,其中就灌输了谷歌的成功是数学和统计算法的成功,非常唯美,偏颇之处是完全不提谷歌的实用主义),以为谷歌必然是机器学习的,排斥手工的。Page rank 算法是搜索的基础,与手工系统无缘。直到最近才知道,在工业界,实用和效果才是铁律。谷歌搜索这么重要的产品,绝不会去盲目追求学界的潮流。手工好用,就用手工,他们不傻。 谷歌这件事对于 hand-crafted 的主流偏见,是一个反动,这个 endorcement 非常有价值,可以引用作为手工系统之活力的有力旁证。 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|4594 次阅读|0 个评论
《旧文翻新:我发表的第一篇 Book Chapter》
liwei999 2014-6-23 18:15
立委世界语论文:Lingvistikaj trajtoj de la lingvo internacia Esperanto(世运资料存档) 【立委按】 这篇世界语论文是我一辈子的骄傲,当年文思泉涌一发不可收的情景仍然历历在目。作为一位世界语与语言学的新手,对这门语言的语言学特点的感悟和表达,能够受到誉满世界的语言学老前辈和世界语老编辑 Juan Regulo 的青睐和指点,既是我的幸运,也肯定了我的才能。20年后重读这篇洋洋洒洒一气呵成的论文,我仍能感受那文字的自由挥洒。原文影印如下,等有闲再电脑输入,既作为世界语运动的资料,同时也纪念早已逝去的风华岁月。 唉,人岁数大了,做好汉就难,总爱吹嘘当年之勇。找到一个吹嘘的题材,就可劲地自我陶醉吧。”灵感有如神授,巧夺岂止天工”,把大话说到天上去了,反正这篇冗长的世界语论文各位也看不懂,我爱怎么吹怎么吹。我的世界语朋友一般都很顾面子,我不担心穿帮,:=)。 不过,说实在的,那确是我一辈子创造力最旺盛精力最充沛的时期。伯乐识天马,天马欲行空,下笔似有神,灵感如泉涌。连续好几个周末,我都去社科院大楼加班到夜深,在电脑上奋笔疾书。论文总结了世界语有别于自然语言的极度灵活性的语言学根据,我在成文的叙述中也“活论活用”把这些特点发挥到极致。细心的读者也许可由此体会到青年立委的匠心和才情。 我在 《朝华午拾: 一夜成为万元户》 中记述过当时的情景: 研发世界语系统的第二个结果是,我发表在El Popola Chinio(中国报道)上的世界语语言学特点的粗浅论文引起了一个著名的西班牙教授 Juan Regulo 的注意。这位老先生是世界语界老前辈,在他的大学和城市威望极高,以他名字命名街道、广场等。正值他退休,学校决定给他出四大卷印制精美的专辑,表彰他的贡献。其中一卷是关于世界语学(Esperantologio)的论文专集,于是老先生邀请我在《中国报道》的论文(参见 硕士论文的有关章节 )基础上,扩展加工,单成一章。我文思泉涌,洋洋洒洒写了17页,有老先生来来回回多次校改修正,发表了我平生第一次的Book Chapter ” Lingvistikaj trajtoj de la lingvo internacia Esperanto”(发表时老先生已经过世,他的去世在国际世界语界引起很多纪念,老先生千古!)。 生造词 Posted by: 立委 Date: July 10, 2008 12:10PM 有很多生造词最终没有被语言共同体所接受,但是并不影响这些生造词在交流中的作用。生造词现象在自然语言中出现得少很多,而且一旦出现就常常受到老师或者同人的纠正。但是,世界语的灵活性使得人人都在生造,因此生造词对交际的正面功能加强了。这是个很有意思的现象。 在我发表在西班牙的世界语论文中,我不仅详细描述了这个现象,而且也现身说法,生造了很多词,差不多到了长袖善舞,随心所欲的程度。这篇论文经过世界语顶极元老,西班牙老教授的认真审阅,我的生造词多数得以保留。当年的那种创造快感,大概只有世界语者可以体会了: 世界语丰富的词缀和构词的黏合特性,从形式上给了语言使用者最大的弹性,只要在语境中 make sense, 使用世界语,几乎可以随心所欲,很能满足人 的创造欲:世界语的本性是鼓励“生造词”的。当然,在实际使用中,这种弹性更多表现在给人以造词的便利,而不是满足创造欲。如果我忘记了一个专门词汇,比如 komputero(电脑),临时生造一个 elektrona kalkulilo (电子运算工具:可以指计算器或电脑),也不妨碍我的交流。每一个使用过世界语的,都体会过这种便利和创造的乐趣。 摘自 《朝华午拾:世界语之恋》 立委世界语论文:Li, Uej (Wei) 1991. Lingvistikaj trajtoj de la lingvo internacia Esperanto. In Serta gratulatoria in honorem Juan Rgulo, Vol. IV. pp. 707-723. La Laguna: Universidad de La Laguna 缘起:上面的 Book Chapter 是受到老教授 Juan 约稿和鼓励后根据我发表在《El Popola Chinio》的下列粗浅论文扩展而成: 原载 灵感有如神授,巧夺岂止天工
个人分类: 旧文翻新|3588 次阅读|0 个评论
[转载]2014年国家社科基金项目:语言学立项公示
carldy 2014-6-5 12:08
2014年国家社科基金项目公示。 语言学有如下项目立项: 语言学年度项目: 面向国家安全的汉语方言大数据库建设研究 刘晓海 北京语言大学 重点项目 语言学 认知语言学手册 束定芳 上海外国语大学 重点项目 语言学 中央文献术语外译词典(中英、中俄、中日)编纂的理论与应用研究 王铭玉 天津外国语大学 重点项目 语言学 英汉形容词的句法语义研究 熊仲儒 安徽师范大学 重点项目 语言学 岭南濒危汉语方言有声数据库建设 陈云龙 湛江师范学院 重点项目 语言学 美国华人社区汉语方言与文化研究 陈晓锦 暨南大学 重点项目 语言学 基于SWOT分析的中国语言产业安全问题研究 彭爽 东北师范大学 重点项目 语言学 新疆多民族语言关系与和谐语言生活的创建 研究 徐世璇 伊犁师范学院 重点项目 语言学 中国英语学习者句法加工的神经认知机制研究 张辉 南京师范大学 重点项目 语言学 基于证据的四六级、雅思、托福考试效度对比研究 辜向东 重庆大学 重点项目 语言学 东南亚汉语传播的国别比较研究 吴应辉 中央民族大学 重点项目 语言学 古玺集释 肖毅 武汉大学 重点项目 语言学 七种明清《方言》校注本整理集成 华学诚 北京语言大学 重点项目 语言学 历史语法视角下的青海甘沟话语法研究 杨永龙 中国社科院语言研究所 重点项目 语言学 汉语语用标记形成机制的多视角研究 方梅 中国社科院语言研究所 重点项目 语言学 论元选择中的显著性和局部性研究 胡建华 中国社科院语言研究所 重点项目 语言学 汉语及其方言情态的句法语义研究 彭利贞 浙江大学 重点项目 语言学 语料库视野下的现代汉语单音多义词义项分布研究 李仕春 广西大学 重点项目 语言学 蒙古语族语言语料库研制(蒙古、达斡尔、土族语部分) 包玉柱 中央民族大学 重点项目 语言学 跨境濒危印欧语系语言瓦罕塔吉克语调查与研究 李兵 南开大学 重点项目 语言学 藏语方言研究 东主才让 青海民族大学 重点项目 语言学 语态、时态、语气范畴统合下的语法与语用互动关系研究 张绍杰 东北师范大学 重点项目 语言学 语言学视阈中的俄罗斯百年符号学史研究 赵爱国 苏州大学 重点项目 语言学 2147 基于英汉浮现词缀的语言演变模型建构研究 邵斌 浙江财经大学 一般项目 语言学 2148 科学范式转换过程中的引用情感分析研究 马晓雷 国防科技大学 一般项目 语言学 2149 汉英非宾格性题元关系及其句法实现对比研究 张达球 上海财经大学 一般项目 语言学 2150 基于语料库的汉英语法转喻比较研究 宋宏 哈尔滨工程大学 一般项目 语言学 2151 认知语法框架下汉英主题结构的标记性比较研究 王义娜 北京航空航天大学 一般项目 语言学 2152 认知语料库语言学视阈下的英汉话语隐喻对比研究 孙亚 对外经济贸易大学 一般项目 语言学 2153 英、汉语中名词短语的可及性与关系化对比研究 许余龙 上海外国语大学 一般项目 语言学 2154 英汉对音习得中的“单范畴合并”与在线话语理解中的幻影激活研究 吴诗玉 上海交通大学 一般项目 语言学 2155 英汉结果句式认知语法之对比研究 席留生 温州大学 一般项目 语言学 2156 林语堂作品的中国文化变译策略研究 卞建华 青岛大学 一般项目 语言学 2157 东西方翻译政策比较研究 滕梅 中国海洋大学 一般项目 语言学 2158 翻译失语症研究 徐莉娜 青岛大学 一般项目 语言学 2159 基于语料库与认知文体学的汉学家小说翻译批评研究 谭业升 上海外国语大学 一般项目 语言学 2160 中国古代文论英译核心问题研究 刘颖 四川大学 一般项目 语言学 2161 中国现当代文学的译介模式研究 李越 北京语言大学 一般项目 语言学 2162 中英中美不平等条约翻译史研究(1842—1943) 屈文生 华东政法大学 一般项目 语言学 2163 英汉同声传译中的认知负荷研究 秦小雅 北方工业大学 一般项目 语言学 2164 敦煌古籍医经医理类文献英译及研究 张焱 西安理工大学 一般项目 语言学 2165 儿童文学翻译的文体学研究 徐德荣 中国海洋大学 一般项目 语言学 2166 中国传统哲学术语英译研究 郭尚兴 河南大学 一般项目 语言学 2167 基于语料库的莫言小说译本风格研究 宋庆伟 济南大学 一般项目 语言学 2168 全球化语境下中国书法文本的英译研究 顾毅 天津科技大学 一般项目 语言学 2169 中国对外宣传的英译语言研究 余东 广东外语外贸大学 一般项目 语言学 2170 中国戏剧走出去的翻译改写研究 吕世生 南开大学 一般项目 语言学 2171 中华传统服饰文化艺术翻译研究 张慧琴 北京服装学院 一般项目 语言学 2172 我国法律法规翻译的统一与规范化研究 董晓波 南京师范大学 一般项目 语言学 2173 《道德经》在美国的译介与接受研究 辛红娟 中南大学 一般项目 语言学 2174 《红楼梦》英译史研究 赵长江 河北师范大学 一般项目 语言学 2175 《论语》汉英对比研究的功能语言学方法研究 黄国文 中山大学 一般项目 语言学 2176 20世纪《孙子兵法》英译研究 裘禾敏 浙江旅游职业学院 一般项目 语言学 2177 土家族主要典籍英译及研究 张立玉 中南民族大学 一般项目 语言学 2178 中国古代自然科学类典籍翻译研究 刘迎春 大连海事大学 一般项目 语言学 2179 基于语料库的赣西北客赣方言语法比较研究 罗荣华 宜春学院 一般项目 语言学 2180 山东方言语法比较研究 岳立静 山东大学 一般项目 语言学 2181 湘南土话与湘语特征比较研究 蒋军凤 湖南工业大学 一般项目 语言学 2182 语言接触视域中鄂豫皖赣四省交汇处方言语法研究 陈淑梅 黄冈师范学院 一般项目 语言学 2183 明清南方方言的书面化变形研究 陈泽平 福建师范大学 一般项目 语言学 2184 南部吴语语音的层次及演变研究 孙宜志 杭州师范大学 一般项目 语言学 2185 移民背景和上海城市方言形成研究 平悦玲 复旦大学 一般项目 语言学 2186 粤方言语音特征的实验语音学研究 刘新中 暨南大学 一般项目 语言学 2187 鄂西北四省市过渡地带方言特点研究 苏俊波 华中师范大学 一般项目 语言学 2188 汉语方言连调音系格局研究 吴永焕 中国人民大学 一般项目 语言学 2189 河北晋语研究 唐健雄 河北师范大学 一般项目 语言学 2190 山西方言声韵调相互影响的共时历时研究 余跃龙 山西大学 一般项目 语言学 2191 美国“关键语言战略”及其对中国面向东盟语言战略的启示 李丽丽 广西师范大学 一般项目 语言学 2192 提高汉语普通话盲文阅读效率的策略研究 孙宇 长春大学 一般项目 语言学 2193 中国与周边国家语言互联互通建设的战略研究 张治国 上海海事大学 一般项目 语言学 2194 汉语通用社会称谓的使用现状调查与国人称谓观念变迁研究 刘永厚 北京第二外国语学院 一般项目 语言学 2195 基于语料库的美国主流媒体上的“中国英语”研究 范勇 南京信息工程大学 一般项目 语言学 2196 闽南农村汉语方言词汇变化研究 付义荣 集美大学 一般项目 语言学 2197 宁夏生态移民方言变化跟踪调查及语料库建设 李生信 北方民族大学 一般项目 语言学 2198 山西省移入民语言调查研究 李伟 山西师范大学 一般项目 语言学 2199 台湾多语言社会的语言使用情况及发展趋势调查研究 吴晓芳 闽南师范大学 一般项目 语言学 2200 新疆维吾尔族聚居区的语言生活及其发展变化趋势研究 王莉 新疆医科大学 一般项目 语言学 2201 中国西北边境地区语言生态个案研究 郭风岚 北京语言大学 一般项目 语言学 2202 地名用字分级分类与规范研究 周文德 四川外国语大学 一般项目 语言学 2203 立法文本语义规则研究 杨小虎 重庆大学 一般项目 语言学 2204 青海藏区法庭话语调查研究 王欣 青海民族大学 一般项目 语言学 2205 新媒体环境下的海峡两岸网络新闻语篇对比研究 林纲 江苏师范大学 一般项目 语言学 2206 二语具身语言理解的动感共振制约研究 林立红 宁波大学 一般项目 语言学 2207 汉英双语者新学词汇心理表征的ERP研究 乔晓妹 上海财经大学 一般项目 语言学 2208 汉语儿童情态系统的早期习得研究 张云秋 首都师范大学 一般项目 语言学 2209 双语儿童的词汇意识发展研究 祁文慧 南京师范大学 一般项目 语言学 2210 英汉心理词典中语码转换认知机制的ERP研究 陈士法 中国海洋大学 一般项目 语言学 2211 语言图式表征认知模式建构与二语习得能力研究 田延明 哈尔滨师范大学 一般项目 语言学 2212 汉语失语症患者语块结构缺损研究 李美霞 北京第二外国语学院 一般项目 语言学 2213 汉字专家化加工发展的行为和脑机制研究 曹晓华 浙江师范大学 一般项目 语言学 2214 生成语法框架下汉语布洛卡氏失语症患者的句法障碍研究 崔刚 清华大学 一般项目 语言学 2215 学语后感音神经性聋儿语言理解的神经语言学研究 康顺利 天津理工大学 一般项目 语言学 2216 高校外语教师国际学术论文发表的现状与影响因素研究 彭剑娥 汕头大学 一般项目 语言学 2217 云南藏区三语教育语言生态评估与外语政策研究 原一川 云南师范大学 一般项目 语言学 2218 中国西部地区少数民族双语教学师资建设研究 周晓梅 云南财经大学 一般项目 语言学 2219 中国学术话语体系的构建及其与国际学术话语交流策略研究 田海龙 天津商业大学 一般项目 语言学 2220 汉西对比视域下构建切合中国学习者的西班牙语教学体系研究 陆经生 上海外国语大学 一般项目 语言学 2221 基于评价取向的英语口语能力标准研究 严华 扬州大学 一般项目 语言学 2222 基于学科素养的英语读写思辨能力测评研究 兰春寿 福建师范大学 一般项目 语言学 2223 基于语类的英文科技学术话语能力研究及标准建设研究 钟兰凤 江苏大学 一般项目 语言学 2224 外语本科生多元能力培养模式研究 张德禄 同济大学 一般项目 语言学 2225 中国大学生学术英语口语能力等级量表及测评标准应用研究 王华 同济大学 一般项目 语言学 2226 中国大学英语大规模开放在线课程(CEMOOCS)建设范式研究 马武林 四川外国语大学 一般项目 语言学 2227 中国高校学生英语学情研究 常海潮 天津理工大学 一般项目 语言学 2228 我国英语专业学生文学阅读的实证认知研究 苏晓军 苏州大学 一般项目 语言学 2229 中美二语写作研究的差异与共性化问题探析 战菊 吉林大学 一般项目 语言学 2230 反馈在英语写作中作用的社会文化认知研究 王颖 山东大学 一般项目 语言学 2231 英语写作教学形成性评价反馈模式研究 王学锋 太原师范学院 一般项目 语言学 2232 英语学习者书面语语篇连贯自动评价系统研究 刘国兵 河南师范大学 一般项目 语言学 2233 英语作文自动评分系统效度研究 白丽芳 海南大学 一般项目 语言学 2234 系统功能语言学视野下的写作教育研究 陆丹云 解放军国际关系学院 一般项目 语言学 2235 农科英语语料库的建设与其在ESP写作教学中的应用研究 刘萍 华中农业大学 一般项目 语言学 2236 云南周边国家跨境族群汉语习得类型研究 胡德映 云南师范大学 一般项目 语言学 2237 16至20世纪初域外汉语语法观研究 魏兆惠 北京语言大学 一般项目 语言学 2238 动态系统理论视角下汉语二语发展中的变异研究 曹贤文 南京大学 一般项目 语言学 2239 基于语料库的汉语教材词汇多角度研究 周小兵 中山大学 一般项目 语言学 2240 面向汉语国际教育的汉语常用动词型式研究 张平 湖南大学 一般项目 语言学 2241 母语为英语和突厥语的汉语学习者对动结式的二语习得研究 张京鱼 陕西师范大学 一般项目 语言学 2242 外国学生汉语语块习得及教学模式研究 王凤兰 广东外语外贸大学 一般项目 语言学 2243 基于依存句法树的汉语复句关系词自动标识方法研究 杨进才 华中师范大学 一般项目 语言学 2244 两岸三地英汉科普历时平行语料库的创建和研究 郭鸿杰 上海交通大学 一般项目 语言学 2245 面向自然语言处理的话语连贯研究 李佐文 中国传媒大学 一般项目 语言学 2246 面向自然语言处理的现代汉语虚词用法知识库及其应用研究 昝红英 郑州大学 一般项目 语言学 2247 中文隐喻语料库的建设与应用研究 陈红琳 河南科技大学 一般项目 语言学 2248 孤抄本《辨音纂要》音系叠置与明代官话语音研究 邸宏香 长春师范大学 一般项目 语言学 2249 古文字异部谐声通假与上古音研究 叶玉英 厦门大学 一般项目 语言学 2250 明代回族小儿锦语音研究 马君花 北方民族大学 一般项目 语言学 2251 隋唐以前道经用韵与写作年代研究 夏先忠 怀化学院 一般项目 语言学 2252 唐五代敦煌音系研究 王新华 山东大学 一般项目 语言学 2253 战国秦汉简帛古书通假字声系及数据库建设 白于蓝 华东师范大学 一般项目 语言学 2254 近二十年海外回归之宋元明清医籍俗字研究 刘敬林 安庆师范学院 一般项目 语言学 2255 甲骨缀合类纂及数据库建设 蒋玉斌 南开大学 一般项目 语言学 2256 历组卜辞研究 周忠兵 吉林大学 一般项目 语言学 2257 汉语形容词词类的历时演变与跨方言情况考察研究 陈青松 浙江师范大学 一般项目 语言学 2258 古汉语心理活动概念场词汇系统演变研究 孙淑娟 南昌工程学院 一般项目 语言学 2259 基于百种白话报刊的清末民初白话词汇研究(1897—1918) 张文国 山东师范大学 一般项目 语言学 2260 近出简帛文献与传世文献对读视域下的字词整理与研究 洪飏 辽宁师范大学 一般项目 语言学 2261 西周金文考证歧见汇释与相关语法研究 朱其智 中山大学 一般项目 语言学 2262 先秦—唐诗歌中“看视”概念场词汇研究 尹戴忠 湖南科技大学 一般项目 语言学 2263 朝鲜王朝汉语学习书《译语类解》的近代汉语研究 金哲俊 延边大学 一般项目 语言学 2264 中古笔记小说词语考释 张鹏丽 江苏大学 一般项目 语言学 2265 汉语空间量标指演变研究 刘永华 河南大学 一般项目 语言学 2266 近代民间契约文书方俗字词研究 唐智燕 湘潭大学 一般项目 语言学 2267 魏晋南北朝方言研究 汪启明 西南交通大学 一般项目 语言学 2268 域外汉籍《燕行录》所见明清语言资料的整理与研究 汪银峰 辽宁大学 一般项目 语言学 2269 汉语词缀的历史发展研究 崔应贤 河南师范大学 一般项目 语言学 2270 汉语动量范畴的历时研究 于立昌 江苏师范大学 一般项目 语言学 2271 汉语双音连用形式词汇化与语法化研究 陈宝勤 沈阳大学 一般项目 语言学 2272 律部佛典语法研究 朱冠明 中国人民大学 一般项目 语言学 2273 古代汉语诗歌句法及其发展研究 孙力平 浙江工业大学 一般项目 语言学 2274 汉语交互主观性标记词及其对句类认知的影响研究 刘春卉 四川大学 一般项目 语言学 2275 汉语语篇多维语体特征研究 许彩云 淮阴师范学院 一般项目 语言学 2276 汉语语篇连贯的句法机制研究 曹秀玲 上海师范大学 一般项目 语言学 2277 现代汉语词义的基因结构及其形式化描写研究 胡惮 中南财经政法大学 一般项目 语言学 2278 现代汉语行事语力表达手段研究 徐默凡 华东师范大学 一般项目 语言学 2279 现代汉语主观量构式研究 杨玉玲 首都师范大学 一般项目 语言学 2280 形态和句法关系视域下的汉语复合词生成研究 程工 解放军外国语学院 一般项目 语言学 2281 汉语动名组合的生命度定位与摆度研究 杨海明 暨南大学 一般项目 语言学 2282 汉语叙实谓词的构式与语篇接口研究 张新华 复旦大学 一般项目 语言学 2283 现代汉语黏合结构研究 应学凤 浙江外国语学院 一般项目 语言学 2284 现代汉语述补结构的语言类型学研究 宋文辉 河北师范大学 一般项目 语言学 2285 语言类型学视野下的汉语特指问句研究 薛小英 中南大学 一般项目 语言学 2286 重动句句法、语义的信息结构制约研究 钟小勇 杭州师范大学 一般项目 语言学 2287 大型历时语文辞书音义关系研究 周远富 南通大学 一般项目 语言学 2288 模糊词语释义研究 黎千驹 湖北师范学院 一般项目 语言学 2289 《穆卡迪玛特阿勒—阿达布》词典蒙古语研究 色音巴雅尔 中央民族大学 一般项目 语言学 2290 蒙古民俗语及其文化传承研究 包文成 内蒙古大学 一般项目 语言学 2291 现代维吾尔语生成语法研究 力提甫·托乎提 中央民族大学 一般项目 语言学 2292 基于WORDNET的藏语名词型语义词典库构建技术研究 柔特 青海师范大学 一般项目 语言学 2293 中国第一历史档案馆藏清代哈萨克文文书语言结构研究 杜山那里·阿不都拉西 中央民族大学 一般项目 语言学 2294 白马藏语数据库建设及与藏语书面语比较研究 杨士宏 西北民族大学 一般项目 语言学 2295 藏缅语族方式状语语法形式的类型及历时演变研究 闻静 北京华文学院 一般项目 语言学 2296 汉藏语系语言格范畴的类型研究 王跟国 山西大同大学 一般项目 语言学 2297 基于框架语义的藏文词汇语义资源库构建研究 多杰卓玛 西北民族大学 一般项目 语言学 2298 敦煌古藏语词汇及其演变研究 桑吉才让 西北民族大学 一般项目 语言学 2299 缅甸境内缅语支语言调查与研究 蔡向阳 解放军外国语学院 一般项目 语言学 2300 傣族《雅摩经》的记录翻译及研究 杨文学 玉溪师范学院 一般项目 语言学 2301 贵州仫佬语抢救性记录与研究 姬安龙 贵州省民族研究院 一般项目 语言学 2302 名词范畴化视野下的侗台语族类别词研究 陆天桥 江苏师范大学 一般项目 语言学 2303 中国南亚语系语言类型特征及语言普遍现象研究 高永奇 苏州大学 一般项目 语言学 2304 汉语方言背景下大学生英语重音感知和产出研究 陈晓湘 湖南大学 一般项目 语言学 2305 空间句法—语义界面研究 郭熙煌 湖北大学 一般项目 语言学 2306 面向第二语言习得的汉语句法复杂度测评指标研究 冯丽萍 北京师范大学 一般项目 语言学 2307 语音合成中语句重音和篇章韵律的预测研究 赵建军 辽宁师范大学 一般项目 语言学 2308 基于大型赋码语料库的中国学者英语学术论文诊断性研究 潘璠 华中科技大学 一般项目 语言学 2309 基于语料库的汉英会话自我修补对比研究 权立宏 广东外语外贸大学 一般项目 语言学 2310 基于语料库的学术英语元话语特征对比研究 娄宝翠 河南师范大学 一般项目 语言学 2311 跨文化修辞视阈下中国学者英语学术期刊论文写作与发表研究 穆从军 上海海事大学 一般项目 语言学 2312 修辞的认知构式语法研究 刘玉梅 四川外国语大学 一般项目 语言学 2313 功能语法视阈下的汉日语限定词对比研究 白晓光 解放军外国语学院 一般项目 语言学 2314 汉日对比与翻译研究 高宁 华东师范大学 一般项目 语言学 2315 日伪时期中日语言接触及影响研究 张守祥 佳木斯大学 一般项目 语言学 2316 上古汉语词汇对古日语的渗透层次研究 郭木兰 华侨大学 一般项目 语言学 2317 俄汉语言文化场对比研究 张志军 哈尔滨师范大学 一般项目 语言学 2318 基于语篇语言学的俄语口译研究 顾鸿飞 厦门大学 一般项目 语言学 2319 社会性别定型的俄汉语用对比研究 周民权 苏州大学 一般项目 语言学 语言学青年项目: 779 非线性句法范畴和三个功能性句法位置研究 李莹 华中师范大学 青年项目 语言学 780 认知文体学视域下阿来小说地域特征性及汉英平行文本对比研究 邵璐 西南财经大学 青年项目 语言学 781 抗美援朝战争中的翻译活动与译者研究 陈昕 解放军外国语学院 青年项目 语言学 782 17世纪以来域外文献与闽南方言研究 许彬彬 厦门大学 青年项目 语言学 783 语言接触视角下的鄂东南赣语地理语言学研究 张勇生 江西师范大学 青年项目 语言学 784 甘肃东部方言与陕西关中方言比较研究 谭治琪 陇东学院 青年项目 语言学 785 晋冀豫三省交界地带晋语的地理格局与历史演变研究 支建刚 天津师范大学 青年项目 语言学 786 宁夏生态吊庄移民回族方言研究 张秋红 北方民族大学 青年项目 语言学 787 豫北晋语、官话现状与历史比较研究 史艳锋 江苏师范大学 青年项目 语言学 788 语言服务的价值与战略研究 李现乐 扬州大学 青年项目 语言学 789 中美贸易摩擦论辩话语研究 吴鹏 江苏大学 青年项目 语言学 790 绍兴城市方言的社会语言学研究 王轶之 绍兴文理学院 青年项目 语言学 791 社会语言学视角下豫西方言变异研究 马楠 河南理工大学 青年项目 语言学 792 汉语SLI儿童移位结构习得研究 喻浩朋 河南师范大学 青年项目 语言学 793 汉语儿童语言能力评估体系与语言治疗模式的循证研究 李欢 西南大学 青年项目 语言学 794 聋生手语和汉语语音加工神经机制对比研究 刘俊飞 江苏师范大学 青年项目 语言学 795 阅读顺序对读者认知加工影响的眼动研究 王雨函 汕头大学 青年项目 语言学 796 基于使用的英语初学者口笔语发展现状及规律研究 张会平 东北师范大学 青年项目 语言学 797 读后续写与打造高效的外语学习方法研究 姜琳 广东外语外贸大学 青年项目 语言学 798 赵元任汉语作为外语教学学术思想研究 江南 上海大学 青年项目 语言学 799 外国留学生汉语书面语词汇进步模式研究 张江丽 北京华文学院 青年项目 语言学 800 多模态汉语二语教学模式的认知机制及教学实践研究 洪炜 中山大学 青年项目 语言学 801 型式语法视角下中国科学家学术英语语法隐喻的大型双语语料库研究 董敏 北京航空航天大学 青年项目 语言学 802 清代中后期闽粤两地正音书系研究 黄薇 泉州师范学院 青年项目 语言学 803 隋唐五代石刻传抄古文字研究及字谱编纂 章红梅 成都中医药大学 青年项目 语言学 804 新公布三种秦简字词研究 赵岩 大庆师范学院 青年项目 语言学 805 《新修玉篇》整理与研究 熊加全 周口师范学院 青年项目 语言学 806 基于字体分类的甲骨卜辞缀合研究 莫伯峰 首都师范大学 青年项目 语言学 807 晋系文字分国研究 刘刚 安徽大学 青年项目 语言学 808 清华简时代特征及文本源流的语文学研究 郭永秉 复旦大学 青年项目 语言学 809 中古汉语新词新义的类型学研究 龙丹 中南大学 青年项目 语言学 810 《说文解字》疑难释义丛考 孟琢 北京师范大学 青年项目 语言学 811 《新撰字镜》与古写本辞书比较研究 张磊 浙江师范大学 青年项目 语言学 812 出土战国至汉初简帛所见人物名号汇释与研究 王辉 北京大学 青年项目 语言学 813 秦汉简帛涉医文献疑难字词研究及数据库建设 刘建民 山西大学 青年项目 语言学 814 历代学术笔记中语言文字学论述整理和研究 李娟红 南阳师范学院 青年项目 语言学 815 汉语方所词历史源流研究 冯赫 山东大学 青年项目 语言学 816 篇章语法学视野下的近代汉语完成体助词研究 杜轶 上海师范大学 青年项目 语言学 817 汉语单音节多功能副词的语义地图模型研究 潘晓军 安徽师范大学 青年项目 语言学 818 基于语料库与ANTCON3.2.4W技术的汉语抽象名词搭配研究 方清明 华南师范大学 青年项目 语言学 819 语法化中的语法性及相关问题研究 史文磊 浙江大学 青年项目 语言学 820 面向信息处理的汉语复句句法语义关系判定研究 吴锋文 信阳师范学院 青年项目 语言学 821 现代汉语贬抑性习语构式研究 郑娟曼 浙江师范大学 青年项目 语言学 822 基于义类词典的语义组合研究 李安 山东大学 青年项目 语言学 823 字书字料库的理论与实践研究 柳建钰 渤海大学 青年项目 语言学 824 18世纪文献《和卓传》语言研究 阿衣先木·依力 新疆师范大学 青年项目 语言学 825 回鹘文哈密本《弥勒会见记》研究 郑玲 宁夏社会科学院 青年项目 语言学 826 撒拉语的地理语言学研究 舍秀存 青海民族大学 青年项目 语言学 827 维吾尔语移动学习平台与资源库构建研究 刘韵华 新疆师范大学 青年项目 语言学 828 维吾尔语韵律与语法接口信息结构研究 王海波 中国社科院民族学与人类学研究所 青年项目 语言学 829 广西各语言与东南亚语言共享特征的区域类型学研究 覃东生 广西大学 青年项目 语言学 830 桂黔滇三省交界地带台语北部方言词汇比较研究 齐旺 西北大学 青年项目 语言学 831 基于使用理论视角下动词词义范畴体系构建的多种双方向交叉实验研究 王冲 大连理工大学 青年项目 语言学 832 基于同一文本的句法网络语义网络关系研究 赵怿怡 厦门大学 青年项目 语言学 833 基于众源方式的《中国英语词典》编纂与使用研究 秦晓惠 北京科技大学 青年项目 语言学 834 名词短语句法—语义互动模型研究 陆烁 中山大学 青年项目 语言学 835 短语学视域下的学术语篇行为研究 李晶洁 东华大学 青年项目 语言学 836 英汉网络科普新闻语篇的多模态对比研究 张艺琼 广东外语外贸大学 青年项目 语言学 837 基于语料库的日语祈使句研究 赵彦志 复旦大学 青年项目 语言学 838 从日本汉文小说“唐话学”看东亚语言接触与文化受容 王佳璐 长春工业大学 青年项目 语言学 839 中国文化走出去背景下的当代小说在日本的译介与传播研究 孙立春 杭州师范大学 青年项目 语言学 840 基于本体的俄汉可比语料库构建与评估 原伟 解放军外国语学院 青年项目 语言学 841 基于语料库的俄汉构式对比研究 王洪明 曲阜师范大学 青年项目 语言学 http://www.npopss-cn.gov.cn/n/2014/0604/c219457-25103867.html
个人分类: 语言学探讨 Linguistics|6931 次阅读|0 个评论
【旧文翻新:我的世界语国(2)】
热度 1 liwei999 2014-5-31 22:43
朝华午拾 - 世界语之恋 世界语之父柴门霍夫博士 柴门霍夫(Zamenhof)博士创造完世界语后,并没有马上发布,而是用世界语自己跟自己说话和著述了好多年,烂熟于心。 我刚开始接触世界语,就一见钟情,堕入爱河,有诗为证: Al Nia Kara Lingvo La lingvo gracia, kara mia, Ghis kiam vi venis al mi fine fin? Atendis soife mi, eterne via, MI AMAS VIN ! Mi amas vin vere, pruvu Dio, Kaj mia bon-koro batas nur por vi; Ne plu sekreteto estas tio: VIN AMAS MI ! Chu kredas vi mian amon maran? Chu kredas, ke mia koro flamas? Chu kredas la vorton pure karan: VIN MI AMAS ! 这是我1986年写的情诗,也是我世界语的处女作。尽管幼稚,却是火热真情。我后来做世界语到英语汉语的机器翻译实验,索性把它送进我的翻译程序,跟“人工智能”开了个小玩笑,还振振有词地在论文中说:谁说诗歌不能翻译?谁说诗歌不能机器翻译?以下是我的诗歌的机器翻译: To our dear language The language graceful, my dear, Till when you came to me at last? Waited longingly I, ever yours, I LOVE YOU ! I love you truely, let God prove, And my good heart beats only for you, No longer that is (a) little secret: I LOVE YOU ! Do you believe my love like sea? Do (you) believe, that my heart burns? Do believe the word purely dear, I LOVE YOU ! 献给我们的亲爱的语言 优美的语言,我的亲爱的, 到什么时候你最后来到了我这儿? 我渴望地等待,你的永远的, 我爱你! 我真实地爱你,让上帝证明吧, 我的善良的心仅仅为了你跳动; 那已经不再是小秘密: 我爱你! 你相信我的大海一样的爱吗? 相信,我的心燃烧吗? 相信纯粹地亲爱的词吗: 我爱你! 年少轻狂,流淌的都是滚烫的词句,不加掩饰,不知含蓄,但表现了我当年初识世界语那种欣喜若狂、神魂颠倒的恋爱状态。 作为语言学研究生,我一开始就被世界语的外在美迷住了。世界语表达方式的灵活多样让我折服。首先是语序的自由,一个简单的目的格后缀 - n , 主谓宾句式的语序就获得了完全的自由: mi amas vin (我爱你),可以有六种表达!我感叹其神奇,也获得了诗歌的灵感,于是用不同语序入韵。很多年以后的今天,我没有忘记告诉我的女儿,世界语可以用6种组合说“我爱你”。每次跟女儿电话,挂电话前,她总不忘用六种语言说“我爱你”(汉/英/法/俄/日和世界语),最后总是以世界语结束,并且一口气说下去: Mi amas vin. Mi vin amas. Vin mi amas. Vin amas mi. Amas mi vin. Amas vin mi. 每次听女儿稚嫩的声音一遍一遍用世界语说爱我,哪个做父亲的能不融化?女儿跟我说,她长大也要成为一个语言学家和世界语者,像我一样。 好,回到跟世界语的恋爱史上来。世界语的外貌,让我惊奇的还有构词的自由性,和相关词表的对称美。我把这些写入我的世界语笔记,最终成为我的世界语语言学特点的论文素材。就说构词的自由性吧,比如: Shi rid- as . / Shi rid- etas . / Shi estas rid- ema . / Shi estas rid- emulo . / Shi estas rid- emulino (rid- emino ). / Shi estas rid- emulineto (rid- emineto )……. 她笑。 / 她微笑。/ 她爱笑。/ 她是爱笑的人。/ 她是爱笑的女人。/ 她是爱笑的小女孩儿 ……。 世界语丰富的词缀和构词的黏合特性,从形式上给了语言使用者最大的弹性,只要在语境中 makes sense, 使用世界语,几乎可以随心所欲,很能满足人的创造欲:世界语的本性是鼓励“生造词”的。当然,在实际使用中,这种弹性更多表现在给人以造词的便利,而不是满足创造欲。如果我忘记了一个专门词汇,比如 komputero (电脑),临时生造一个 elektrona kalkulilo (电子运算工具:可以指计算器或电脑),也不妨碍我的交流。每一个使用过世界语的,都体会过这种便利和创造的乐趣。 世界语的外貌使我着迷,就好像一个漂亮姑娘的吸引。世界语的内在美和近乎宗教信仰一样的感召力,是我进入世界语圈子以后逐渐体会的。在北京世界语圈子,我第一次接触到一个来自各行各业的特殊群体,大家一团和气,互相帮助,加上世界语者中普遍流行的道德优越感和使命感,这极大地满足了我的理想主义的内心。我当时把这一切全部归功于世界语的内秀,深深迷恋。我好像找到了一个外美内秀的完美对象,教我如何不爱她? 记于2006年4月21日 原载 《朝华午拾:世界语之恋》
个人分类: 旧文翻新|4028 次阅读|1 个评论
试论语言学与传播学在言词证据研究中的作用
look1 2014-5-3 10:03
试论语言学与传播学在言词证据研究中的作用 《证据科学》,2007(1-2合期) 本文运用语言学(词汇学、语义学、语体学及修辞学等)与传播学(口语传播学与大众传播学)的相关知识对“杨××状告胡××侵犯名誉权”一案中的两处言词证据做了分析,认为:⑴原告杨××发给被告胡××的手机短信具有性暗示的性质;⑵在上诉状中,辩方律师认为“网络日志(博客)”与传统日志的性质相同是不准确的,被告博客中的文章具有大众传播的性质。 语言学 传播学 言词证据
个人分类: 法律语言研究|1914 次阅读|0 个评论
挺反自便,但不要欺负语言学!
热度 9 liwei999 2014-3-4 20:49
wxysci 2014-3-4 11:24 博主完全不理解“为人民服务”中的人民的概念。 如果能理解,也就明白“美国人放心地吃了20年转基因食品”这样的论断。 博主回复(2014-3-4 14:09):你打死我我也不认你这个“美国人放心地吃了20年转基因食品”的说法。你在欺负语言学,欺负汉语词汇和文法。请参见下列汉语文句的句法语义分析解构图示: 放心这类心理词,放在动词前加地或不加地都做状语 (放心吃,放心地吃),放在动词后加得(吃得放心)做补语。无论状语补语,它都是表达已然状态心理感受的逻辑谓词(logical predicate)。根据费尔墨(大师千古!)的格语法(Case Grammar)的理论总结,“放心”这样的二算元谓词(2-argument predicate),需要一个逻辑主语(experiencer 谁放心?)和一个逻辑宾语(object,对什么放心?),语义才站得住,逻辑才完整,尽管在语言表达的时候这些逻辑主宾的算元(arguments)可能是隐性的或者省略掉。语言理解时,隐性或省略的逻辑成分必须恢复才能达到语言理解和交流的目的。具体到此例,谓词性状语的逻辑主语一般由它所修饰的那个动词谓语的主语来充当(这是深层 parsing 做的 decoding semantics,是自然语言理解的关键步骤)。语言学的深层文法分析的结果就是这样一种语义表达:谓语“吃”的句法主语“美国人”充当状语“放心”的逻辑主语,表达的是“美国人”具有“放心”这样一个心理体验。谓语“吃”的句法宾语“转基因食品”充当状语“放心”的逻辑宾语,是为“放心”的对象。换句话说,上面的句子虽然是简单句(表层结构),但包含了两个谓词,在逻辑语义上因此对应了深层结构两个 statements: (1)美国人吃了20年转基因。 (2) 美国人放心转基因。 (1)是语法句式,是显试的表达;(2)是隐含但明确的逻辑语义。二者通过人的下意识解构(parsing)都可以得出, 凭着正常中文语感即可, 没有疑义。上述语言学分析就是把这个语言理解过程形式化算法化。(1)是事实描述,为真;(2)不是事实,不为真。原句是(1)和(2)的叠加,以(1)为主干,依然不为真。说这话的人,可能是想通过(1),暗渡陈仓地向公众传达(2),以误导舆论。 绝大多数美国人很长时间对转基因没有概念,商人也未做标识,他们吃的啥都不清楚(逻辑宾语没有着落,不符合谓词语义完整性的要求),放心个啥。 我不是生物科学家,可我是语言学家。 不带这样欺负语言学家的。 呵呵,立老师懂语言学不懂幽默学 日期: 03/04/2014 08:27:13 原帖的意思是,“人民”不是所有的人,只是合乎自己政治立场的人。
个人分类: 立委随笔|4982 次阅读|11 个评论
《日语强调助词之研究(日本語とりたて助辞の研究)》(日文版)
xscb 2014-1-15 15:46
书名:《日语强调助词之研究 ( 日本語とりたて助辞の研究 ) 》(日文版) 作者:陈连冬 出版社:世界图书出版公司 出版时间: 2013.12 ISBN : 978-7-5100- 7195-9 定价: 35.00 元 内容摘要: 本研究用“语法化” (Grammaticalization) 理论,通过相隔 100 年时间段的日本明治时期和当代之比较,诠释了日语中表示强调意义的など , なんぞ , なぞ , なんか , なんて等助词的意义功能及变化。加之文体(口语体、文章体)因素也伴随其中 , など , なんぞ , なぞ , なんか , なんて共同谱写了“语法化”在日语中的新篇章。特别是其中有关など , なんぞ , なぞ的一些事实理论,乃本研究首次提出。 作者简介: 陈连冬 , 1982 年毕业于北京外国语大学日语系,留校。 1985 年中日政府举办大学日语教师培训班高级班修毕 ( 大平班 ) 。 1989 年修毕日本埼玉大学文学修士 ( 硕士 ) 。 1992 年修毕日本青山学院大学文学博士课程。 1993 年起任教于新加坡国立大学日本研究系, Lecturer 。 2008 年取得日本大阪大学文学博士。 2013 年起任教于新加坡南洋理工大学人文暨社会科学院, Lecturer 。 目 录: 第 1 部 序 論 1 第 1 節 本研究の目的 1 第 2 節 先行研究 2 第 3 節 とりたてとは 13 第 4 節 本研究の方法 17 第 5 節 本研究の用語 19 第 6 節 調査の対象 22 第 7 節 調査の結果 26 第 8 節 分析の対象 34 第2部 本 論 35 第1節  「 など 」 における明治期と現代の比較 35 第2節  「 なんぞ 」 における明治期と現代の比較 71 第3節  「 なぞ 」 における明治期と現代の比較 87 第4節  「 なんか 」 における明治期と現代の比較 99 第5節  「 なんて 」 における明治期と現代の比較 124 第3部 結論と今後の展開 157 第 1 節 結 論 157 第 2 節 今後の展開―文法化― 160 参考文献 185 資 料 208 謝 辞 209
3770 次阅读|0 个评论
[转载]如何扎实SCI论文写作的基础?
MogoEdit 2013-12-20 16:57
1、掌握SCI论文写作的综合性特点,加强综合修养论文写作是多种能力的综合,它涉及到观察、感受、理解、发现等众多方面的能力;从学科上看,它涉及到逻辑学、语言学、哲学、写作学等许多方面的知识。论文写作,有人得力于学识(学者之文),有人得力于思想(政论文、思想评论),有人得力于文学素养(文秘、宣传),因此,要善于突出自己擅长的方面,发扬优势,突破一点,渐趋广博。此所谓“修身之要”是也。 2、掌握论文写作的自身规律,养成良好的写作习惯 子曰:习惯成自然。要写好SCI论文,必须努力养成自觉按照规律写作论文的良好习惯:如平时注重搜集资料的习惯;讲究立意的习惯;严于构思的习惯;动笔之前立定格局、拟订提纲的习惯;行文一气呵成、讲究行款和书写规范的习惯;修改时从头到尾、精益求精的习惯;等等。没有养成习惯,虽然懂得了道理,但在实践中仍不时会离谱走样;好习惯养成了,终身受益不尽。 3、多看多读多写多思多学:学习论文写作的主要途径发文的功夫,无疑主要是内功。内功的高低,又全在一个“练”字。练到大师的功夫高度,写什么都有。“练”字具 体而言就体现在多看多读多写多思多学。多看,包括阅读文章和观察生活两个方面。读书要点面兼顾,精博相参,死活相合(鲁迅),世事洞明兼学问,人情练达即文章。多读,而且要善读,要能看出作者如何布局谋篇,如何立论论证,论点论据怎样有机统一的,如何开头结尾和过渡,有什么不足之处。摸清论文的“架子”,悟出论文的“路子”,了解论文的“法子”。多写,不仅要写得多,而且要在此基础上不断突破已有的写作水平。由渐变引起质变,不断进入新的境界。 来源:互联网
个人分类: 英文论文修改|118 次阅读|0 个评论
申报国家出版基金,特别提醒!!《中国语学文库》编辑部
xscb 2013-10-30 16:27
提醒诸位作者注意:近期至2014年6月有语言学著作出版意向的,可先行申报、列入选题计划,填写选题申报表,并于6月10日前提供完整书稿。我们将优先为提前申报的书稿申报国家出版基金。届时再视情况列入正式的出版计划,并考虑是否加入该文库 《中国语学文库》编辑部 10月30日 网址:http://www.sjxscb.com/article.asp?id=2271
1912 次阅读|0 个评论
第五届当代语言学国际圆桌会议之青椒观感
热度 1 gothere 2013-10-21 12:23
这是一次华人语言学家的高端会议,黄正德、黄衍、顾曰国、张洪明等诸多大牌悉数演讲。这是一次争鸣不休的会议,生成派、功能派、认知派、技术派相互攻讦。这是一次中老年的会议,基本都是50岁以上的专家,没有小刺娄的话语。这是一次嬉笑怒骂的会议,一切都在热烈的争论与幽默中发展、高潮、戛然而止。 演讲最佳者,在小辈们看来,莫过于 郑秋豫女士的《从口语韵律的功能与分析看语音对立》,逻辑清晰、数据详实,获得LREC奖项,实至名归。最富激情而幽默者,莫过于张洪明,气吞山河,学贯古今中西,有大家之范。最有学究气者,莫过于略带绅士味的黄衍,引经据典皆磅礴,处处批判,且报告不以规定时间之长短,刚开头便已到时间,未闻其惊艳,只面命我辈慢慢读其著述。强调学术的独创性、英文读写之能力,对国内现状颇为不满。最温文尔雅者,必乎王寅先生,如歌如诉,慢慢道来,大哲先贤之书皆深入浅出,鞭辟入里。而发警人之语,处处探幽者,莫过于我系主任李葆嘉教授,揭现代语言学流派奥秘于三张图,会后亦自称语言学之福尔摩斯。站立最久者,当然是我,客串了一把摄像,耳闻目睹,自然最有心得,不得不码出些文字来。 于我之收获,当然是第一次见到了传说中的若干大牛,了解了当今大佬们的研究前沿,特别是生成学派的汉语句法研究。学者们的呼吁,要建立中国人的语言学理论,对世界有影响。我总觉得诡异,理论创新是必要的,但不是拿来装门面的,解决语言的问题,解决语言生活的问题,创造服务生活的语言产品,才是咱计算语言学的追求。
个人分类: Linguistics|4275 次阅读|2 个评论
嫖还是没嫖,这不是语言学的问题
liwei999 2013-8-31 03:07
【置顶:立委科学网博客NLP博文一览(定期更新版)】 薛蛮子的嫖娼事件,由于其社交媒体的高知名度以及主流媒体包括央视的渲染,在网络上传得沸沸扬扬。堂吉诃德曰,鸟大了,什么林子都有,网络世界见怪不怪。甚至有卫护者抱怨薛蛮子空有千万粉丝,居然没有女粉给他送温存,以致老顽童不得不寻花问柳,养成“特殊癖好”。 这些都不当紧,当紧的是我们做媒体自动挖掘的,对热点话题不能放过。热点话题是技术人小试牛刀(或吹破牛皮)的机会。 于是,用自家研发的系统一挖,傻了,难道真是成也嫖娼,败也嫖娼? See,老顽童的短处(cons,左图)是 嫖娼 ,老顽童的长处(pros,右图)居然是 (不)嫖娼 (那个小圈圈是远距离否定的一个图示)。另一个长处是“(不)是官吏”,似乎是说,既然不是官吏,也就无需私德无暇,也是常见的替他辩护的一种说法。 到底嫖还是没嫖,这不仅仅是哈姆雷特的天问,这更是语言学的拷问。难道地球人都知道的嫖娼事件,还有广泛流传的他本人供认不讳的视频等,系统居然挖掘出否认事件的情报?吹破大天的语言技术就这么颠倒黑白,歪曲事实? 作为系统设计者,本能的第一反应是,这一定是一个 bug,技术层面的 bug。不管怎么说,挖掘出的反面情报前15中的第一位就是嫖娼,多达 4861 条,占 95.6% 呢,比起否认嫖娼的仅有 44 条的情报,即便44条全抓错(反)了,精确度也远超 90%,还有什么好说的,咱的中文系统就是牛! 虽然这么说,心里还是一个疙瘩。灰色地带的挖掘,不准确也就罢了,这黑白分明铁板钉钉的铁案,如果抓错,是可忍,语言学不能忍。一定要查个究竟,到底是在社交媒体说话的人信口胡说,还是代码化了的中文语言学出了问题?Drill down,看看原句都是怎么样的(见【附录】)。 原来、原来是酱紫的:V大了,什么粉丝都有,一些确实是他的粉丝真滴在矢口否认(“ 早知道 薛蛮子 不是 嫖娼 被抓 ”,“ 说薛蛮子嫖娼会有人信吗 ”,“ 我认为 薛蛮子 没有 嫖娼 ” ),另一些是以否定或疑问的口气在反讽(“ 薛蛮子 不是 嫖娼 好吧! 是去为性工作者谋取利益 ”, “ 谁说 薛蛮子 就一定是去 嫖娼 的? 楼主不要造谣哦, 也许人薛老汉是去买淫呢 ”:这不是坑我嘛,机器再聪明再语言学,也难琢磨你的言外之意呀),再有就是句子太绕,把如此冰雪聪明的系统也给绕进去了( 薛蛮子 就不会 嫖娼 吗? 薛蛮子嫖娼你怀疑个屁, 除非你能证明他没嫖娼或者他性无能 )。 总而言之,言而总之,检查结果是事出有因。中文系统虽然不完美,却也非常不赖:晚上可以睡个安稳觉了,天下太平。中文是复杂的;语言学是工作的;而工作着是美丽的。 【附录】否认情报的挖掘来源样本(随机): 这个帖子是不是没有 薛蛮子 嫖娼 案子性质恶劣? (原因)各大媒体没有报道! weibo.com 2013-08-26 09:24:54 冰点 3135453637 早知道 薛蛮子 不是 嫖娼 被抓, 而是此鸟人殷建光所说: 薛蛮子 被抓获, 实际上就是对网络文化中虚伪丑陋的的严厉打击; 同时, 对于我们广大网民也是一个提醒, 读其微博, 观其言行, 思其自己, 千万不要盲冲, 盲目, 被情绪化控制.. 2013-08-26 19:51:48 福耀大中华小号 我认为 薛蛮子 没有 嫖娼 , 这样的栽赃陷害太弱智了吧。 怎么 这么巧, 接到群众举报? 2013-08-25 15:01:36 大师梦话 薛蛮子 不是 嫖娼 好吧! 是去为性工作者谋取利益, 为一个22岁的无知少女当人生的校长导师, 为一个在中国受到歧视的弱小群体维权! 1 similar 2013-08-25 23:06:30 佳悦banana 薛蛮子是宣传宪政被抓的? 这么说 薛蛮子 没有 嫖娼 ? //@唐巴马_tangbama: //@良心于-20://@玳簋三世://@钟鼎文无声: 再宣传宪政, 你也快了 2013-08-25 17:27:24 过来人近山看海 薛蛮子 就不会 嫖娼 吗? 薛蛮子嫖娼你怀疑个屁, 除非你能证明他没嫖娼或者他性无能、或者他根本就是个女的。 2013-08-25 13:03:51 坏坏野男人 你怎么就知道梦鸽的儿子就一定是强奸而不是嫖娼? 凭什么 薛蛮子 就不是 嫖娼 ? 有立场没原则啊。 2013-08-25 06:29:3 不露哥Blue 薛蛮子 不是 嫖娼 被抓了吗? 呵呵, 你李庄敢说你没嫖过? 2013-08-27 09:54:51 边塞诗与随想曲 谁说 薛蛮子 就一定是去 嫖娼 的? 楼主不要造谣哦, 也许人薛老汉是去买淫呢。 2013-08-25 05:19:51 心情很悲伤的毛毛虫 回复@迈步twitter: 对呀, 薛蛮子 不也是 嫖娼 。 别只拿美国说事, 美国有美国的法律, 中国有中国的法律。
个人分类: 立委科普|2994 次阅读|0 个评论
对自然语言的语言学和语言哲学的追根溯源
geneculture 2013-8-22 11:40
对自然语言的语言学和语言哲学的追根溯源: 1, 自然语言作为对象语言存在多义性或歧义性。 务必用一系列的元语言解释它的意义和指称。 2, 弗雷格曾以一个经典例子来区分意义和指称; 3, 索绪尔曾以一个经典图示来区分能指与所指。 4, 于是,一系列的研究和探讨也就随之而展开: 4.1,追随弗雷格之后的沿着语言哲学的方向; 4.2,追随索绪尔之后的则沿着语言学的方向。 附录 1: 语言分层理论 将语言分为元语言和对象语言两个层次 元语言(Metalanguage),当我们讨论一件事物时,我们所使用的语言被称为对象语言,因为它是对象的表现。而当我们谈论一种语言时,我们所使用的语言被称为元语言。在任何语言研究中,都有一种作为研究对象的语言,还有一种由研究者用来谈论对象语言的元语言。对象语言与元语言是相对而言的。任何语言,无论它多么简单或者多么复杂,当它用于谈论对象的时候,它就是对象语言;当它用来讨论一种语言的时候,它就是元语言。因此,元语言是关于语言的一种语言,也就是针对文本或者言语行为而进行讨论、写作、思考的语言。 语言分层理论 将语言分为元语言和对象语言两个层次是 塔尔斯基和卡尔纳普 分别于1933年和1934年提出的。不过,塔尔斯基的思想只是在其著作《演绎科学语言中的真理概念》由波兰文译成德文于1935年发表后,才广为人知的。因此,一般认为,卡尔纳普最早提出语言分层理论。 起初,卡尔纳普把 两个语言层次的区分 当作建立 人工语言 的逻辑 语形学 的前提。他在1934年发表的《语言的逻辑句法》导论的第一节中对此作了明确的说明:“我们关涉 两种语言:首先是作为我们研究对象的语言——我们称之为对象语言 ; 其次是我们用以谈论对象语言的语形形式的语言——我们称之为语形语言(即元语言——引者注)。 正如我们已说过的,我们将把某些符号语言作为我们的对象语言,我们将先简单地用英语(并借助一些附加的哥特体符号)作为我们的语形语言。”由此可见, 对象语言是指作为研究对象的语言:元语言是指用以表述、研究对象语言的那种语言。 例如,某人说“球是红的”,这时他用的是对象语言,因为他用语言来谈论非语言实体——球。当某人说“‘球是红的’这个命题包含四个词”,这时他用的是元语言,因为这句话所谈的不是球这个非语言的对象,而是谈论描述这个对象的语言本身。 后来,卡尔纳普又将两个语言层次的区分用于语义学的研究,用“元语言”和“对象语言”这两个概念来定义他的语义学体系 。他还认为,语义系统的规则陈述了对象语言中的语句的成真条件,从而决定了这些语句的意义。这就是说, 语义系统的规则涉及的是对象语言,但它们本身是用元语言来表述的。 内涵符号学将“元语言”与“内涵概念”联系起来,从内在属性上揭示了元语言对对象语言起作用的过程及本质。同时,将元语言的研究范围扩大化,讨论了人文科学和其他社会科学中存在的元语言与对象语言的关系。从某种意义上说, 人文科学的历史就是一个元语言的历时过程,是一个对象语言变成元语言,再由元语言变成对象语言的循环往复的历程 。完整的符号学分析,除了关涉被研究系统及经常承担着该系统的(外延)语言外,还同时调动着内涵系统及应用于该系统分析的元语言。 语言分层理论的意义 在日常的语言使用中,由于 被谈论的语言 (对象语言)和 用来谈论语言的语言 (元语言)常常是用一种语言(例如,汉语或英语)来表述,人们往往意识不到 语言层次 的区分,而把两者混淆起来, 这种混淆的结果直接导致了悖论的出现 。所谓的“说谎者悖论”就是其中的典型一例。从这意义上来说,两个语言层次的区分,很可能为最终消解 语义悖论 找到一条极有希望的途径。 语言分层理论的意义 不仅仅局限于 语言研究 的范围。譬如说哲学,它不仅要研究世界,研究人生,而且要研究它的自身。 这种对哲学自身的研究,亦即对哲学概念、命题、理论等的研究,被称作“元哲学研究”。显然这种“元哲学研究”要借助于 语言分层理论 ,以区别对象语言和元语言,否则“元哲学研究”无从进行。近年来新崛起的所谓“元科学”、“元方法论”等理论,差不多也都包含着 语言分层理论的具体应用 。 元语言的研究 元语言的特征是其自称性(sel-f referential-ity)和反身自称性(sel-f reflexivity),即语言符号的意义和所指是语言符号本身。索绪尔(Saus-sure 1959: 66-67)指出,语言符号(sign )是一个具有两面性的心理学实体, 把概念与音形紧密地结合在一起,即“所指”(signified )与“能指”(signifier )的结合体 ,因此符号才自动产生意义,才能代表它在“任意性”关系上约定俗成所对应的具体物体和对象(referent)。结构主义文学理论家巧妙地利用了索绪尔的符号学理论模式,大都把“词”当作“能指”,把词所代表的事物对象当作“所指”。 使用语言来指称和描述语言,其历史源远流长。两千多年前,古印度语言学家在研究梵文经典5吠陀经6过程中所做的细致的观察和详尽的语言学描述,应该说是开创了元语言使用的先河。大约公元前五世纪出现的研究成果汇总——波你尼(Pnini)梵文语法《八章书》(Eight Books),被认为是研究印欧语言最早的专著,也是公认的世界上最古的一部完整的语法书。波你尼语法对梵文进行了详尽描述和系统整理,为后世留下了宝贵的文化遗产,其中发现、归纳并整理的4000多条高度公式化的构词法规则,以及相关的技术性概念,都是使用元语言描述语言系统的最早典范。其语言的简洁性、穷尽性和系统性,极大影响了后来以及现代描写语言学的发展。Robins (1997: 178)指出,波你尼的梵文语法是“语法学家的语法,而不是语言学习者或教师手册”,足见其技术性含量之高。 我们不知道波你尼是否意识到自己的梵文语法使用的是技术性语言或元语言 , 但我们知道 ,古希腊学者柏拉图和亚里士多德等人比波你尼 更明确地认识到元语言的重要性 。虽然他们提出的希腊语语法框架并非十全十美,但 他们最大的贡献就是用希腊语的词汇 资源创造出了一套“技术性的元语言”(Robins 1997: 34)。 西方语言学是以语言成分的范畴分析起步的 。从柏拉图对希腊语句子结构(lgos)的二分法,到亚里斯多德的三分法(如名词成分noma、动词成分rhema、第三类句法成分syndesmoi)以及名词的“性”、“格”等概念的形成,对建立科学系统的希腊语语法体系起到了重要的作用。正是靠这些“技术性的元语言”,古希腊语言学研究才形成了一套高度科学的完整体系并为后世奉为经典。古罗马语言学家大规模吸收古希腊语言学的逻辑系统和思想模式,用于拉丁语研究,这个过程被语言学史家称为“元语言学转移( metalinguistic transfer ) ” ( Robins 1997: 60 )。 从柏拉图、亚里士多德到斯多噶学派再到迪奥尼修斯时期形成的完备的语法范畴体系,“是整个西方语言学理论大厦的基础”(褚孝泉2003:118)。 到了中世纪第二个阶段,元语言成为逻辑学家和语言学家更为重要的技术性手段。正因如此, Petrus Hispanus 才有可能用三个不同的新概念 (signification,supposition,appellation) 取代逻辑学中原有的signification, 才能根据 词根 表现的意义和可以加在词根上的派生词缀的意义有所不同而把自己的/含义0概念分为主含义(principal signification)和相关含义(consignif-ication),才能区分名词性的词(substantival)和形容词性的词(adjectival),以及形性推想和物性推想等。 现代语言学 获得了很大发展 ,但如果没有 索绪尔 等人创建并使用 技术性的元语言 作为 描写语言和语言系统的手段 ,现代语言学 也许不能真正成为 科学。伦敦语言学派的创始人Firth (1957: 169)曾说,“ 每个科学领域都应该开发出 适用于 其性质的一套 特殊 语言,这个过程代表着 科学工作的最基本组成部分 。”哥本哈根学派Hjelmslev认为,元语言才是语言学的真谛。他写道,“尤其令人惊愕的是,我们发现了一个其 表达层面 是符号的一种符号(a semioticwhose expression plane is a semiotic)……这就是所谓的元语言(或者我们应该说是元符号(metasemiotic)),意思是把 符号 当作对象的一种符号, 语言学本身就必须是这种元符号 ”( Hjelmslev 1961: 119-120 )。Malmkjaer(1991: xi)写道,“……如果有一个东西能 把语言学与其它学科相区别 ,那就是这样一个事实,即其主体物质必须能被用来进行描述。”因此可以说, 如果没有元语言,就没有逻辑学,也就没有符号学和语言学 from: http://baike.baidu.com/view/10291477.htm 附录2 :塔尔斯基 波兰数学家,逻辑学家,华沙逻辑学派的主要代表人物。1902年1月 14日生于华沙。1983年逝世。在华沙大学数学系学习时曾师事J.武卡谢维奇,1924年毕业于华沙大学,获博士学位。1926年任华沙大学讲师。1939年移居美国。从1942年起在伯克利加州大学任教。1946年起任数学教授。曾为《符号逻辑学报》主持编务。   塔尔斯基的研究工作涉及一般代数、测度论、集论、数理逻辑和数学基础以及元数学等领域,其中尤以对逻辑语义学的研究引人注目。   塔尔斯基认为逻辑学很早就已成为一门独立的学科。但只是在现代,逻辑学才得到极大的发展和完全的改造,其学科性质类似于数学,而以这一形式出现的逻辑学,就被称为数理逻辑或符号逻辑。   塔尔斯基指出: 语义学悖论的成因在于自然语言的含糊性。起先,B.A.W.罗素为了要排除语义学悖论,曾有意将类型论扩展为分展语言论。塔尔斯基沿此发展和形成了理论语义学,开展了关于对象语言和元语言的研究方向 。   塔尔斯基的主要著作有《初等代数和几何的判定法》(1948)、《逻辑、语义学、元数学》(1923~1938,1956)等。 from: http://baike.dangzhi.com/wiki/A.%E5%A1%94%E5%B0%94%E6%96%AF%E5%9F%BA 附录3 :2006年8期 语言层次理论与现代逻辑和科学的发展 语言层次理论在现代逻辑和科学理论的发展中 具有极其重要的作用 ,在解决悖论方面 具有独特的功能 。弗雷格 区分 不同语言层次的思想为后来 语言层次理论 的进一步发展 提供了 极有价值的启发.罗素悖论的发现充分 说明了 语言层次理论在语言分析中的 重要作用 .罗素关于引号在区分不同语言层次方面的作用、关于指称词组初现与再现的区别与论述以及关于逻辑 类型论 的阐述虽然与弗雷格 区分 不同语言层次的思想同出一辙,但比弗雷格的理论 要详尽和深入 得多. 塔尔斯基的对象语言和元语言理论则进一步丰富和发展了语言层次理论,并且极大地促进了各种元理论的产生和发展,从而在更为广阔的意义上显示了语言层次理论在科学发展中所起的巨大作用. from: http://d.wanfangdata.com.cn/Periodical_xsyj200608007.aspx 附录4:塔尔斯基的真理理论及其对语义学的贡献 塔尔斯基以现代逻辑为手段,用逻辑分析和语义分析的方法对唯物主义真理符合论中甚为模糊的内容做出语义学的重新阐述,给“真的”一词 下了一个实质上适当、形式上正确的定义 ,也提出了著名的 语言层次论 ,创建了现代意义上的系统的语义学,从而向世人展示了语义学的非凡魅力,在世界哲学界产生了广泛而深远的影响。 from: http://greatcourse.cnu.edu.cn/yyx/wlkc/lwxz/a/a7.pdf 附录5:乔姆斯基(1928- ) 美国 语言学 家, 生成语法 创始人。1928年12月7日生于美国费城,1955年获宾州大学博士学位,此后一直在麻省理工学院任教,并任美国科学促进会委员、全国科学院院士、美国文理科学院院士。   乔姆斯基大学时代学过数学、哲学,后来主攻语言学,师承著名语言学家 Z.S.哈里斯 与逻辑学家古德曼。1955年写出《语言理论的逻辑结构》,当时未能出版,他提出形式语言分类法,并用于自然语言,通过数学模拟论证了当时盛行的 结构主义语法 不适用于描写自然语言。1957年他的《句法结构》在荷兰出版,正面提出与结构主义背道而驰的生成语法。他主张语言学家的研究对象应从 语言 转为语法,研究范围应从语言使用转入语言能力,研究目标应从观察现象转向描写和解释现象,研究方向应从处理语言素材转到评比语法假设,因此人们说他掀起了语言学界的革命,这一学说一跃而为国际上的语言学重要流派。   此后20多年来乔姆斯基不断地发展和更新自己的理论。1965年发表了《句法理论的若干问题》,试图建立包括句法、音系和语义 3部分的全面语法系统。20世纪70年代以来研究的重心逐渐由探究具体的转换规则转移到探究抽象的转换限制,这一变化体现在《形式与解释论文集》等著作中。他觉得,语法规则立得越多,产生的句子数目越多,但对规则的限制越严,句子的合格率才越高。所以生成语法必须既灵活又严谨,才能一方面做到生成一切句子,另一方面所生成的又都是合格的句子。70年代末80年代初,他提出了普遍语法原则及参数的理论,通常称为“管辖与约束理论”,代表作为《论管辖与约束》(1981)。   乔姆斯基在哲学上提倡理性主义,批判经验主义;在语言学上提倡心理主义,批判行为主义。乔姆斯基认为人的语言能力中一部分是后天学会的,即通过经验获得的,另一部分是先天具有的,即全人类共同的。他强调人不仅有躯体,还有心理(或称心智)。限于目前的科学水平,还没有条件对人脑的心理机制作彻底研究,但是可以通过研究语法揭示心理的某些性质,所以说“语言是心理的镜子”。他对于经验和物质的看法不同于过去的理性主义者和心理主义者。他明确指出,人类先天的语言能力是生物遗传与进化的结果,并反复说明心理并不是独立的,而以物质为基础,研究心理只是在比较抽象的层次上探讨物质。近年来他惯用的提法是“心理──最终是大脑”,1984年以来把心理称为“心理/大脑”。他把语言学看作一种心理学,而最终是生物学,是研究人类这一最高等生物大脑机制的科学。语言学应该有真正的科学性,不仅是相对的科学性。   20多年来学术界对乔姆斯基理论有很多争论。老派语言学家纷纷反对,他没有答辩;本派学者不断批评,他边反驳边改进;分析哲学派猛烈抨击,他坚决反驳。当前各种语言学理论大都以乔姆斯基理论为参照点,哲学、心理学、逻辑学、计算机科学、生物学、神经生理学等各个领域都在讨论乔姆斯基的学说。
个人分类: 语言学基础研究|2565 次阅读|0 个评论
原型、属性和家族相似性
热度 4 florazou 2013-8-21 11:54
原型、属性和家族相似性 邹桂萍 前几日,我和李东风老师误将梧桐科的假苹婆当做是“豆科植物”(更确切地说,不是误认为,是觉得比较像),恐怕让网上的植物专家笑掉大牙了。之后,我在感叹自己的无知的时候,忽然想起认知语言学的一套关于分类的理论。 人们的认知结构对大千世界的各种千奇百怪而又杂乱无章的事物进行分类,这个过程就叫做范畴化 (categorization) 。在范畴化的过程中,我们把最完好的、最显著的成员——即在一个类别中最有代表性的事物——其在人们大脑中的表征叫做“原型” (prototype) 。 比如,“杯子”的定义是“ 盛饮料或其他液体的器具,多为圆柱状或下部略细,一般容积不大 ” 。 但是,这个定义其实是非常模糊的,因为它没有告诉我们杯子有多高,圆柱的半径有多宽。所以按照这个定义,在﹥杯子﹤这个范畴中,我们可以有以下这么多类型的杯子。 ﹥ C up ﹤ (Ungerer Schmid, 2008) 但是事实上,一提到“杯子”一词,我们往往想到的是 1 号杯子。所以, 1 号杯子是﹥杯子﹤的典型成员,它在人脑中的表征可以被认为是“杯子”的原型。 再比如,人们对“美女”一词没有清晰的定义,这个标准是身高、体重、比例、曲线、五官、气色、还是其它,我们似乎不求甚解。但是,一旦提到“美女”一词,每个人心中都会浮现一个形象,这个形象就是“美女”的原型。 原型事物和这一类别(范畴 ,category )的其他成员的共同属性 (attribute) 是最多的,有些属性是其它成员所不具有的。例如以上的 1 号杯子,我们可以这样细化它的属性: 1 ) 用来装液体的; 2 ) 杯口是圆的; 3 )下部略细的; 4 )带有杯柄的; 5 )容积较小的; 6 )陶瓷烧制的; 7 )不戴杯盖的。 但是,我们还有很多类型的杯子,有的是不具备原型事物的某些属性的。例如我们有这样的杯子: 10.完全圆柱状的 11. 下宽上窄的 12.长方体状的 13. 带杯盖的 14.无杯柄的 15. 塑料制成的 属性在范畴化中究竟是必要的,还是非必要的?最先尝试回答这个问题的人是 Aristotle 。他认为,范畴是由一系列必要的、充分的属性集合而成的。有的属性是本质属性,这是所有的成员都必须具有的;有的属性是偶然属性,它不是范畴的必要条件。这套理论被称为“经典范畴理论”。 但是,根据我们以上的分析,在﹥杯子﹤这个范畴中,杯子的形状、材料,乃至于颜色、大小等都不是构成“杯子”的本质属性。根据“经典范畴理论”,莫非“杯子”的本质属性只是“用来装水和其它液体的容器”吗?那么,碗、盆、桶等不能装液体吗?这显然不符合现实。 于是,认知语言学提出了“家族相似性”( family resemblances )的观点。 Wittgenstein 认为,属于同一范畴的每一个成员都必须具有至少一个这个家族的属性,但是几乎没有,或者很少成员能够具备这个家族的所有属性。这个观点用图表可以表示为: 最后,我们用“家族相似性”回头看看“豆科植物”的话题。豆科植物是“ 双子叶植物纲的一科。草本、灌木或乔木。果实为荚果。花冠形似蝴蝶。雄蕊常十枚,九枚合生,一枚分离。根部有能固氮的根瘤。 ”可见,豆科植物的属性是: 1 )双子叶; 2 )藤木、 草木、灌木或乔木; 3 ) 长荚果; 4 )花冠像蝴蝶; 5 )雄蕊常十枚; 6 )根部有 能固氮的根瘤。 李东风老师和我根据“长荚果(其实假苹婆的果实属于蓇葖果,不同于荚果。前者成熟时果实仅沿一个缝线裂开;后者成熟后果实分裂成两条缝线)”的属性,有将假苹婆归入“豆科植物”的倾向,这实际上只看到局部,没有顾全大局啊。不过,这也不能怪我们,毕竟我们对“梧桐科”不熟悉。 链接: 关于假苹婆的讨论 参考文献: Ungerer F Schmid H. J. 2008. An Introduction to Cognitive Linguistics . Beijing: Foreign Language Teaching and Research Press
个人分类: 语言文化|7622 次阅读|9 个评论
索绪尔之后的语言学是对索绪尔语言与言语区分理论的深入研究
geneculture 2013-8-20 19:41
什么是索绪尔的语言观? 附录1: 对索绪尔几个语言观的理解 http://www.docin.com/p-28525285.html 附录2:索绪尔与海德格尔语言观——本体论层面比较 http://rlls.hlju.edu.cn/eyu/manage/upload/2011715/2011715101936694.pdf 附录3: 索绪尔的语言观和语言学的新进展 索绪尔这位语言学大师影响了11个不同的语言学派和24位有影响的语言学家.他所创立的结构主义语言学理论及其35个术语,因其含义明确而一直沿用到今天.索绪尔的学说,一方面受到当时社会科学的启迪,同时也影响着几乎整个社会科学.我们很有必要对索绪尔的语言学思想和对语言学发展的影响做个梳理. http://d.wanfangdata.com.cn/periodical_kjzxdb200720220.aspx 附录4: 索绪尔之后的语言学是在索绪尔语言与言语区分理论进行深入研究和发展的过程中实现的 。 《索绪尔:本真状态及其张力》 “ 索绪尔的语言观 :原始生态与现代形态”。集中讨论了四个问题:(1)语言和言语;(2)共时和历时;(3)语言符号的任意性;(4)外部语言学中的时空观。   前三个问题,是索绪尔学说的核心,也是最近一些年里的学术热点。作者研究索绪尔能够抓住这些问题,并集中地讨论这些问题,是本专著的学术性的重要体现。   语言和言语问题,上世纪六十年代曾进行过一次大讨论。现在还是一个受到广泛注意的问题。同时也是一个 还没有很好解决了的问题 。作者的阐述对这个具有 方法论 意义的问题的研究提供了前进的基础。在这一节的结尾,裴文说:   其实,在索绪尔以后,无论美国哲学家莫里斯(C.w.Mornis)语用学的创立(1938),还是德国语言学家瓦恩里希(H.Weirich)话语语言学的建构(1967),归根到底,还是 以索绪尔语言与言语的区分理论为基础的,更确切地说,以后有相当一部分语言学研究者是在努力完成索绪尔未竟的事业——言语语言学 。 索绪尔之后的语言学是在索绪尔语言与言语区分理论进行深入研究和发展的过程中实现的 。没有索绪尔的语言与言语区分理论,现代语言学乃至其他学术领域的结构主义认识论研究成果真的是难以想像的。(163-164页)   索绪尔常常被误解,被指责,其中重要的一点是:索绪尔忽视、贬低、排斥言语的研究。裴文在进行了深入考察之后所提出的这一论断,我认为不但是符合事实的,而且是很有学术意义的。   共时和历时的区分,是索绪尔对现代语言学和人文科学的重大贡献。方光焘等中国学者在宣传和运用这一学说的时候也曾进行了修正和补充。裴文博士第一次全面而深入地讨论了这个问题。她介绍了索绪尔提出这一学说的学术文化背景,索绪尔对前人的继承和他独特的创造。裴文深刻地把握了索绪尔的这一学说,也客观而公正地评价了各种批评意见。在我所接触到的文献中,她对这个问题的论述是最好的。   语言符号(一切符号)的本质特点是任意性。这是索绪尔的一个重大的贡献,虽然在他之前也有一些学者谈论过任意性问题。语言的任意性对语言学的科学化进程的促进作用是不容低估的。在最近二三十年里,任意性的论断在国内外学术界受到了不很公正的批评和批判。一些人用理据性和象似性来否定、推翻索绪尔的任意性理论。虽然也有些学者进行反击,但是还没有比较好地解决问题。裴文维护了任意性理论,对批评意见作了回答。也许是受到篇幅的限制,没有展开。我以为,任意性问题是不容回避的,是值得花些力气,认真地讨论的。我希望裴文和其他学者在这个问题上进行更深入的论述。   我认为, 裴文的《索绪尔:本真状态及其张力》是中国索绪尔研究的新阶段到来的一个标志。它的出版将促进中国的索绪尔研究走上一个新的台阶。而索绪尔研究的深入对中国语言学和其他人文学科的发展和繁荣是有促进作用的。 from: http://www.gmw.cn/03pindao/shuping/2004-03/17/content_7141.htm 附录5:索绪尔和他的《普通语言学教程》 李娟 瑞士语言学家索绪尔(Ferdiand de sausure)是现代语言学的重要奠基者,也是结构主义的开创者之一。他被后人称为 现代语言学之父 , 结构主义的鼻祖 。《普通语言学教程》(Cours de Linguistique Generale)是索绪尔的 代表性著作 ,集中体现了他的 基本语言学 思想 ,对 二十世纪的现代语言学研究 产生了深远的影响。同时,由于其研究 视角和方法论 所具有的 一般性和深刻性 ,书中的思想成为二十世纪重要的哲学流派结构主义的重要思想来源。 这里,我们概要地介绍一下索绪尔的生平和他的《普通语言学教程》,并从历史的角度分析一下他的语言思想具有的 划时代性的历史地位 以及 理论的局限 。 http://www.jpk.pku.edu.cn/pkujpk/course/llyyx/script/3.pdf 附录6: 解读索绪尔的语言价值理论 吕文平 内容提要 “语言价值”( linguistic value)理论是索绪尔语言研究的核心,也是其创立共时语言学时提出并竭力阐释的理论,成为后来结构主义语言学的基础。从语言符号的能指、所指和符号整体来考察语言符号的价值,我们可以得出:语言的价值从根本上说来自语言系统内部关系的差别和对立。 关键词 价值 系统 关系 差别 对立 索绪尔(Saussure)被尊为“现代语言学之父”,其《普通语言学教程》(Cours de linguistique generale) 则成为现代语言学的开山之作。 《教程》中的“语言价值”( linguistic value)理论是索绪尔语言研究的核心,也是其创立共时语言学时提出并竭力阐释的理论,成为后来结构主义语言学的基础。索绪尔不但强调“ 语言是一种表达观念的符号系统 ”, (p37)更重要的是,他强调“ 语言是一个纯粹的价值系统,除它的各项要素的暂时状态以外并不决定于任何东西 。” (p118)这说明 语言价值存在于语言系统中 。因此,可以说 价值理论贯穿于整个共时语言学,是研究语言所必须重视的问题 。 一、语言价值理论的引入 在索绪尔的研究乃至整个语言学研究中,价值理论占有举足轻重的地位。正如 罗兰·巴特尔所说“价值与语言(与言语相对的语言)关系密切,它使语言学非心理学化,并使之接近经济学,因此在结构语言学中至关重要。” (p46)索绪尔认为语言学和政治经济学同是价值科学,研究者都面临“价值”(Valeur)的问题,而价值的存在 取决于两个因素 : (1)一种能与价值有待确定的物交换的不同的物; (2)一些能与价值有待确定的物相比的类似的物 (p161)以经济学中的货币为例,要使1美元有价值,必须使1美元能交换与其不同类的四块面包从而满足条件;(1)又要使1美元与同类的五美元或十美元相类比以满足条件; (2)这样一美元才具有价值。同样,我们知道, 语言符号是由能指(音响形象)和所指(概念)构成的两面的心理实体 ,处于两个不同的层面( interstratal),并且两者的联系是任意的。因而,可以说 能指是对所指的象征性解释(symbolic construal),即能用一定的声音提取一定意义,二者具有交换价值 。如能用 这一声音来提取“狗”的概念意义,实现了语言符号的交换价值。此外,我们 对于语言符号价值的认识,不仅要了解符号内部能指与所指的关系,更重要的是要看到符号所在系统中的地位和关系。即还要看到同一层面内符号之间具有可比性。我们只能看到词能跟某个概念‘交换’,即看到他具有某种意义,还不能确定它的价值;我们还必须把它跟类似的价值,跟其它可能与它相对立的词比较。我们要借助它外在的东西才能确定它的内容 。“ (p161)如汉语中的“狗”具体指称时有“落水狗”、 “叭儿狗”等,多含有贬义的感情色彩。相比之下,英语中的“dog”具体指称时有“lucky dog”“every dog has his own day”、“love me love my dog”等,多带有褒义的感情色彩。两者归于不同的价值体系,汉语的“狗”同英语的“dog”的价值取既决于其在各自体系中的地位,又取决于两个价值体系的对比,恰恰是英语对“dog”褒义情感而张显出汉语对“狗”的贬义色彩,使其通过比较而存在。鲍贵先生认为“语言符号价值的两重性确立了符号的两种关系:层间的交换关系和层内的比较或差别关系”, (p6)应当是对语言价值理论的深入研究,具有重要意义。 二、对语言价值理论的具体阐释 《教程》并没有简单地界定“什么是语言的价值”,而透过对 语言的等价系统 的分析来显现价值的。“人们都面临着价值这个概念。那 在这两种科学里都是涉及不同类事物间的等价系统 ,不过一种是劳动和工资,一种是能指和所指。” (p118) 索绪尔是从语言符号的概念即所指、语言符号音响形象即能指、语言符号的整体即能指与所指的结合体三个方面来阐释语言价值理论的 。 (一) 从所指方面解析语言的价值 价值与意义极易混同,因为孤立地观察语言符号时,除了声音和概念以外别无其它。实际上,要从所指方面考察语言的价值,一方面要考察这个语言单位的意义本身;另一方面又要看这个语言单位在系统中的地位或关系。索绪尔强调意义既依赖于价值却又不等同于价值。两者的联系体现在,意义要依赖于价值而存在,价值则是构成意义的一个要素,“不言而喻,这概念没有什么初始的东西,它不过是由它与其他类似的价值的关系决定的价值;没有这些价值,意义就不会存在。” (p163)两者又相互区别,具有不同内涵。在符号内部,意义指称概念是作为听觉形象的对立面而存在的,“一切都是在听觉形象和概念之间,在被看作封闭的、独自存在的领域的词的界限内发生的。” (p160)价值则要通过语言系统中符号与符号的关系和差别来体现。为了说明意义与价值的差别,索绪尔拿法语的mutton和英语的sheep作比较。在一定的语境下,两者具有相同的意义,即都代指“羊”。但法语的mutton除了指“羊”还可指“羊肉”,而英语中则用sheep指“羊”,用mutton指“羊肉”。也就是说,法语中mutton单独所起的作用在英语中要分别用mutton和sheep来表示。Mutton和sheep在各自语言系统中的地位不同,功用有所不同,与其他要素的关系亦不同,价值也就自然不尽相同。这也说明不同语言的价值系统有所差异。 价值要通过语言单位在系统中的关系或者说差别来体现,孤立地谈价值是不现实也是不可能的。“也就是说绝对孤立的、没有其他任何参照的所指关系及由此构成的语言符号是不存在的。从这个意义上讲,价值是一种关系,是一种对立,是系统的产物。” (p351)因为“任何要素的价值都是由围绕着它的要素决定的。” (p162)这说明语言要素本身并无价值,其价值要在系统中由其它要素及其关系来体现。例如:“生”孤立地看并没有价值,只有通过与“死”之间的对立关系才能体现其价值,无“生”就无所谓“死”,无“死”就无所谓“生”。这里事实上已经蕴含了语义场的概念,即生死反义词语义场。同时,“在同一种语言内部,所有表达相邻近观念的词都是互相限制的。” (p160)这也可以理解为:在同一种语言内部,所有表达相邻近的观念的词都是互补的。在互补中体现限制,在互补中体现对立,在对立和限制中体现差别,在差别中体现各自的价值。这在同义词中表现得最为突出,例如现代汉语同义词“看”、“瞧”、“瞅”、“张”、“望”、“瞜”、“盯”、“瞄”、“瞪”、“瞥”、“瞟”、“观”、“视”、“睃”等,虽然同是表示“观看”义,但在具体语用中却又各司其职,进而体现它们之间的对立,显现出各自的价值。比如“瞟”是“斜着眼睛看”,多用于口语中。这就显现出“瞟”与其他观看类词的差别和对立,既限制了其它观看类词语涉足“瞟”的语义语用领域,又是对整个观看类语义系统的补充,这就是其价值之所在。正如Thibault所指出的“价值是产生意义的潜能,它通过差别得以体现,这种差别存在于语言系统中的所有要素,是从具体使用中抽象出来的”。 (p165) 所以,从概念角度考察语言符号的价值,重要的不是其具体的语义内容,而是其与系统中其它要素的关系和差别。“我们说价值与概念相当,言外之意是指后者纯粹是表差别的,它们不是积极地由它们的内容,而是消极地由它们跟系统中其它要素的关系确定的。它们最确切的特征是:他们不是别的东西。” (p163) (二)从能指方面解析语言的价值 从能指方面解析语言符号的价值,同样要看到语言系统中各要素间的关系和差别的重要作用。“如果价值的概念部分只是由它与语言中其它要素的关系和差别构成,那么对它的物质部分同样也可以这么说” (p164)一个孤立的声音并不重要,因为声音具有物理属性,不是语言所特有的。“声音是一种物质要素,它本身不可能属于语言。它对于语言只能是次要的东西,语言所使用的材料。” (p165)重要的是一个词区别于其它词的语音差别。即索绪尔所说的“在词里,重要的不是声音本身,而是使这个词区别于其它一切词的声音上的差别,因为带有意义的正是这些差别。” (p164)如 和 在汉语里有区别词的语音形式的作用,比如“漂” 和“标” ,两者的区别在于前者是送气音而后者是不送气音,差别显著,从而有区别意义的作用。但在英语中 和 则没有区别词的语音形式的作用,比如sport中的p发 音,而port中的p发 音,英美人将两者看作是一个语言单位,其差别并不重要,也就没有区别意义的作用。由此看来, 和 发出何种声响以及用何种发音部位和发音方法发音并不是关键的,关键的是两者是否构成差别,这也是其价值之所在。但“语言只要求有区别,而不像大家所设想的那样要声音有不变的素质。”、“说话者在使各个声音仍能互相区别的限度内享有发音上的自由。” (p165)例如汉语的东北方言中有些地方“三”与“山”音不分,既可以念成 ,也可以念成 ,即几个处在同一位置上的几个音可以自由替换而不起区别词的语音形式的作用。由此我们说语言符号的能指“在实质上不是声音,而是无形的——不是由它的物质,而是由它的音响形象和任何音响形象的差别构成的。” (p165)这就是说,语言符号能指的价值不是别的,而是它与其它语音的不同,体现在与其它能指的关系和差别之中。 (三)从整体符号解析语言的价值 把语言符号作为一个整体来探讨其价值,即将能指与所指结合成一个符号实体,探求语言符号系统及符号与符号之间的关系、对立与差别。索绪尔将这看成是积极的事实,而将分开来看的能指与所指的差别看成是消极的事实。“所指和能指分开来考虑虽然都纯粹是表示差别的和消极的,但它们的结合却是积极的事实。” (p167)语言符号是由能指和所指构成的价值系统,要了解这个价值系统,应该从在语言运行中其作用的概念和音响形象两个方面入手。但概念和音响形象都是浑然之物,语言就是在这两个浑然之物之间形成时制订出它的单位的,这才是真正的积极的事实。在索绪尔看来,所指与能指的差别是一一对应的,能指发生变化了,所指也会发生变化,进而导致整个符号的价值发生变化。“事实上,绝对的不变性是没有的;语言的任何部分都会发生变化。” (p194)这体现出价值的相对性,这种相对性又反映出语言符号的任意性和社会规约性。“符号的任意性又可以使我们更好地了解为什么社会事实能够独自创造一个语言系统。价值只依习惯和普遍同意而存在,所以要确定价值就一定要有集体,个人是不能确定任何价值的。” (p159) 一个符号的价值不但体现于能指与所指的关系中,还体现于与其它符号的对立中。而“语言系统是一系列声音差别和一系列观念差别的结合,但是把一定数目的音响符号和同样多的思想片断相配合就会产生一个价值系统。”符号与符号之间不但有差别而且有对立,“差别和对立造成价值,价值相同的有关片断具有同一性,依据同一性原则归并为一个单位;价值不同的各个片断,不具有同一性,依据差别或对立原则定为不同的单位。” (p54)这样就从理论上将特定语言系统中的单位划分出来了。比如在不同语境中,我们可以称不同的女士为“夫人”,这是由于“夫人”的价值是在与“爱人”、“妻子”、“太太”、“老婆”、“媳妇”、“内人”等要素的对立中确定的。如果没有价值的同一性,就不能保证价值的相对稳定性,而“语言价值的相对稳定性(relative in vari-ability)是语言具有较强生成能力的前提”。 (p7)如果没有价值的同一性和相对稳定性,就不可能将“夫人”确立为一个语言单位,即使确立为一个语言单位,也会在每一次称呼一个女士为“夫人”时用不同的符号来表示,这不仅降低了语言的生成能力,破坏了语言的经济原则,也失去了语言符号的使用价值。 从语言符号的能指、所指和符号整体来考察语言符号的价值,我们可以得出:语言的价值从根本上说来自语言系统内部关系的差别和对立。正如索绪尔所说“语言中只有差别。” (p167)因为只有对立和差别才可能有区分,才可能产生价值。“语言价值来自系统,来自于系统中语言要素之间的多种相互关系,来自于系统中的差异和对立。” (p198)没有语言符号相互间的差别就没有符号本身,更谈不上对价值的探讨。 参考文献: 费尔迪南·德·索绪尔·普通语言学教程 ·高名凯译,北京:商务印书馆,1985· 罗兰·巴尔特·符号学原理 ·王东亮等译,北京:生活·读书·新知三联书店,1999· 鲍贵·再论语言的价值 ·Foreign Language Education·第24卷第2期· 马壮寰·索绪尔的语言价值观 ·当代语言学,2004,(4)· Thibault,P·J·1997·Re-reading Saussure: The Oynamics of Signs in Social Life ·London and New York: Routledge,1997· 索振羽·索绪尔及其普通语言学教程 ·外语教学与研究,1994,(2)· (内蒙古大学人文学院 呼和浩特 010021) http://www.literature.org.cn/Article.aspx?ID=52698 附1:索绪尔 语言是 弗迪南·德· 索绪尔 _百度百科 baike.baidu.cn/view/417200.htm‎ 跳到 共时 语言 学和历时 语言 学 - 所以,组合关系和聚合关系是 索绪尔语言 理论的核心,后来有广泛影响的结构 语言 学、转换-生成 语言 学、系统-功能 语言 ... 弗迪南·德· 索緒爾 - 维基百科,自由的百科全书 - 维基百科- Wikipedia zh.wikipedia.org/zh-cn/弗迪南·德· 索緒爾 ‎ 转为简体网页 索緒爾 注重語言的共時性而有別於19世紀對語言歷時性的分析。共時性觀點認為——某一時間點上的一種 語言是 自足的功能系統——此觀點也廣為後世一般學者所 ... 索绪尔语言 学_百度百科 baike.baidu.com/view/1026181.htm‎ 索绪尔 把言语活动分成“语言”(langue)和“言语”(parole)两部分。 语言是 言语活动中的社会部分,它不受个人意志的支配,是社会成员共有的,是一种社会心理现象。 解读 索绪尔 的 语言 价值理论——中国文学网 www.literature.org.cn › 学术论文全文数据库 › 文艺理论研究 ‎ 语言 价值”( linguistic value)理论是 索绪尔语言 研究的核心,也是其创立共时 语言 学时提出并竭力阐释的理论,成为后来结构主义 语言 学的基础。从 语言 符号的能指、所 ... 索绪尔 - 中国百科网 www.chinabaike.com/article/316/327/2007/2007022578222.html‎ ①语言和言语。 索绪尔 把言语活动分成“语言”(langue)和“言语”(parole)两部分 。 语言 是言语活动中的社会部分,它不受个人意志的支配,是社会成员共有的,是一种 ... 索绪尔 和他的《普通 语言 学教程》 www.jpk.pku.edu.cn/pkujpk/course/llyyx/script/3.pdf‎ 他被后人称为现代 语言 学之父,结构主义的鼻祖。《普通 语言 学教程》(Cours de Linguistique Generale)是 索绪尔 的代表性著作,集中体现了他的基本 语言 学思想,对二. 索绪尔语言 理论要点评析(豆瓣) www.douban.com/subject/3018126/ 区分共时语言学与历时语言学的意义何在?如何理解“一切都是不能论证的 语言是 不存在的;一切都可以论证的语言,在定义上也是不能设想的”? 索绪尔 为什么如此强调 ... 评《 索绪尔语言 理论新探》- jpkc.scezju.com/uploads/yyxgl/200907/psne.pdf‎ 作者:伍铁平 - ‎2003 - ‎ 被引用次数:3 - ‎ 相关文章 说的“口语”是正常语文著作里说的 语言 ,它说. 评《 索绪尔语言 理论新探》- ?伍铁平潘钧. 文字是记录 语言 的书面符号系统,这是 语言 学最基. 本的原理和常识。 语言 学和 ... 1. 索绪尔 www.open.edu.cn/media_file/2001_09_06/wyj/mj_1.htm‎ 索绪尔 (Ferdinand de Saussure, 1857--1913),瑞士 语言 学家。1857年出生于瑞士 ... 所以,组合关系和聚合关系是 索绪尔语言 理论的核心,后来有广泛影响的结构 ... 如何理解 索绪尔 理论中「所指和能指的关系是任意的」? - 知乎 www.zhihu.com/question/20246144‎ 文字符号不在 索绪尔 的“ 语言 ”讨论范围之内,甚至象声词都符合任意性。 怎么理解任意性,很简单。中文中,树的形象被叫做shu,英语中叫做tree……日语中itsuki。 附2:索绪尔的语言观 弗迪南·德· 索绪尔 _百度百科 baike.baidu.cn/view/417200.htm‎ 跳到 共时 语言 学和历时 语言 学 - 索绪尔 创造了“共时”和“历时”这两个术语,分别说明两种不同的 语言 研究。他特别. 弗迪南·德· 索绪尔 . 强调共时研究,因为 ... ‎ 人物年表 - ‎ 生平简介 - ‎ 所开课程 - ‎ 学术观点 再论 索绪尔 的符号学 语言观 _语言符号的性质_百度文库 wenku.baidu.com/view/7a25394469eae009581bec28.html‎ 外国语( 上海外国语大学学报) 1997 年第4 期( 总第110 期) ?5 ? 再论 索绪尔 的符号学 语言观 —— — 语言符号的性质乐眉云 This paper continues t he initial ... 索绪尔的语言观 和语言学的新进展 - 万方数据知识服务平台 d.wanfangdata.com.cn › 期刊首页 › 科技咨询导报 › 2007年20期 作者:吴坤 - ‎2007 - ‎ 相关文章 索绪尔 这位 语言 学大师影响了11个不同的 语言 学派和24位有影响的 语言 学家.他所创立的结构主义 语言 学理论及其35个术语,因其含义明确而一直沿用到今天. 索绪尔 的 ... 索绪尔 与海德格 尔语言观 * - 黑龙江大学俄语语言文学研究中心 rlls.hlju.edu.cn/eyu/manage/upload/2011715/2011715101936694.pdf‎ 作者:叶起昌 - ‎ 被引用次数:5 - ‎ 相关文章 有关 索绪尔 、海德格尔和卡西尔相关思想的研究成果, 旨在正本清源。 索绪尔 与海德格 尔语言观 *. 本体论层面比较. 叶起昌. (北京交通大学, 北京100044). 提要: 索绪尔 ... 索绪尔 与海德格 尔的语言观 比较:方法论与方法 - 黑龙江大学俄语语言 ... rlls.hlju.edu.cn/manage/upload/2013514/2013514162757390.pdf‎ 作者:叶起昌 - ‎ 相关文章 〇专题研究. 编者按:对比是语言哲学的重要研究方法。本期刊发的3 篇文章是:《 索绪 尔与海德格 尔的语言观 比. 较:方法论与方法》(叶起昌) 、《由世界进从语言 ... 对 索绪尔 几个 语言观 的理解- 豆丁网 www.docin.com/p-28525285.html‎ 2009年8月3日 - 对 索绪尔 几个 语言观 的理解详细. 广西民族学院学报(哲学社会科学版) JOURNAL OF GUANGXI UNIVERSITY FOR NATIONALITIES ( Philosophy ... 光明书评- 索绪尔 研究的重大成果 www.gmw.cn/03pindao/shuping/2004-03/17/content_7141.htm‎ 第三章为“ 索绪尔语言观 的形成语境”。作者讨论了四个问题:(1)传统语言学的学理梳理;(2)历史比较语言学的文脉;(3)索绪尔对历史比较语言学的反思与批判;(4)索 ... 索绪尔的语言观 和语言学的新进展 - 本学科首页- 期刊界 natural.alljournals.cn/view_abstract.aspx?...‎ 索绪尔的语言观 和语言学的新进展. 引用本文:, 吴坤. 索绪尔的语言观 和语言学的新进展 .科技咨询导报,2007(20):215-215. 作者姓名:, 吴坤. 作者单位:, 哈尔滨医科 ... 索绪尔 与海德格 尔语言观 -其它哲学论文-论文联盟 www.lwlm.com › 哲学论文 › 其它哲学论文 ‎ 提要: 索绪尔的语言 本体论实际上是建基在社会规范上,困境在于无法摆脱 语言 与社会规范之间的恶性循环。海德格尔坚持 语言 本质不在 语言 之外,而在 语言 自身。 语言之社会规范说与自然说—— 索绪尔 与海德格 尔语言观 对比研究 cbs.pku.edu.cn/scrp/bookdetail.cfm?iBookNo=86428‎ 2013年7月3日 - 本书对比研究 索绪尔 与海德格 尔的语言观 。 索绪尔 为现代语言学研究奠定了理论基础,当代语言学的许多研究成果实际上是对他提出的观念的本质和 ...
个人分类: 语言学基础研究|2844 次阅读|0 个评论
暑假:音乐,语言学,通识教育
热度 2 aejj 2013-8-18 04:15
美国大学的暑假几乎有三个月,给你时间捣腾自己想干的事情。假期学校没什么人,所以可以找最好的琴随便练(有几天直接晚上在琴房睡觉了)。现在练琴似乎找到了一点门道,至少知道自己什么时候在正确的轨道上,什么时候在浪费时间。一年练下来发现练琴中最重要的好像还不是什么天赋、技巧或者年龄之类的问题,而是自律、毅力、脑筋和精力。既要花时间下工夫,又要琢磨工夫怎么下对地方,怎么样积少成多。如此下来总算开始有点自己也看得见的进步,练习也越来越不痛苦。 当然另一个后果是对钢琴的生理需要越来越强烈。现在每天不在规定的时间里弹琴,便会心慌的像丢了魂一样。指头和耳朵都对键盘和声音有了越来越强烈的渴望。离了琴仍然控制不住地会在脑子里习谱子或者找手感。 七月份突然丢开了钢琴(那一个月里只弹了两次琴,可想而知憋到了什么程度)去密歇根大学参加了为期一个月的美国语言学会组织的两年一次的语言学 summer institute ,各种课程、讲习班、研讨会、讲座一应俱全。语言学各个方向的顶尖学者悉数到场。语言学似乎是这样一门学科:门槛不如数学或者物理那样的经典学科高,也不像音乐或者人文那样要各种各样的积淀,但未知的问题很多,甚至基本的方法和问题都有很大的争议。好处也许是你用不多的时间就能站到前沿做研究甚至研究一些很重大的问题,坏处是糟糕的、不清不楚的甚至鱼目混珠的研究也可能混在其中。有时候挑研究方向似乎更像是押宝:挑对了方向可能朝着困惑人类甚至几个世纪的问题迈进,如果挑错了也许会跟以前搞“燃素”或者“以太”的差不多,做几十年无用功。更多的研究似乎给人的感觉是虽然站在所谓的“前沿”,但是不过尔尔,做得出或者做不出来意思都不大。当然我不完全算得是个行内人,涉世也不深,其中的门道也许我还远远没有看透。 我的一大兴趣之一在语言学和音乐学的交集,但是这个领域有点过于新鲜,鲜有人耳闻。于是我在哪都尴尬(其实是老尴尬加新尴尬):在语言学的人群中说我是学钢琴的,回音乐学院同学说你干吗去了我说我去参加了个语言学大会。在两个领域中的体验也是千差万别:语言学现在算是一门挺热的学科了,一个月的会议课程,让人觉得有前景、有意思的而且又很靠谱的研究也不非常多。但是老师加学生浩浩荡荡五六百人,场面的浩大和学者们的雄心有时会令人热血沸腾。在这个领域不时会听到这样的句式是:两千年来人们认为什么什么是怎样的,现在我们发现是错的。我不知道其他科学集会的规模,听说下个月在加州的世界神经科学的大会有三万人。和壮观的科学大会和前沿的研究比起来,每天孤独地在琴房里练习两百年前写的曲子的生活确实有很大的不同。 暑假还去了普林斯顿的国际思想史协会的年会,本年的主题是以历史的角度看博雅 / 通识教育。虽然是人文界的国际级会议,但是主会场就一百来人,有些分会可能十个人都没有。整个基调也与科学界热火朝天干劲十足的氛围截然不同。大会的主题演讲很大一部分集中在探讨人文学科和通识教育在今日世界的空前衰落和危机。许多学者或悲叹或甚至愤慨。有的甚至问说为什么还要去说服或者“哄骗”那些原本前程似锦的年轻人去自己干的这个工作也找不到的行当(当然原因之一是他自己也不肯丢掉他的工作)。回来以后又回忆我经历的教育和见过的关于教育的争论,思绪又飞扬起来。这个改天有空再细讲。 反观我自己,我再一次问自己要怎么样的生活。我似乎对艺术创造、做前沿科学研究或者啃古书都有很大的兴趣,也有幸对这些生活都有一些体味。每一种生活当然都需要大量和专门的准备和训练,但是有时候我发现它们确实是被人为分开的(有个老教授半开玩笑说分不同的科系的原因是大家都好要到funding——这种原因我这种小孩子当然做梦都不会想到)。我也许注定要生存在它们的交集地带。也许我一辈子就会这样一直不舒服下去,但也许我可以做些改变,让那些看似“隔行如隔山”的领域之间开始能够互相欣赏和分享各自的精彩。
个人分类: 上学记|2546 次阅读|2 个评论
【科普小品:文法里的父子原则】
热度 5 liwei999 2013-8-6 23:10
语言学听上去既文傻,也枯燥,学完了还找不到工作,可真学进去好玩的事儿多着呢。今天就讲一桩,叫老子和儿子的语言学。本来是讲给实习生听的,他/她们琢磨 PP-attachment 正困惑呢。故事讲完了,乘兴就写出来吧。徒吾徒,以及人之徒,许是功德一枚。 乔神仙(Noam Chomsky) 特神仙(Lucien Tesnière) 话说这语言学里面有一门学问叫文法。学文法简单来说就是学画树。各种各样形态各异的树,表达了语言的多姿多彩,却万变不离其宗。奇妙啊。当年上帝怕人类同语同心去造通天之塔,乱了天地纲常,遂下旨搅乱了人类语言。印欧汉藏,枝枝蔓蔓,从此语言的奥秘就深藏不露。于是催生了一批文法学家,试图见人所不能见,用树形图来解剖语言的结构。忘了第一个画树的人是谁,感觉上这不是人力可为。天机不可泄漏,泄漏者非神即仙。历史上有两位功力非凡的文法神仙专门与上帝作对,各自为语言画树,一位叫 Tesnière ,另一位就是大名鼎鼎的 乔姆斯基 。 本来我们说话写文章都是一个词一个词往外蹦,这样出来的句子数学上叫线性一维。可这线性的东西到了文法家眼里就变了,一维变两维,线性变平面,于是产生了树形结构。上图的树就是我们训练出来的文法机器人( parser) 自动生成的,虽然并非完美无缺,倒也风姿绰约。最可爱的是,这机器文法学家玩这一维变两维的游戏是乐此不疲,只要你源源不断送文章给它,它就没完没了地给你画树玩儿。这要是人可就要小心了, 这玩意儿不能入迷,入迷了看什么都是树,最后在森林里面湮没,也不是不可能的。 有两大类树,都要倒过来画的,根朝上叶朝下,依据的是两种语言学理论,代表人物就是前面提到的神仙特氏和乔氏。上面的树就是特氏的依从关系树(dependency tree),它直接把作为文法基本单位的词与词串成树形。还有一种就是 乔氏短语结构树 (phrase structure tree),特点是在基本单位之间加了很多中介(non-terminal nodes),然后成形,这种树此处不议,略过。这里画的都是依存关系为主的树,只是有些树的节点上保留了一些短语结构的痕迹(譬如 NP,PP 等),有时候叫作 混合树 (hybrid tree)。 依从关系文法里面有一条著名的君君臣臣父父子子的原则,说的倒也是大白话: 一个孩子最多只有一个老子,老子则可以有 0-n 个孩子 。 其实,孩子当然可以有多个老子,譬如乔布斯就有两个老子,一个生父,一个养父。但是从法统上,只能有一个。这个法统在文法上就有了体现。比较下面这两个英文句子: We asked him to leave immediately We asked that he leave immediately 这两句的用词以及意思都差不多(有细微差别),但句法却不同。从深层的逻辑意义上说,he/him 既是 asked 的宾语,也是 leave 的主语。可是文法不答应,它要遵循一个孩子最多一个老子的原则。为此,第一个句子使用的句型采用了两个文法手段,一是用宾格来强调 him 是宾语,不是主语;二是用不定式(带to的动词)来切断主语谓语的可能瓜葛(英语不定式不能做谓语)。同理,第二个句子用了另外一种句型,采用了另外两个手段:一是增加了从句小词 that 来切断 he 作为 asked 宾语的可能性;二是用主格 he 来表达它的谓语老子是 leave(虚拟式谓语,不用 s)。图示如下(S表示主语,O是宾语,Com是补足语,Adv是状语,Mod是定语,Cl是从句): 这是执行这项父子原则时手段黑白分明的情形。但是自从语言被上帝弄乱了以后,手段有时候不够使唤,譬如主格宾格的手段只在代词(而且 it/you 还除外)身上显现,到了名词(譬如 John)身上就指靠不上了:We asked John to leave immediately vs We asked that John leave immediately,好在还有小词 to 和 that 在那里罩着,隐约还可看到主谓(that John leave)区分于动宾(asked John to...)的形式痕迹。可是到了汉语这些小词全没了,上面两句翻译过来就一样了,主语宾语还怎么区分呢? 我们请他立即离开。 汉语学家于是创造了一个特别的术语叫“兼语” (兼做主语和宾语) ,正式认可了这种违反原则的语言事实: 可见凡是叫做“原则”的东东就是一条超大的规则,上有规则下有例外是语言常态,因此违反原则的事并不鲜见。 汉语出兼语,就不讲原则嘛!头脑里怎么想,就直通通出来,也不穿一套文法西装(词尾、小词之类的手段)遮挡一下暧昧关系,闹得主宾混淆,显得远不如欧洲语言严谨。 认真想来,父子原则其实说的是角色定位的法统唯一性,你做了张三的儿子,就不能当李四的儿子。你是谁的宾语,就不该再做其他词的主语,不要脚踩两条船,否则容易引起误会。如果遇到一种说法,单单从形式模式上无法区分是谁的儿子,那就是歧义结构,对应两颗不同的树, 有两个不同的意思 。西方语言中最知名的歧义结构叫做介词短语找老子(PP-attachment)的问题,它的形式模式是:V + NP + PP,其中介词短语 PP 的老子既可能是名词短语 NP,也可能是动词 V。譬如: They saw the girl with the telescope. 歧义结构不违反原则,反而支持了这项原则。说明根据原则画的句法树可以把隐含的结构歧义清晰地表达出来。上述例句赶巧有双关语(pun)的特性,在句子层面两种意思的可能都存在( 用望远镜看姑娘 vs 看那戴望远镜的姑娘 )。多数情形是,文法层虽然有两种可能性,但语义配搭上却只有一种解读(语义消歧),譬如: They saw . They with a hammer]. 这就跟三角恋爱一样,恋爱层面有三个角色(V,NP,PP)两组关系(『V,PP』,『NP,PP』),可通常只能有一种婚姻关系。谁与谁结合,决定于相互的吸引力(semantic coherence,语义和谐度,俗话叫谈得来)。显然,『the nail, with a hammer』的气味不相投,根本无法与『hit, with a hammer』比,前者的语义( 带着锤子的钉子 )不搭配,远不如( 拿着锤子去砸 )自然然贴切。 同理, 在『the girl, with a hat』与『saw, with a hat』的较量中,前者更加般配,后者不 make sense。 仔细研究可以发现,所谓父子原则不过是在文法层次用归纳法总结出来的一种统计上带有一定普遍性的趋势,在逻辑语义的深层(大脑思想里)并没有这条约束。客观世界里面,绝少一个实体只充当一个角色。张三在父亲面前是儿子,在儿子面前是父亲,在公司是老总,在太太面前是丈夫兼车夫,等等。 思想是客观世界的反映, 所以多角色在语义上没有问题。那么为什么语言中常常强加这么一种文法的原则性,规定只能有一种合法角色?一种解释是,角色可以多,但在法理上应该只有一个为主,天无二日,世界太平。这叫好比某官员有隐藏的小三甚至小四在金屋里,可法理上的配偶只有一位,否则就违反原则,不成体统。 【补记】 又想了一下这个问题,我本来的解说的对的,后来为了趣味性,carried away,文末几句有误导了,应该修正 作者: 立委 日期: 08/07/2013 14:14:40 这个语言学文法结构的父子原则是由语言的交流本质决定的。一般而言,一个儿子一个老子的结构是没有歧义的,因此适应了语言交流的需要。如果语言中满是一子多父的情形,那么人理解语言将遇到重重歧义的困境,交流怎么能顺畅。 什么天无二日,脚不能踩两只船,小三小四不合法等等“法理”都是为了趣味牺牲了实质的笑话,不能当真。 看样子,科普写作要防止不小心为了乐趣不知不觉就牺牲了正确性的做法。 再进一步说,虽然大千世界里同一个实体可有多个角色并与其他实体发生多种关系,然而当语言在反映(描述)这些角色和关系的时候,仍然基本遵循一子一父原则。其中的道理就是,文法是针对语句的,而不是针对篇章(discourse)的。一个被提到的实体在一个句子的有限范围内,通常只扮演一个角色,描述一种关系(例外自然是有的,譬如汉语中的兼语现象,但这类例外属于语言中少数现象)。要想反映实体世界的多重关系,人常用由多语句组成的篇章来描述。 人类的交流过程就是利用自然语言这个通讯工具(vehicle)编码与解码的过程。严谨的语言工具提供种种形式化手段(如,前后缀、小词、词序等)和文法范畴(如,格、数、人称、时态、语态及其一致关系),限制编码过程中歧义的产生,这样受众在解码的时候就可以比较容易理解说话人想表达的意义,达成交流的目的。也正是在这样的一个人类交流的背景下,才有文法中父子原则的自然显现和贯彻。父子原则 有很多语言事实支持它,于是上升到原则,为语言学家所乐道。 【相关篇什】 乔氏 X 杠杠理论 以及各式树形图表达法 【立委科普:自然语言parsers是揭示语言奥秘的LIGO式探测仪】 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|10353 次阅读|5 个评论
科学与人文的冲突:语言学家乔姆斯基的最新演讲
热度 12 aejj 2013-7-21 13:10
上个星期语言学家乔姆斯基来跟我们演讲,题目叫作 what is language , and why does it matter? (什么是语言,它为什么重要?) 看似朴实然而这种题目简直非大牛不能讲。然而就连叱咤学界近六十年的乔姆斯基对这个问题,依然还是低调的不得了。 他承认自己开拓的“生成语法”(一种普遍的语法描述:它假设所有的人类语言都可以从这种描述中“生成”出来)在整个语言学界很多人已经不赞同了(但是当然,似乎还没有人提出比生成语法好的语言学的基本方法)。他在别的场合也说哪怕生成语法的具体内容全部是错的也没有关系,但是一个基本的认识应该是不容置疑的了,那就是人类独有的某种先天的普适的语言潜能。但是不管是“生成语法”还是其他关于人类先天语言潜能的证明最终都只能靠脑科学,至于什么时候能达到那简直是遥遥无期了。他也依然坚信“笛卡尔式”的科学方法是让语言学成为一门科学的路子。而在语言学中这种方法的实现的几乎唯一可行的原则叫做“最小计算性”( minimal computation ,也是“生成语法”的一个基本前提假设)。 他最后承认对于“语言是什么“这个问题人类还完全没有答案。但是一直在研究中以这个基本问题为出发点,并将这个问题实践为具体的研究方案,才是语言学这门学科的基础和核心。 这句话听上去好像是废话一样。一个学科如果不是缺少一个对基本方法和基本假设的共识的话,这种话也许的确是废话。而语言学目前似乎就是这样的一门学科,虽然大家各自都在自己的阵地上搞的异常热闹,但是不同的分支的学者坐在一起说几句话就像是在不同的世界里一样,不是因为没话讲或是每个人都很深奥,而是大家就语言现象经常有完全不同的方法和假设。 这种分裂也许从大家对乔姆斯基的态度上就可见一般。我这不到一个月像赶集一样见着了语言学很多方向的头牌科学家。研究语法的不用说,一个星期以前就奔走相告一遍遍地说不要忘了去听乔姆斯基。心理语言学的一个教授也是如此,两次提醒我们一定要去啊,不要迟到,乔姆斯基真棒。而研究语言相对论的或者是语言人类学的,基本是对他只字不提。演讲时乔姆斯基一入场,一部分人几乎发出对英雄一样的欢呼。而坐在我旁边的搞语言人类学的同学后来跟我说他差点睡着了,演讲完后搞语言人类学的几个人聚在一起,对老乔煞是不屑,有人还有些愤怒,说乔姆斯基怎么能说“ communication ”对于语言不重要呢——不过这回乔姆斯基对“ communication ”已经不那么恶搞了,记得一年前他演讲中说,对于语言学家,研究 communication 就像想研究眼睛的功能最后集中在眼睛怎么看电视上一样 …. 传统自然科学运用到更复杂的现象上最为人诟病的就是它的数学决定论和还原论的倾向。不管是遵循还是试图突破这些方法去了解更复杂和更宏观现象,至今为止好像还没有什么范式性的成功案例。乔姆斯基的理论之所以有那么大的影响(据说他迄今的引文次数在古今所有西方思想家中排名第八),我想也许是因为他的理论是第一个既有足够的数学底气(主要是逻辑)、又能较完备地解释一类人类现象(即语法)之复杂性和创造性的理论。但即便如此,这样的理论依然不被很多语言学家和研究语言的学者所接收。今天语言学本身的分裂也许最集中和尖锐地体现了自然科学与人类现象、与人文视角的冲突,以及试图弥合它们之间的分歧的努力。C`·P·斯诺在五十多年前提到科学与人文两种文化的分裂。到今天,弥合这个分裂的努力确实有不少,但是科学和人文的裂隙似有愈演愈烈之嫌——有一位人文学者最近指出,至少在五十年前,人文学科在大学中的处境比在今天似乎还好很多。 演讲后的最后一个提问是一个看着应该还在上小学的小朋友。本来都要散场了,但是大家发现小朋友还想问问题时一致鼓励他往主席台走,最后被主持人请上台去当着乔姆斯基和所有人的面提问。他的问题是,我想知道当我看一本书的时候我有我的感受和想法,但是我的朋友看同样一本书的时候会有不同的感受和想法,这到底是怎么回事啊。乔姆斯基说你已经比好多人都厉害了。他大概讲了一些自己的观点,但是他承认,他还完全没有答案,他鼓励小朋友说这个问题就靠你长大去解决了。 今天的语言学哪怕对一个小朋友的问题也说不出个所以然来,这也许是这门学科令人难受,但是也令人为它的前景感到兴奋的地方吧。
个人分类: 学问|7773 次阅读|21 个评论
2013年A&HCI收录语言与语言学学科期刊189种目录
wanyuehua 2013-7-13 10:11
SCI 、 SSCI 、 AHCI 均收录语言与语言学期刊, 2013 年 AHCI 收录语言学学科期刊 189 种,其中被 SCI 、 SSCI 、 AHCI 共同收录语言与语言学期刊 3 种: Computational Linguistics 《计算语言学》、 Natural Language Engineering 《自然语言工程》、 Phonetica 《语音学》。 SSCI 、 AHCI 共同收录语言与语言学期刊 129 种,例如: Across Languages and Cultures 《语言与文化的跨越》、 Acta Linguistica Hungarica 《匈牙利科学院语言学学报》、 Child Language Teaching and Therapy 《儿童语言教学与疗法》、 Cognitive Linguistics 《认知语言学》、 Dialectologia et Geolinguistica 《方言学与地方语言学》、 Functions of Language 《语言的功能》、 International Journal of Lexicography 《国际词汇学杂志》、 Journal of African Languages and Linguistics 《非洲语言和语言学杂志》、 Journal of East Asian Linguistics 《东亚语言学杂志》、 Journal of English Linguistics 《英语语言学杂志》、 Journal of Pidgin and Creole Languages 《混杂语言和克里奥尔语杂志》、 Journal of Germanic Linguistics 《日尔曼语言学杂志》 、 Journal of Language Politics 《语言与政治杂志》、 Language and Intercultural Communication 《语言与不同文化间的交流》、 Language Problems and Language Planning 《语言问题与语言计划》 、 Language Sciences 《语言科学》、 Language Variation and Change 《语言的演变》、 Metaphor and Symbol 《隐喻与象征》、 Natural Language Linguistic Theory 《自然语言与语言理论》 、 Natural Language Semantics 《自然语言语义学》 、 Phonology 《语音学》 、 Theoretical Linguistics 《理论语言学》、 Zeitschrift fuer Dialektologie und Linguistik 《方言学与语言学杂志》等。 AHCI 收录语言与语言学期刊 57 种:例如: AAA- Arbeiten aus Anglistik und Amerikanistik 《美国与英国语言、历史、文化研究论文集》、 Anglia; Zeitschrift fuer englische Philologie 《英语语言学》、 Beitraege zur Geschichte der deutschen Sprache und Literatur 《德国语言文学史论文集》、 German Quarterly 《德语季刊》、 Historiographia Linguistica 《编史语言学》、 Journal of English and Germanic Philology 《英语与德语语文学杂志》、 Lingua e Stile 《语言与文体》、 Modern Language Review 《现代语言评论》、 Meta 《译者杂志》、 Neophilologus 《新语言学》、 Papers on Language and Literature 《语言与文学文集》 、 Philological Quarterly 《语文学季刊》、 Revue de Linguistique Romane 《罗曼语语言学杂志》、 Russian Linguistics 《俄罗斯语言学》、 Sprachwissenschaft 《语言学》、 Studia Neophilologica 《新语文学研究》、 Transactions of the Philological Society 《语义学学会汇刊》、 Zeitschrift fuer Germanistische Linguistik 《德语语言学杂志》、 Zeitschrift fuer Romanische Philologie 《罗马语系语言学杂志》、 Zeitschrift fuer Slawistik 《斯拉夫语杂志》等。详细 2013 年 AHCI 收录语言学学科期刊请看附件。 2013 年 AHCI 收录语言与语言学学科期刊 189 种目录 ARTS HUMANITIES CITATION INDEX LANGUAGE LINGUISTICS - JOURNAL LIST Total journals: 189 注: ★ SCI、SSCI、AHCI共同收录期刊3种 ▲ SSCI 、AHCI共同收录期刊129种 1. AAA-ARBEITEN AUS ANGLISTIK UND AMERIKANISTIK 《美国与英国语言、历史、文化研究论文集》 Semiannual ISSN: 0171-5410 GUNTER NARR VERLAG, DISCHINGERWEG 5, TUBINGEN, GERMANY , D 72070 1. Arts Humanities Citation Index 2. ▲ ACROSS LANGUAGES AND CULTURES 《语言与文化的跨越》 Semiannual ISSN: 1585-1923 AKADEMIAI KIADO RT, PRIELLE K U 19, PO BOX 245,, BUDAPEST, HUNGARY , H-1117 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 3. ▲ ACTA LINGUISTICA HUNGARICA 《匈牙利科学院语言学学报》 Quarterly ISSN: 1216-8076 SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 4. ▲ AFRICANA LINGUISTICA 《非洲语言学》 Annual ISSN: 0065-4124 ROYAL MUSEUM CENTRAL AFRICA-BELGIUM, 13 LEUVENSESTEENWEG, TERVUREN, BELGIUM , 3080 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 5. ▲ AMERICAN SPEECH 《美国语言》 Quarterly ISSN: 0003-1283 DUKE UNIV PRESS, 905 W MAIN ST, STE 18-B, DURHAM, USA , NC, 27701 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 6. ANGLIA-ZEITSCHRIFT FUR ENGLISCHE PHILOLOGIE 《英语语言学》 Tri-annual ISSN: 0340-5222 MAX NIEMEYER VERLAG, PFRONDORFER STR 6, TUBINGEN, GERMANY, D-72074 1. Arts Humanities Citation Index 7. ▲ ANNUAL REVIEW OF APPLIED LINGUISTICS 《应用语言学年评》 Annual ISSN: 0267-1905 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS , NEW YORK, USA , NY, 10013-2473 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 8. ARCHIV FUR DAS STUDIUM DER NEUEREN SPRACHEN UND LITERATUREN 《语言和文学研究文献》 Semiannual ISSN: 0003-8970 ERICH SCHMIDT VERLAG, GENTHINER STRASSE 30G, BERLIN-TIERGARTEN, GERMANY, D-10785 1. Arts Humanities Citation Index 9. ▲ ARGUMENTATION 《论证》 Quarterly ISSN: 0920-427X SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 10. ▲ ATLANTIS-JOURNAL OF THE SPANISH ASSOCIATION OF ANGLO-AMERICAN STUDIES 《 西班牙 英美 研究 协会 杂志》 Semiannual ISSN: 0210-6124 ASOC ESPANOLA ESTUDIOS ANGLO-NORTEAMERICANOS-AEDEAN, C/O DEPT FILOLOFIA INGLESA I, UNIV COMPLUTENSE DE MADRID, FAC FILOLOGIA, MADRID, SPAIN, 28040 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 11. ▲ AUSTRALIAN JOURNAL OF LINGUISTICS 《澳大利亚语言学杂志》 Quarterly ISSN: 0726-8602 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 12. ▲ BABEL-REVUE INTERNATIONALE DE LA TRADUCTION-INTERNATIONAL JOURNAL OF TRANSLATION 《巴伯尔:国际翻译 杂志 》 Quarterly ISSN: 0521-9744 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 13. BEITRAGE ZUR GESCHICHTE DER DEUTSCHEN SPRACHE UND LITERATUR 《德国语言文学史论文集》 Tri-annual ISSN: 0005-8076 MAX NIEMEYER VERLAG, PFRONDORFER STR 6, TUBINGEN, GERMANY, D-72074 1. Arts Humanities Citation Index 14. BULLETIN OF THE INSTITUTE OF HISTORY AND PHILOLOGY ACADEMIA SINICA 《 中央研究院 历史语言 研究所 通报 》 Quarterly ISSN: 1012-4195 ACAD SINICA-INST HISTORY PHILOLOGY, EDITORIAL COMMITTEE, TAIPEI, TAIWAN , 11529 1. Arts Humanities Citation Index 15. ▲ CALIDOSCOPIO Tri-annual ISSN: 1679-8740 EDITORA UNISINOS, DIVISAO DE PERIODICIOS, CAIXA POSTAL 275, SAO LEOPOLDO, BRAZIL, RS 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 16. CANADIAN JOURNAL OF LINGUISTICS-REVUE CANADIENNE DE LINGUISTIQUE 《加拿大语言学杂志》 Tri-annual ISSN: 0008-4131 UNIV TORONTO PRESS INC, JOURNALS DIVISION, 5201 DUFFERIN ST, DOWNSVIEW, TORONTO, CANADA , ON, M3H 5T8 1. Arts Humanities Citation Index 17. ▲ CHILD LANGUAGE TEACHING THERAPY 《儿童语言教学与疗法》 Tri-annual ISSN: 0265-6590 SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND , EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 18. ▲ CIRCULO DE LINGUISTICA APLICADA A LA COMUNICACION 《应用语言学通讯》 Quarterly ISSN: 1576-4737 UNIV COMPLUTENSE MADRID, SERVICIO PUBLICACIONES, CIUDAD UNIV, OBISPO TREJO 3, MADRID, SPAIN, 28040 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 19. ▲ COGNITIVE LINGUISTICS 《认知语言学》 Quarterly ISSN: 0936-5907 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 20. COLLOQUIA GERMANICA 《德国语言文学论坛》 Tri-annual ISSN: 0010-1338 FRANCKE VERLAG, DISCHINGERWEG 5, TUBINGEN, GERMANY, D-72070 1. Arts Humanities Citation Index 21. ★ COMPUTATIONAL LINGUISTICS 《计算语言学》 Quarterly ISSN: 1530-9312 MIT PRESS, 55 HAYWARD STREET, CAMBRIDGE, USA , MA, 02142 1. Science Citation Index 2. Science Citation Index Expanded 3. Social Sciences Citation Index 4. Arts Humanities Citation Index 22. ▲ COMPUTER ASSISTED LANGUAGE LEARNING 《计算机辅助语言学习》 Bimonthly ISSN: 0958-8221 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 23. ▲ CORPUS LINGUISTICS AND LINGUISTIC THEORY 《语料库语言学与语言学理论》 Semiannual ISSN: 1613-7027 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 24. CRITICA HISPANICA 《西班牙评论》 Semiannual ISSN: 0278-7261 CRITICA HISPANICA, DUQUESNE UNIV, DEPT MODERN LANGUAGE, 201 DES PLACES, PITTSBURGH, USA , PA, 15282 1. Arts Humanities Citation Index 25. DEUTSCHE SPRACHE 《德语》 Quarterly ISSN: 0340-9341 ERICH SCHMIDT VERLAG, GENTHINER STRASSE 30G, BERLIN-TIERGARTEN, GERMANY, D-10785 1. Arts Humanities Citation Index 26. ▲ DIACHRONICA 《历史语言学》 Semiannual ISSN: 0176-4225 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 27. ▲ DIALECTOLOGIA ET GEOLINGUISTICA 《方言学与地方语言学》 Annual ISSN: 0942-4040 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 28. EIGSE-A JOURNAL OF IRISH STUDIES Annual ISSN: 0013-2608 NATL UNIV IRELAND , 49 MERRION SQ, DUBLIN, IRELAND , 2 1. Arts Humanities Citation Index 29. ▲ ELT JOURNAL 《英语教学杂志》 Quarterly ISSN: 0951-0893 OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND , OX2 6DP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 30. ▲ ENGLISH LANGUAGE LINGUISTICS 《英语及语言学》 Tri-annual ISSN: 1360-6743 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 31. ▲ ENGLISH TEACHING-PRACTICE AND CRITIQUE 《英语教学》 Tri-annual ISSN: 1175-8708 UNIV WAIKATO, SCH EDUCATION, PRIVATE BAG 3105, HAMILTON, NEW ZEALAND , 00000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 32. ▲ ENGLISH TODAY 《今日英语》 Quarterly ISSN: 0266-0784 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS , NEW YORK, USA , NY, 10013-2473 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 33. ▲ ENGLISH WORLD-WIDE 《世界英语》 Tri-annual ISSN: 0172-8865 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 34. ▲ ESTUDIOS FILOLOGICOS 《语言学研究》 Annual ISSN: 0071-1713 UNIV AUSTRAL CHILE , FAC FILOSOFIA HUMANIDADES CASILLA 142 ESTUDIOS FILOLOGICOS, VALDIVIA, CHILE 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 35. ▲ EUROPEAN JOURNAL OF ENGLISH STUDIES 《欧洲英语研究杂志》 Tri-annual ISSN: 1382-5577 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 36. EUROPEAN JOURNAL OF SCANDINAVIAN STUDIES 《欧洲斯堪的纳维亚研究》 Semiannual ISSN: 2191-9399 WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Arts Humanities Citation Index 37. ▲ FOLIA LINGUISTICA 《语言学报 ; 欧洲语言学会学报》 Semiannual ISSN: 0165-4004 WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 38. ▲ FOLIA LINGUISTICA HISTORICA 《语言史》 Annual ISSN: 0168-647X MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 39. FORUM ITALICUM 《意大利研究杂志》 Semiannual ISSN: 0014-5858 FORUM ITALICUM, CENTER FOR ITALIAN STUDIES STATE UNIV OF NEW YORK, STONY BROOK, USA , NY, 11794-3358 1. Arts Humanities Citation Index 40. FRANCAIS MODERNE 《现代法语》 Semiannual ISSN: 0015-9409 CONSEIL INT LANGUE FRANCAISE, 11 RUE NAVARIN, PARIS, FRANCE, 75009 1. Arts Humanities Citation Index 41. ▲ FUNCTIONS OF LANGUAGE 《语言的功能》 Semiannual ISSN: 0929-998X JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 42. ▲ GENDER AND LANGUAGE 《性别与语言》 Tri-annual ISSN: 1747-6321 EQUINOX PUBLISHING LTD, UNIT S3, KELHAM HOUSE, 3 LANCASTER STREET, SHELFIELD, ENGLAND , S3 8AF 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 43. GERMAN QUARTERLY 《德语季刊》 Quarterly ISSN: 0016-8831 WILEY-BLACKWELL, 111 RIVER ST, HOBOKEN, USA , NJ, 07030-5774 1. Arts Humanities Citation Index 44. ▲ GESTURE 《手势》 Tri-annual ISSN: 1568-1475 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 45. ▲ HISPANIA-A JOURNAL DEVOTED TO THE TEACHING OF SPANISH AND PORTUGUESE 《西班牙》 Quarterly ISSN: 0018-2133 AMER ASSOC TEACHERS SPANISH PORTUGUESE, INC, 900 LADD RD, WALLED LAKE, USA , MI, 48390 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 46. HISTORIOGRAPHIA LINGUISTICA 《编史语言学》 Semiannual ISSN: 0302-5160 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Arts Humanities Citation Index 47. ▲ HUMOR-INTERNATIONAL JOURNAL OF HUMOR RESEARCH 《幽默》 Quarterly ISSN: 0933-1719 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 48. ▲ IBERICA 《伊比利亚》 Semiannual ISSN: 1139-7241 AELFE, UNIV JAUME I, FAC CIENCIES HUMANAS SOCIALS, DEPT ESTUDIS ANGLESOS, CAMPUS RIU SEC, S-N, CASTELLO, SPAIN, 12071 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 49. IBEROROMANIA 《伊比利亚罗马语系》 Semiannual ISSN: 0019-0993 MAX NIEMEYER VERLAG, PFRONDORFER STR 6, TUBINGEN, GERMANY, D-72074 1. Arts Humanities Citation Index 50. ▲ INDOGERMANISCHE FORSCHUNGEN 《印度日尔曼语言研究》 Annual ISSN: 0019-7262 WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 51. ▲ INTERCULTURAL PRAGMATICS 《文化交流实用学》 Quarterly ISSN: 1612-295X MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 52. ▲ INTERNATIONAL JOURNAL OF AMERICAN LINGUISTICS 《国际美洲语言学杂志》 Quarterly ISSN: 0020-7071 UNIV CHICAGO PRESS, 1427 E 60TH ST, CHICAGO, USA , IL, 60637-2954 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 53. ▲ INTERNATIONAL JOURNAL OF BILINGUAL EDUCATION AND BILINGUALISM 《国际双语教育与双语使用杂志》 Bimonthly ISSN: 1367-0050 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 54. ▲ INTERNATIONAL JOURNAL OF BILINGUALISM 《国际双语杂志》 Quarterly ISSN: 1367-0069 SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND , EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 55. ▲ INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS 《国际语料库语言学杂志》 Quarterly ISSN: 1384-6655 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 56. ▲ INTERNATIONAL JOURNAL OF LEXICOGRAPHY 《国际词汇学杂志》 Quarterly ISSN: 0950-3846 OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND , OX2 6DP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 57. ▲ INTERPRETER AND TRANSLATOR TRAINER 《口译及翻译培训师》 Semiannual ISSN: 1750-399X ST JEROME PUBLISHING, 2 MAPLE ROAD, WEST, BROOKLANDS, MANCHESTER, ENGLAND , M23 9HH 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 58. ▲ INTERPRETING 《口译》 Semiannual ISSN: 1384-6647 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 59. ▲ JOURNAL OF AFRICAN LANGUAGES AND LINGUISTICS 《非洲语言和语言学杂志》 Semiannual ISSN: 0167-6164 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 60. ▲ JOURNAL OF CHINESE LINGUISTICS Semiannual ISSN: 0091-3723 JOURNAL CHINESE LINGUISTICS, CHINESE UNIV HONG KONG, CENTRE EAST ASIAN STUDIES, SHATIN, NEW TERRITORIES, PEOPLES R CHINA, HONG KONG, 00000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 61. ▲ JOURNAL OF COMPARATIVE GERMANIC LINGUISTICS 《比较日耳曼语言学杂志》 Tri-annual ISSN: 1383-4924 SPRINGER, 233 SPRING ST, NEW YORK, USA , NY, 10013 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 62. ▲ JOURNAL OF EAST ASIAN LINGUISTICS 《东亚语言学杂志》 Quarterly ISSN: 0925-8558 SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 63. JOURNAL OF ENGLISH AND GERMANIC PHILOLOGY 《英语与德语语文学杂志》 Quarterly ISSN: 0363-6941 UNIV ILLINOIS PRESS, 1325 S OAK ST, CHAMPAIGN, USA , IL, 61820-6903 1. Arts Humanities Citation Index 64. ▲ JOURNAL OF ENGLISH FOR ACADEMIC PURPOSES 《学术英语杂志》 Quarterly ISSN: 1475-1585 ELSEVIER SCIENCE BV , PO BOX 211, AMSTERDAM, NETHERLANDS , 1000 AE 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 65. ▲ JOURNAL OF ENGLISH LINGUISTICS 《英语语言学杂志》 Quarterly ISSN: 0075-4242 SAGE PUBLICATIONS INC, 2455 TELLER RD, THOUSAND OAKS, USA , CA, 91320 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 66. ▲ JOURNAL OF FRENCH LANGUAGE STUDIES 《法语研究杂志》 Tri-annual ISSN: 0959-2695 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 67. ▲ JOURNAL OF GERMANIC LINGUISTICS 《日尔曼语言学杂志》 Quarterly ISSN: 1470-5427 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 68. ▲ JOURNAL OF HISTORICAL PRAGMATICS 《历史语用论杂志》 Semiannual ISSN: 1566-5852 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 69. ▲ JOURNAL OF LANGUAGE AND POLITICS 《语言与政治杂志》 Tri-annual ISSN: 1569-2159 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 70. ▲ JOURNAL OF LANGUAGE IDENTITY AND EDUCATION 《语言、特性及教育杂志》 Bimonthly ISSN: 1534-8458 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 71. ▲ JOURNAL OF LINGUISTIC ANTHROPOLOGY 《语言人类学杂志》 Tri-annual ISSN: 1055-1360 WILEY-BLACKWELL, 111 RIVER ST, HOBOKEN, USA , NJ, 07030-5774 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 72. ▲ JOURNAL OF LINGUISTICS 《语言学杂志》 Tri-annual ISSN: 0022-2267 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS , NEW YORK, USA , NY, 10013-2473 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 73. JOURNAL OF LITERARY SEMANTICS 《文学语义学杂志》 Semiannual ISSN: 0341-7638 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Arts Humanities Citation Index 74. ▲ JOURNAL OF MULTILINGUAL AND MULTICULTURAL DEVELOPMENT 《多种语言及多种文化发展杂志》 Bimonthly ISSN: 0143-4632 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 75. ▲ JOURNAL OF PHONETICS 《语音学杂志》 Quarterly ISSN: 0095-4470 ACADEMIC PRESS LTD- ELSEVIER SCIENCE LTD, 24-28 OVAL RD, LONDON, ENGLAND , NW1 7DX 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 76. ▲ JOURNAL OF PIDGIN AND CREOLE LANGUAGES 《混杂语言和克里奥尔语杂志》 Semiannual ISSN: 0920-9034 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 77. ▲ JOURNAL OF POLITENESS RESEARCH-LANGUAGE BEHAVIOUR CULTURE 《礼貌研究杂志》 Semiannual ISSN: 1612-5681 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 78. ▲ JOURNAL OF PRAGMATICS 《语言实用学杂志》 Monthly ISSN: 0378-2166 ELSEVIER SCIENCE BV , PO BOX 211, AMSTERDAM, NETHERLANDS , 1000 AE 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 79. ▲ JOURNAL OF QUANTITATIVE LINGUISTICS 《定量语言学杂志》 Quarterly ISSN: 0929-6174 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 80. ▲ JOURNAL OF SEMANTICS 《语义学杂志》 Quarterly ISSN: 0167-5133 OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND , OX2 6DP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 81. ▲ JOURNAL OF THE INTERNATIONAL PHONETIC ASSOCIATION 《国际语音学会志》 Tri-annual ISSN: 0025-1003 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 82. KRITIKA KULTURA Semiannual ISSN: 2094-6937 ATENEO DE MANILA UNIV, SCH HUMANITIES, DEPT ENGLISH, LOYOLA HEIGHTS, QUEZON CITY, PHILIPPINES , 1108 1. Arts Humanities Citation Index 83. ▲ LANGUAGE 《语言》 Quarterly ISSN: 0097-8507 LINGUISTIC SOC AMER, 1325 18TH ST NW, SUITE 211, WASHINGTON, USA , DC, 20036-6501 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 84. ▲ LANGUAGE HISTORY 《语言与历史》 Semiannual ISSN: 1759-7536 MANEY PUBLISHING, STE 1C, JOSEPHS WELL, HANOVER WALK, LEEDS, ENGLAND , W YORKS, LS3 1AB 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 85. ▲ LANGUAGE ACQUISITION 《语言掌握》 Quarterly ISSN: 1048-9223 PSYCHOLOGY PRESS, 27 CHURCH RD, HOVE, ENGLAND , EAST SUSSEX, BN3 2FA 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 86. ▲ LANGUAGE AND EDUCATION 《语言与教育》 Bimonthly ISSN: 0950-0782 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 87. ▲ LANGUAGE AND INTERCULTURAL COMMUNICATION 《语言与不同文化间的交流》 Quarterly ISSN: 1470-8477 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 88. ▲ LANGUAGE AND LINGUISTICS 《语言与语言学》 Quarterly ISSN: 1606-822X INST LINGUISTICS ACAD SINICA, NO 130, SEC 2, ACADEMIA RD, NANKANG, TAIPEI, TAIWAN, 11529 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 89. ▲ LANGUAGE AND LITERATURE 《语言与文学》 Quarterly ISSN: 0963-9470 SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND , EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 90. ▲ LANGUAGE ASSESSMENT QUARTERLY 《语言评价季刊》 Quarterly ISSN: 1543-4303 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 91. ▲ LANGUAGE AWARENESS 《语言知识》 Quarterly ISSN: 0965-8416 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 92. ▲ LANGUAGE CULTURE AND CURRICULUM 《语言、文化与课程》 Tri-annual ISSN: 0790-8318 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 93. ▲ LANGUAGE MATTERS 《语言问题:非洲语言研究》 Semiannual ISSN: 1022-8195 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 94. ▲ LANGUAGE POLICY 《语言政策》 Quarterly ISSN: 1568-4555 SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 95. ▲ LANGUAGE PROBLEMS LANGUAGE PLANNING 《语言问题与语言计划》 Tri-annual ISSN: 0272-2690 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 96. ▲ LANGUAGE SCIENCES 《语言科学》 Bimonthly ISSN: 0388-0001 ELSEVIER SCI LTD, THE BOULEVARD, LANGFORD LANE, KIDLINGTON, OXFORD, ENGLAND , OXON, OX5 1GB 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 97. ▲ LANGUAGE TEACHING 《语言教学》 Quarterly ISSN: 0261-4448 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 98. ▲ LANGUAGE TESTING 《语言测验》 Quarterly ISSN: 0265-5322 SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND , EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 99. ▲ LANGUAGE VARIATION AND CHANGE 《语言的演变》 Tri-annual ISSN: 0954-3945 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 100. LANGUE FRANCAISE 《法语》 Quarterly ISSN: 0023-8368 LAROUSSE, 17 RUE DE MONTPARNASSE, PARIS, FRANCE, 75006 1. Arts Humanities Citation Index 101. ▲ LEXIKOS 《词汇学》 Annual ISSN: 1684-4904 BURO VAN DIE WAT, PO BOX 245, STELLENBOSCH, SOUTH AFRICA, 7599 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 102. LILI-ZEITSCHRIFT FUR LITERATURWISSENSCHAFT UND LINGUISTIK 《文学与语言学杂志》 Quarterly ISSN: 0049-8653 J B METZLER, POSTFACH 10 32 41, STUTTGART, GERMANY, D-70028 1. Arts Humanities Citation Index 103. ▲ LINGUA 《语言学》 Monthly ISSN: 0024-3841 ELSEVIER SCIENCE BV , PO BOX 211, AMSTERDAM, NETHERLANDS , 1000 AE 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 104. LINGUA E STILE 《语言与文体》 Semiannual ISSN: 0024-385X SOC ED IL MULINO, STRADA MAGGIORE 37, BOLOGNA, ITALY , 40125 1. Arts Humanities Citation Index 105. LINGUA NOSTRA 《我们的语言》 Semiannual ISSN: 0024-3868 CASA EDITRICE G C SANSONI SPA, LIC SPA, VIA DUCA DI CALABRIA, 1-1, FLORENCE, ITALY , 50125 1. Arts Humanities Citation Index 106. ▲ LINGUISTIC INQUIRY 《语言学研究》 Quarterly ISSN: 0024-3892 MIT PRESS, 55 HAYWARD STREET, CAMBRIDGE, USA , MA, 02142 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 107. ▲ LINGUISTIC REVIEW 《语言学评论》 Quarterly ISSN: 0167-6318 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 108. ▲ LINGUISTICA ANTVERPIENSIA NEW SERIES-THEMES IN TRANSLATION STUDIES 《翻译研究》 Annual ISSN: 0304-2294 ACADEMIC SCIENTIFIC PUBLISHERS-ASP, UNIV PRESS ANTWERP DIV, RAVENSTEINGALERIJ 28, BRUSSELS, BELGIUM , B-1000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 109. ▲ LINGUISTICA PRAGENSIA 《语言学》 Semiannual ISSN: 0862-8432 VERSITA, SOLIPSKA 14A-1, WARSAW, POLAND, 02-482 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 110. ▲ LINGUISTICS 《语言学》 Bimonthly ISSN: 0024-3949 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 111. ▲ LINGUISTICS AND PHILOSOPHY 《语言学与哲学》 Bimonthly ISSN: 0165-0157 SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 112. LINGUISTIQUE 《语言学》 Semiannual ISSN: 0075-966X PRESSES UNIV FRANCE, 6 AVENUE REILLE, PARIS CEDEX 14, FRANCE, 75685 1. Arts Humanities Citation Index 113. ▲ LITERACY 《读写能力》 Tri-annual ISSN: 1741-4350 WILEY-BLACKWELL, 111 RIVER ST, HOBOKEN, USA , NJ, 07030-5774 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 114. ▲ LITERARY AND LINGUISTIC COMPUTING 《文学与语言计算》 Quarterly ISSN: 0268-1145 OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND , OX2 6DP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 115. META 《译者杂志》 Quarterly ISSN: 0026-0452 PRESSES UNIV MONTREAL, PO BOX 6128, SUCCURSALE A, MONTREAL, CANADA, QUEBEC, H3C 3J7 1. Arts Humanities Citation Index 116. ▲ METAPHOR AND SYMBOL 《隐喻与象征》 Quarterly ISSN: 1092-6488 PSYCHOLOGY PRESS, 27 CHURCH RD, HOVE, ENGLAND , EAST SUSSEX, BN3 2FA 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 117. MODERN LANGUAGE REVIEW 《现代语言评论》 Quarterly ISSN: 0026-7937 MODERN HUMANITIES RES ASSN, KINGS COLLEGE STRAND, LONDON, ENGLAND , WC2R 2LS 1. Arts Humanities Citation Index 118. MODERN PHILOLOGY 《现代语文学》 Quarterly ISSN: 0026-8232 UNIV CHICAGO PRESS, 1427 E 60TH ST, CHICAGO, USA , IL, 60637-2954 1. Arts Humanities Citation Index 119. ▲ MULTILINGUA-JOURNAL OF CROSS-CULTURAL AND INTERLANGUAGE COMMUNICATION 《多种语言杂志》 Quarterly ISSN: 0167-8507 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 120. MUTTERSPRACHE 《本国语言》 Quarterly ISSN: 0027-514X GESELLSCHAFT DEUTSCHE SPRACHE, SPIEGELGASSE 13, WIESBADEN, GERMANY, D-65183 1. Arts Humanities Citation Index 121. ▲ NAMES-A JOURNAL OF ONOMASTICS 《名词》 Quarterly ISSN: 0027-7738 MANEY PUBLISHING, STE 1C, JOSEPHS WELL, HANOVER WALK, LEEDS, ENGLAND , W YORKS, LS3 1AB 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 122. ▲ NARRATIVE INQUIRY 《记叙文探究》 Semiannual ISSN: 1387-6740 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 123. ▲ NATURAL LANGUAGE LINGUISTIC THEORY 《自然语言与语言理论》 Quarterly ISSN: 0167-806X SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 124. ★ NATURAL LANGUAGE ENGINEERING 《自然语言工程》 Quarterly ISSN: 1351-3249 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Science Citation Index Expanded 2. Social Sciences Citation Index 3. Arts Humanities Citation Index 125. ▲ NATURAL LANGUAGE SEMANTICS 《自然语言语义学》 Quarterly ISSN: 0925-854X SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 126. NEOPHILOLOGUS 《新语言学》 Quarterly ISSN: 0028-2677 SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Arts Humanities Citation Index 127. NEUPHILOLOGISCHE MITTEILUNGEN 《现代语言》 Quarterly ISSN: 0028-3754 MODERN LANGUAGE SOC, HALLITUSKATU 11, HELSINKI, FINLAND , SF-00100 1. Arts Humanities Citation Index 128. ▲ NORDIC JOURNAL OF LINGUISTICS 《北欧语言学杂志》 Semiannual ISSN: 0332-5865 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 129. OCEANIC LINGUISTICS 《大洋洲语言学》 Semiannual ISSN: 0029-8115 UNIV HAWAII PRESS, 2840 KOLOWALU ST, HONOLULU, USA , HI, 96822 1. Arts Humanities Citation Index 130. ▲ ONOMAZEIN Semiannual ISSN: 0717-1285 PONTIFICIA UNIV CATOLICA CHILE, FAC LETRAS, AV VICUNA MACKENNA 4860, SANTIAGO, CHILE, 00000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 131. PAPERS ON LANGUAGE AND LITERATURE 《语言与文学文集》 Quarterly ISSN: 0031-1294 SOUTHERN ILLINOIS UNIV, BOX 43-A, EDWARDSVILLE, USA, IL, 62026-1434 1. Arts Humanities Citation Index 132. PERSPECTIVES-STUDIES IN TRANSLATOLOGY 《展望:翻译学研究》 Quarterly ISSN: 0907-676X ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Arts Humanities Citation Index 133. PHILOLOGICAL QUARTERLY 《语文学季刊 》Quarterly ISSN: 0031-7977 UNIV IOWA, ENGLISH PHILOSOPHY BLDG DEPT PUBLICATIONS LOU EICHLER, IOWA CITY, USA , IA,52242 1. Arts Humanities Citation Index 134. ★ PHONETICA 《语音学》 Quarterly ISSN: 0031-8388 KARGER, ALLSCHWILERSTRASSE 10, BASEL, SWITZERLAND, CH-4009 1. Science Citation Index Expanded 2. Social Sciences Citation Index 3. Arts Humanities Citation Index 135. ▲ PHONOLOGY 《语音学》 Tri-annual ISSN: 0952-6757 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 136. ▲ PORTA LINGUARUM Semiannual ISSN: 1697-7467 UNIV GRANADA, UNIV GRANADA, GRANADA, SPAIN , 18071 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 137. ▲ POZNAN STUDIES IN CONTEMPORARY LINGUISTICS 《波兹南当代语言学研究 》 Quarterly ISSN: 1897-7499 VERSITA, SOLIPSKA 14A-1, WARSAW, POLAND, 02-482 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 138. ▲ PRAGMATICS 《语用学》 Quarterly ISSN: 1018-2101 INT PRAGMATICS ASSOC- IPRA, IPRA SECRETARIAT, PO BOX 33, ANTWERP 11, ANTWERP, BELGIUM , B-2018 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 139. ▲ PRAGMATICS COGNITION 《语言实用学和认知》 Tri-annual ISSN: 0929-0907 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 140. ▲ PRAGMATICS AND SOCIETY 《语用学与社会》 Semiannual ISSN: 1878-9714 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 141. ▲ PROBUS 《国际拉丁语和罗曼语语言学杂志》 Semiannual ISSN: 0921-4771 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 142. ▲ RECALL 《计算机辅助语言学习》 Tri-annual ISSN: 0958-3440 CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND , CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 143. ▲ REVIEW OF COGNITIVE LINGUISTICS 《认知语言学评论》 Semiannual ISSN: 1877-9751 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 144. REVISTA DE FILOLOGIA ESPANOLA 《西班牙语言学杂志》 Semiannual ISSN: 0210-9174 CONSEJO SUPERIOR DE INVESTIGACIONES CIENTIFICAS, VITRUVIO 8, MADRID, SPAIN, 28006 1. Arts Humanities Citation Index 145. ▲ REVISTA ESPANOLA DE LINGUISTICA APLICADA 《 西班牙 应用语言学 杂志 》 Annual ISSN: 0213-2028 ASOC ESPANOLA LINGUISTICA APLICADA, UNIV RIOJA, DEPT FILOLOGIAS MODERNAS, C-SAN JOSE DE CALASANZ, S-N, LOGRONO, SPAIN, 26004 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 146. ▲ REVISTA SIGNOS Tri-annual ISSN: 0718-0934 EDICIONES UNIV VALPARAISO, CASILLA 1415, VALPARAISO, CHILE, 00000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 147. REVUE BELGE DE PHILOLOGIE ET D HISTOIRE 《比利时哲学与历史杂志》 Quarterly ISSN: 0035-0818 REVUE BELGE PHILOLOGIE HISTOIRE, C/O BIBLIOTHEQUE ROYALE DE BELGIQUE, BOULEVARD DE L EMPEREUR 4, BRUSSELS, BELGIUM, B-1000 1. Arts Humanities Citation Index 148. REVUE DE LINGUISTIQUE ROMANE 《罗曼语语言学杂志》 Semiannual ISSN: 0035-1458 SOC LINGUISTIQUE ROMANE, UNIV SCI HUMAINES 25 RUE DU MARECHAL-JUIN, STRASBOURG CEDEX, FRANCE, F-67084 1. Arts Humanities Citation Index 149. REVUE DES LANGUES ROMANES 《罗曼语语言杂志》 Semiannual ISSN: 0223-3711 REVUE DES LANGUES ROMANES, UNIV PAUL VALERY, BP 5043,, MONTPELLIER-CEDEX, FRANCE, 34052 1. Arts Humanities Citation Index 150. ▲ REVUE FRANCAISE DE LINGUISTIQUE APPLIQUEE 《法国应用语言学杂志》 Semiannual ISSN: 1386-1204 PUBLICATIONS LINGUISTIQUES, 15 RUE LAKANAL, PARIS, FRANCE, 75015 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 151. REVUE ROMANE 《罗曼语评论》 Semiannual ISSN: 0035-3906 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Arts Humanities Citation Index 152. ▲ REVUE ROUMAINE DE LINGUISTIQUE-ROMANIAN REVIEW OF LINGUISTICS 《罗马尼亚语言学杂志》 Quarterly ISSN: 0035-3957 EDITURA ACAD ROMANE, CALEA 13 SEPTEMBRIE NR 13, SECTOR 5, BUCURESTI, ROMANIA , 050711 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 153. RHETORIC REVIEW 《修辞评论》 Quarterly ISSN: 0735-0198 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Arts Humanities Citation Index 154. ▲ RILCE-REVISTA DE FILOLOGIA HISPANICA 《语言学 杂志 》 Semiannual ISSN: 0213-2370 SERVICIO PUBL UNIV NAVARRA, PIO XII, 53, PAMPLONA, SPAIN , NAVARRA, 31007 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 155. ▲ RLA-REVISTA DE LINGUISTICA TEORICA Y APLICADA 《 语言学 理论 及应用杂志 》 Semiannual ISSN: 0718-4883 UNIV CONCEPCION, FAC HUMANIDADES ARTE, CASILLA 160-C, CORREO 3, CONCEPCION, CHILE, 00000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 156. ROMANCE PHILOLOGY 《罗曼语语言学》 Semiannual ISSN: 0035-8002 BREPOLS PUBLISHERS, BEGIJNHOF 67, TURNHOUT, BELGIUM , B-2300 1. Arts Humanities Citation Index 157. RUSSIAN LINGUISTICS 《俄罗斯语言学》 Tri-annual ISSN: 0304-3487 SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Arts Humanities Citation Index 158. ▲ SLAVISTICNA REVIJA 《语言学报》 Semiannual ISSN: 0350-6894 SLAVISTICNA DRUSTVO SLOVENIJE, SLAVISTICNA REVIJA, ASKERCEVA 2-II, LJUBLJANA, SLOVENIA , 1000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 159. ▲ SLOVO A SLOVESNOST 《词与语文学》 Quarterly ISSN: 0037-7031 CZECH LANG INST CZECH ACAD SCI, USTAV PRO JAZYK CESKY AV CR, V V I, LETENSKA 4, PRAHA 1, CZECH REPUBLIC , 118 51 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 160. ▲ SOUTHERN AFRICAN LINGUISTICS AND APPLIED LANGUAGE STUDIES 《南非语言学与应用语言研究》 Quarterly ISSN: 1607-3614 NATL INQUIRY SERVICES CENTRE PTY LTD, 19 WORCESTER STREET, PO BOX 377, GRAHAMSTOWN, SOUTH AFRICA, 6140 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 161. ▲ SPANISH IN CONTEXT 《西班牙语的来龙去脉》 Semiannual ISSN: 1571-0718 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 162. SPRACHWISSENSCHAFT 《语言学》 Quarterly ISSN: 0344-8169 UNIVERSITATSVERLAG C WINTER HEIDELBERG GMBH, POSTFACH 10 61 40, HEIDELBERG, GERMANY, D-69051 1. Arts Humanities Citation Index 163. STUDI E PROBLEMI DI CRITICA TESTUALE 《原文评论的研究与问题》 Semiannual ISSN: 0049-2361 CASA RISPARMIO, VIA CASTIGLIONE 8, BOLOGNA, ITALY, 40124 1. Arts Humanities Citation Index 164. STUDIA LINGUISTICA 《语言学研究》 Tri-annual ISSN: 0039-3193 WILEY-BLACKWELL, 111 RIVER ST, HOBOKEN, USA , NJ, 07030-5774 1. Arts Humanities Citation Index 165. STUDIA NEOPHILOLOGICA 《新语文学研究》 Semiannual ISSN: 0039-3274 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Arts Humanities Citation Index 166. ▲ STUDIES IN LANGUAGE 《语言研究》 Quarterly ISSN: 0378-4177 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 167. STUDIES IN PHILOLOGY 《语文学研究》 Quarterly ISSN: 0039-3738 UNIV NORTH CAROLINA PRESS, BOX 2288, JOURNALS DEPT, CHAPEL HILL, USA , NC, 27515-2288 1. Arts Humanities Citation Index 168. ▲ SYNTAX AND SEMANTICS 《语法与语义》 Annual ISSN: 0092-4563 EMERALD GROUP PUBLISHING LTD, HOWARD HOUSE, WAGON LANE, BINGLEY, ENGLAND, W YORKSHIRE, BD16 1WA 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 169. ▲ SYNTAX-A JOURNAL OF THEORETICAL EXPERIMENTAL AND INTERDISCIPLINARY RESEARCH 《造句法》 Quarterly ISSN: 1368-0005 WILEY-BLACKWELL, 111 RIVER ST, HOBOKEN, USA , NJ, 07030-5774 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 170. ▲ TARGET-INTERNATIONAL JOURNAL OF TRANSLATION STUDIES 《目标;国际翻译研究杂志》 Semiannual ISSN: 0924-1884 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 171. ▲ TERMINOLOGY 《术语学》 Semiannual ISSN: 0929-9971 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 172. ▲ TEXT TALK 《文字和语言》 Bimonthly ISSN: 1860-7330 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 173. ▲ THEORETICAL LINGUISTICS 《理论语言学》 Quarterly ISSN: 0301-4428 WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 174. TRANSACTIONS OF THE PHILOLOGICAL SOCIETY 《语义学学会汇刊》 Tri-annual ISSN: 0079-1636 WILEY-BLACKWELL, 111 RIVER ST, HOBOKEN, USA , NJ, 07030-5774 1. Arts Humanities Citation Index 175. ▲ TRANSLATION AND INTERPRETING STUDIES 《翻译与口译研究》 Semiannual ISSN: 1932-2798 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS , 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 176. ▲ TRANSLATION STUDIES 《翻译研究》 Tri-annual ISSN: 1478-1700 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 177. ▲ TRANSLATOR 《翻译者》 Semiannual ISSN: 1355-6509 ST JEROME PUBLISHING, 2 MAPLE ROAD, WEST, BROOKLANDS, MANCHESTER, ENGLAND , M23 9HH 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 178. VERBUM Semiannual ISSN: 1585-079X PAZMANY PETER CATHOLIC UNIV, FACULTY HUMANITES, PPKE BTK INST ROMANISTICS, PILISCSABA, HUNGARY , EGYETEM U 1, 2087 1. Arts Humanities Citation Index 179. ▲ VIAL-VIGO INTERNATIONAL JOURNAL OF APPLIED LINGUISTICS 《维戈国际应用语言学杂志 》 Annual ISSN: 1697-0381 UNIV VIGO, CAMPUS DE MARCOSENDE, SERVICIO PUBLICACIONES, VIGO, SPAIN , 36310 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 180. ▲ WORLD ENGLISHES 《世界英语》 Quarterly ISSN: 0883-2919 WILEY-BLACKWELL, 111 RIVER ST, HOBOKEN, USA , NJ, 07030-5774 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 181. YIDDISH-MODERN JEWISH STUDIES 《依地语》 Quarterly ISSN: 0364-4308 YIDDISH, QUEENS COLLEGE, N S F 350, 65 30 KISSENA BLVD, FLUSHING, USA , NY, 11367 1. Arts Humanities Citation Index 182. ZEITSCHRIFT FUR ASSYRIOLOGIE UND VORDERASIATISCHE ARCHAOLOGIE 《亚述学和西亚地区考古学杂志》 Semiannual ISSN: 0084-5299 WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Arts Humanities Citation Index 183. ZEITSCHRIFT FUR DEUTSCHE PHILOLOGIE 《德国语言学杂志》 Quarterly ISSN: 0044-2496 ERICH SCHMIDT VERLAG, GENTHINER STRASSE 30G, BERLIN-TIERGARTEN, GERMANY, D-10785 1. Arts Humanities Citation Index 184. ▲ ZEITSCHRIFT FUR DIALEKTOLOGIE UND LINGUISTIK 《方言学与语言学杂志》 Tri-annual ISSN: 0044-1449 FRANZ STEINER VERLAG GMBH, BIRKENWALDSTRABE 44, STUTTGART, GERMANY, D-70191 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 185. ZEITSCHRIFT FUR GERMANISTISCHE LINGUISTIK 《德语语言学杂志》 《德语语言学杂志》《德语语言学杂志》 Tri-annual ISSN: 0301-3294 WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Arts Humanities Citation Index 186. ZEITSCHRIFT FUR KATALANISTIK 《罗马尼亚语杂志》 Annual ISSN: 0932-2221 ALBERT LUDWIGS UNIV, ROMANISCHES SEMINAR, PLATZ DER UNIVERSITAT 3, FREIBURG IM BREISGAU, GERMANY, D-79085 1. Arts Humanities Citation Index 187. ZEITSCHRIFT FUR ROMANISCHE PHILOLOGIE 《罗马语系语言学杂志》 Quarterly ISSN: 0049-8661 MAX NIEMEYER VERLAG, PFRONDORFER STR 6, TUBINGEN, GERMANY, D-72074 1. Arts Humanities Citation Index 188. ZEITSCHRIFT FUR SLAWISTIK 《斯拉夫语杂志》 Quarterly ISSN: 0044-3506 AKAD VERLAG GMBH, PALISADENSTR 40, BERLIN, GERMANY, D-10243 1. Arts Humanities Citation Index 189. ZEITSCHRIFT FUR SPRACHWISSENSCHAFT 《语言学杂志》 Semiannual ISSN: 0721-9067 MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index
个人分类: A&HCI投稿|7690 次阅读|0 个评论
[转载]第七届全国社会语言学学术研讨会暨首届跨境语言研究论坛
xscb 2013-7-12 16:57
第七届全国社会语言学学术研讨会暨首届跨境语言研究论坛 征 稿 通 知 为进一步加强跨境语言、少数民族语言和社会生活的多维度研究,推动社会语言学学科建设与发展,由教育部语言文字应用研究所主办,中国社会语言学会、中国民族研究团体联合会、中国民族语言学会和百色学院合办,百色学院承办的“第七届全国社会语言学学术研讨会暨首届跨境语言研究论坛”拟于2013年11月中旬在广西百色举行,欢迎报名参加。报名参会的有关重要事项如下: 一 会议时间:2013年11月中旬(暂定) 二 会议地点:百色学院 三 会议主题:跨境语言与社会生活 主要议题: 跨境语言与语言教育研究 跨境语言与语言传播研究 跨境语言与语言认同研究 跨境语言文字与书面语交际研究 语言传播与文化安全研究 语言接触与语言关系研究 语言变异研究 社会语言学其他相关理论与实证研究 四 来稿要求: 拟参会者的论文摘要或全文均需电子版。 1.字数:拟参会者请提交论文摘要(中文500字左右),摘要限一页纸。 2.版面要求(包括摘要或全文): A4纸;页边距上下为2.54厘米,左右为3.17厘米;单倍行距;标题用宋体、四号、黑体,正文用宋体、小四号。 3.论文摘要(或全文)后附以下个人资料:(1)论文题目;(2)作者姓名;(3)所在单位;(4)通讯地址;(5)联系电话;(6)电子邮箱。 五 提交方式: 论文摘要(或全文)发送至: shhyyx201310@sina.com 朴美玉、于琴(收) 六 截稿日期:2013年6月10日(以电邮日期为准)。 来稿经本次会议学术委员会匿名审查通过后即可获邀参会。会议邀请函将于2013年8月30日前寄出。 七 参会费用:受邀者免收会务费,差旅费及住宿费自理。 八 联系人:朴美玉(13331091039),于琴(15652594302 ) “第七届全国社会语言学学术研讨会暨首届跨境语言研究论坛”组委会 2013年4月 22日
1424 次阅读|0 个评论
亚马逊部落语言撼动乔姆斯基?
热度 8 aejj 2013-7-10 11:08
这几周一直在参加美国语言学会的双年会。上周的电影时间放的是关于著名的乔姆斯基的“生成语法”的挑战者,语言学家埃弗雷特( Everett )在亚马逊森林里的纪录片 The Grammar of Happiness 。埃弗雷特本人亲自到场。他本人在亚马逊的一个叫比达哈( Piraha )的部落断断续续生活和研究了三十年。是当时世界上仅有的三个可以和比达哈人交流的外族人。他发现比达哈人的语言中没有数字,他们只有“多”和“少”;没有颜色词汇;最惊人的是他们的语言没有“递归性”:他们的句子里没有“爸爸说妈妈说你叔叔说他要带你去公园”这样可以套从句的句子。要知道语言学的教父乔姆斯基在 2002 年刚发表了一篇论文说“递归性”是人类语言最重要的共同特性。之前我看过的文章把埃弗雷特的发现形容成掀起了一场语言学界的“大战”,当时还想也许是编辑标题党是为了吸引人眼球。看着片子才知道用“战争”形容他的发现引起的轩然大波一点都不为过(果壳有一些翻译过来的写的很生动的文章: 愤怒的语言 和 乔姆斯基攻防战 )。埃弗雷特跟乔姆斯基开创的主流语言学的冲突甚至导致有人禁止他返回亚马逊的部落,他哪怕在巴西的大学演讲听众也聊聊无几,因为当地大学语言学系大部分是拿乔姆斯基的生成语法立足做学问的。乔姆斯基本人在纪录片中也短暂出场,他素来就以犀利的言辞著称,尤其对同行更是毫不留情面,他直接说埃弗雷特的发现根本站不住脚,我们无视它就可以了。 影片最后很煽情,不能返回比达哈部落的埃弗雷特托人给比达哈人捎去一段录像。比达哈人在看完录像以后说我们想他啊,什么时候让他回来吧。导演给影片的题目叫作 the grammar of happiness , 他说因为他没有见过那么快乐的人类。 本来埃弗雷特就是个人物,在这样的影片播完以后下面更是就快要炸开锅了——要知道下面坐的都是这一代和下一代语言学家们啊。提问一个接一个,一个芝大学生早有准备,拿了一大叠厚厚的材料说埃弗雷特没有巴西永久居住证许可的大叠证明(如果是这样他在巴西部落做的研究就是非法的),埃弗雷特澄清说这些材料早就被证明是错误的了。有的学生略带着愤怒说片子中的乔姆斯基的片段是经过导演精心剪辑的——影片的拍摄方式确实给人以“乔姆斯基是压抑不同意见的当代老学霸“的感觉,埃弗雷特说全部采访的录像就在他家,影片中的采访基本是未剪辑版本。他还说自己在乔姆斯基的太太去世不久前去安慰他,乔姆斯基也很感谢。结果过两天报纸上就出现了“乔姆斯基说埃弗雷特是比小布什还要糟糕大骗子”的文章,他打电话给乔姆斯基说这咋回事啊,乔姆斯基说哦好像是我说的。 也有很多人对埃弗雷特的遭遇和研究表示同情,一位坚定的生成语法学家说确实埃弗雷特的工作至少是严肃的和值得尊重的。 当然更多的问题集中在他的发现上。他也澄清了很多一些以讹传讹的关于他的观点的谣言:比如(如果我记得准确的话)他并非绝对宣称百分之百是文化而不是遗传决定了语言,他只是否定乔姆斯基的特定的生成语法的观点。而且比达哈人的语言中没有数字、颜色和复杂句子并不是他们不会数数,看不到颜色或者比其他人笨。比达哈人的语言特性也不是个案,在其他语言中也有发现,当然也是个别。 我的印象是埃弗雷特其实是个很谦逊和平和的人。况且想想他在原始部落中呆那么久,甚至几次比达哈人要威胁到他的生命的时候他也没有放弃,以至于和极度排外的比达哈人相处的像一个家庭的人一样。这些似乎都不是一个半吊子或者江湖科学家做出来的事情(他早年的工作是得到乔姆斯基的认可的)。乔姆斯基虽然早以嘴不饶人和能言善辩著称,但他的批评其实多半都是严肃地针对他认为学理上愚蠢的观点。 埃弗雷特上个周末又做了一个workshop后离开,而乔姆斯基后脚就到,他将在两天之后给我们做演讲。我和朋友都在说会不会有人又有勇气当面与乔姆斯基提比达哈人和埃弗雷特。乔姆斯基的生成语法统治语言学界五十多年,而对“后天文化对语言的影响”,和“不同语言会影响和造成不同的思维“的假说(即“语言相对论”,又叫“萨丕尔 - 伍尔夫假说”)的研究在近几十年又开始逐渐复苏。孰是孰非只有将来才知道了。不管结果是什么,我想答案肯定会和以前所有的重大的科学发现一样超出今天所有人的预料和想象。
个人分类: 学问|9704 次阅读|15 个评论
近日灵感:贯通、定位并解决“三大瓶颈”之困难!
geneculture 2013-7-5 11:29
近日灵感:贯通、定位并解决“三大瓶颈”之困难! (2013-07-05 04:48:47) 邹星智融对人类(不仅仅对中国)做出如此巨大的特殊贡献,因为晓辉我不仅找到了间接形式化中文编程(因计算机本质上只认算术)方略以对付之前中文编程“软件无根基”的困难之解决途径,而且,还找到了三类双语协同信息处理之道以解决广义的机器翻译之当今国际头号科技难题化解方略——因为汉语即中文在国际交流中处于“语言非主流”的地位之困难克服而获得这个千载难逢的机会,又明确地指出了中国教育“钱学森之问”难题的症结在于中国的大学本应是高深知识探讨重镇却因“知识缺原创”而几十年培养不了杰出人才!对此邹晓辉又找到了克服它的教管学用实践之人际和人机恰当分工与高度合作的融智方略(这就是晓辉为何最近在北京、香港及珠海、上海都明确地指出母语是汉语即中文者遭遇的“三大瓶颈”之困难:1,“语言非主流”; 2,“知识缺原创”; 3,“软件无根基”)!。 提示:既能这样明确提出问题,当然也就对之做了深入分析并已找到较好解决该问题的方略了!。 注释:近日灵感是就其表述文字之专业和通俗兼顾的优化而言的。
个人分类: 双语信息处理|1075 次阅读|0 个评论
[转载]现代语言学的主要发展历程和未来发展前景
geneculture 2013-6-28 20:58
现代语言学的主要发展历程和未来发展前景 (2013-06-28 20:23:28) http://blog.sina.com.cn/s/blog_65197d9301019hox.html 现代语言学的主要发展历程 1. 历史比较语言学 在 现代语言学 发展的初期,历史比较语言学 通过在世界各地 搜集和整理 语言标本 ,通过丰富的 第一手资料 的比较、分类、归纳、总结, 发现了 语言的不断演变发展的客观历史 。语言学家 在把各个时期的语言、语法、词汇 对应关系加以对比研究后,证实了 印欧诸语言 的有机联系 ,并且开始研究本族语及其亲属语言的联系和它们的发展规律,从而打破了形而上学的固定不变的框架,建立了 现代语言学的第一个里程碑 。但是历史比较语言学也有它的 局限性 :它 过分偏重于语言的 纵向 历史研究,面忽视了 横向 的系统研究 。 到了 20 世纪初,现代语言学进入了 第二个时期 ,产生了结构主义语言学 。 2. 结构主义语言学 结构主义语言学认为 每种语言都有一套独特的关系结构 ,语言中的个别单位都是在跟其他单位的区别和对立中存在的,而不是孤立存在的 。 结构主义学派的创始人、瑞士语言学家 索绪尔的《普通语言学教程》是一部 划时代 的著作 ,他在书中提出的新的概念、原则和理论为现代语言学研究打下了科学的基础。 索绪尔认为 语言行为 有 两部分不同的性质 ,一部分具有 社会性 ,是主要的具有 共性 的本质,称为“语言” (langue) ,另一部分具有 个别性 ,是次要的,因人而异,称为“言语” (parole) 。 这两个部分是互相联系的,但是它们有本质上的差别,应该分别对待 。语言和言语是互相依存的。语言既是言语的工具,又是言语的产物。 按照索绪尔的学说, 语言的特点在于声音和意义之间的关系 ,这些关系有一定的结构规划,从而组成了语言的符号系统 。符号由“能指”和“所指”两部分构成 。索绪尔还指出了语言的横线 组合 关系和竖线 聚合 关系的特点。 布龙菲尔德的《语言论》是美国结构主义 语言学的奠基性著作。他 提出了语言的科学描写的标准,制定了描写语言结构的总框架 。他认为 语言 是音义结合的词汇和语法两部分构成的整体 ,描写语言结构应该从音位学开始 。结构主义采用了系统论的原则,即整体性原则、结构性原则、层次性原则、动态性原则。这些原则非常适用于语言这个系统。结构主义语言学对认识语言的 系统性 做出了突出的贡献。 到了 20 世纪中叶,语言学由于受到 数理逻辑 的影响,进入了 第三个时期 -- 语音、语法、语义、语用的综合研究时期, 这一时期的特点 是: 把语言看作复杂的 信息系统 , 不仅用实验技术和归纳方法,而且采用建立数学符号模型和形式演绎的方法 。实验语言学将语言结构划分出词句层次、音节层次和音素层次等等。 3. 转换生成语言学 美国语言学家 乔姆斯基 不满足于观察 言语行为 的表面现象,而要探索内在的 语言能力 。 他 提出了一个 全新的语言观 :语言这个概念是从语法派生出来的 。他在 1957 年出版了著名的《语法结构》一书,提出了“转换生成语法”。乔姆斯基 把语言学看成跟自然科学一样,可以从假设出发,进行推演并形式化 。他提出 把句法关系作为语言结构的中心,并且以此说明语言的生成性 。乔姆斯基 区分了语言的深层结构和表层结构,指出 语言学家的任务是揭示深层结构到表层结构的转换 。他认为 研究语言的 目的 不应当只是分类的描写,而应当建立起一整套的 形式化 的演绎系统, 这种 形式系统 包含 有限的语法规则,却能生成无限的符合语法的句子 ,并且能对句子的结构做出描写 。乔姆斯基还假设人们有一种 语言习得 机制,它可以用严谨的 数学模型 来加以 类比和推导 。他认为 语言能力 是人类天赋的, 语言行为 是语言能力的具体表现 。 乔姆斯基的 全新的语言观 被认为是 一场语言学的革命 。它所产生的 巨大影响波及到世界各国的语言学界 ,而且,还在 数学、社会学、哲学、心理学和计算机科学等广大领域里产生了相当大的影响 。 4. 系统功能语言学 以英国的语言学家 韩礼德 为代表的功能学派认为 语言是一种社会现象 ,强调 交际和交流是语言的基本功能 ,因此,研究语言不仅要重视它的形式结构意义,而且要重视词句与社会文化的情景意义。韩礼德认为 系统是第一性的 ,并且对 语义功能 进行了系统分类。他从语言运用的角度提出了 语言有三种功能:概念功能、人际功能和语篇功能 。韩礼德认为, 结构研究 是语言的表层形式,而 系统研究 是语言的深层形式,是语言的意义潜势 (meaning potential) , 这二者是互相联系的 , 缺少其中任何一项都不能对语言进行全面的描写 。系统功能语法学派认为 语言首先是一种“行为”,是一种“做” (doing) 的形式,而不是一种“知” (knowing) 的形式 。也就是说,仅仅具有语言知识是不够的,重要的是要能够实际运用语言。 语言行为是人与人之间、人与环境之间进行交往、相互作用的社会现象 。运用系统理论研究语言,就是 把语言看作一种社会符号系统,并且用这一符号系统来认识社会,认识社会与人以及人与人之间的关系,最终建立动态化的语言社会模式 。系统理论把研究 重点 放在语篇上,认为语言必须通过 特定的语言组合 ( 即存在于某一特定 语境 中的 语篇 ) ,才能充分实现其 意义 。韩礼德的语言理论 不但探讨了语言的形式,还研究了语言的意义和功能,并且分析了语言与社会的关系。 系统功能语法 把 语言的实际使用 作为 研究对象 ,并且在应用过程中不断地检验和完善理论,具有较强的科学性和实践性。 现代语言学的发展前景 20 世纪电子 计算机 问世以来,与 语言学 相结合,使语言学发生了巨大的变化。计算机的使用是今天语言学研究迅速发展的重要因素。 同时,计算机也离不开语言学,因为计算机 软件的核心是算法语言 , 计算机科学的主要理论基础是 形式语言学 。 可以说,没有现代语言学,计算机就无法得到充分的发展和广泛的应用。 语言学与计算机是紧密联系,互相促进的。 语言学是一门复杂的科学 。对于 其中的许多问题,各种学派的观点很不相同,看法 还很不一致。可以说, 语言的奥秘 至今 还没有完全被人类真正认识 ,许多问题还需要作进一步的探索。 现代语言学的发展说明,我们应该多角度、多层次、全方位地研究语言,对语言体系、言语活动、言语机制等各方面进行深入广泛的研究,才能全面深刻地认识语言的奥秘,更好地运用语言和充分发挥语言的作用。随着语言科学的发展, 语言学应用的方面越来越广 。由于不同学科之间的互相渗透, 产生了 应用语言学、社会语言学、心理语言学、神经语言学、数理语言学、计算语言学 ( 工程语言学 ) 、统计语言学、模糊语言学、语料库语言学、话语语言学 ( 篇章语言学 ) 、教育语言学、对比语言学、人类语言学、类型语言学、民俗语言学、文化语言学、艺术语言学、传播语言学、公关语言学、写作语言学、生理语言学、生物语言学、辅助语言学、宇宙语言学等等语言学的众多分支学科 ,而且今后必然还会出现更多的与语言学相关的交叉学科。此外, 速记、机器翻译、信息处理、情报检索、语言规划等许多与语言有关的问题也值得我们进一步地认真研究 。 语言是人类特有的宝贵财产。没有语言,就没有人类的文明。语言学是一门领先的科学,它的发展对人文科学、社会科学和自然科学的发展都有重大意义。 人类 对语言的认识经历了漫长道路 ,如今 还在继续向前探索 。从古到今,语言学家们的 视野 逐步扩大, 探索 逐步深入。语言学家的研究从古代语言转向现代语言,从书面语转向口语,从个别的语言项目转向整个的语言系统,从一种语言的某些特征转向多种语言共同特征,从语言的结构转向语言的功能,从语言的表面形成转向语言的深层意义,从语法、词汇转向语义、语用, 从把语言作为一个孤立的 研究对象 转向研究语言与社会文化等等的千丝万缕的联系,研究的范围越来越广,头绪越来越多 。近几十年来语言学的迅速发展,已经引起了学术界的关注。 语言学和各种科学思潮的关系,是近代自然科学和社会科学交叉渗透的重要部分,语言学的思想和方法对哲学和其他学科都产生过极大的影响,推动着语言科学不断向前发展。人类在探索神奇的语言奥秘的过程中,视野必然会越来越开阔,认识也将会越来越深化。语言学的研究有着非常美好的发展前景。 语言标本与纵向研究 印欧语言 语言行为 语言符号 词汇 + 语法 = 语言 语言 = 信息系统 语言行为和语言能力 语言由语法派生!。 由深层向表层的转换! 形式化(演绎系统) 语言学的革命 from: 语言学是如何发展的
个人分类: 语言学基础研究|1271 次阅读|0 个评论
[转载]哲学大师德里达:解构主义点滴
carldy 2013-6-27 12:52
德里达是法国人。正是他创建了解构主义学派,向人们在文学和艺术领域中已经习以为常的思维模式发起挑战。 德里达出生在阿尔及利亚的一个犹太人家庭。他突破性的著作写于20世纪60年代。此后,他在学术界,特别是在美国的学术界,产生了巨大影响。他在美国度过了很长时间。   德里达是20世纪少数几位人们熟悉的哲学家之一,但这并不意味着普通人就能理解他的思想。他的解构主义是一种非常复杂的学术思想。解构主义的核心概念就是每一个字,延伸到每一句话,都具有多层内涵意义,而且这些内涵意义随着文化和历史的变迁而发生着改变。举例来说,一位作家或许不知道解构主义,但是当他铺开纸写作的时候,他写的文字就具有很多表面意义以外的其它含义,而专家可以通过“解构”的手段来发现这些其它含义。 当然对有些人来说,德里达的思想根本无法理解。在1992年,剑桥大学的一些研究员认为德里达的著作非常荒谬,差一点剥夺了他在剑桥大学的荣誉学位。尽管如此,德里达对当代思想界的杰出贡献是无可置疑的。 2004年10月11日扬子晚报 当代“最伟大的哲学家”德里达   法国哲学家雅克·德里达   8日深夜,法国著名哲学家雅克·德里达教授因胰腺癌在巴黎一家医院去世,享年74岁。   法国总统府于当地时间9日向外界公布了上述消息。法国总统希拉克对德里达的去世表示了深切的哀悼,他在一份声明中说:“因为他(德里达),法国向世界传递了一种当代最伟大的哲学思想,他是当之无愧的‘世界公民’。”   作为解构主义的创始人,德里达堪称当代最伟大的哲学家之一,而他的辞世也被认为是法国思想界继1980年让-保罗·萨特逝世后最大的损失。   小学时被开除   雅克·德里达1930年7月15日出生于阿尔及利亚的一个犹太家庭。德里达的父亲是个商人,德里达一家原本居住在首都阿尔及尔,后来举家搬到了避暑胜地埃尔比哈并在那里定居下来。   虽然雅克·德里达教授现在蜚声世界,但他童年时的求学经历并不顺利。阿尔及利亚当时是法国的殖民地,家境殷实的德里达被送到当地一所著名的法语学校学习。1942年,法国维希政府实行严厉的种族政策,极力迫害犹太人,德里达也因此被赶出了学校。不过,求知若渴的德里达并没有放弃学习,小小年纪的他兴趣广泛,竟在短短几年间遍读了卢梭、尼采、加缪和诗人保罗·瓦德利的诸多作品。   二战结束后,他于1949年前往法国求学,目标是进入“法国思想家的摇篮”———法国高等师范学院。但是他连续两年尝试都没有成功,直到1952年,他第3次报考才终于被校方接受。而在第一个学期期末考试时,他的口语考试也未能及格。   50岁才成博士   1956年,德里达从法国高等师范学院顺利毕业,并拿到了学士学位。毕业后,他曾到美国哈佛大学短期进修。因思想一开始并不为传统思想所接受,他的博士论文也一直没能通过,直到1980年,在他50岁的时候,才拿到了自己的博士学位。   不过,早在拿到博士学位前,德里达就已成为闻名全球的哲学大师。从20世纪60年代提出“解构主义”以来,他的哲学理论波及人类文化的方方面面,对哲学、文学、语言学、法学、建筑学等产生了深远的影响,推动了后现代主义的产生与发展,而“解构”也成为一个最时髦的词眼。   西方哲学的“叛逆者”   雅克·德里达是解构主义哲学的创始人,被称为“解构主义之父”。他的思想在上世纪60年代后掀起了巨大波澜,成为最有争议的哲学家之一。他的理论动摇了整个传统人文科学的基础,也是整个后现代思潮最重要的理论源泉之一。   德里达的主要代表作有《文字语言学》(1967)、《声音与现象》(1967)、《写作与差异》(1967)、《散播》(1972)、《哲学的边缘》、《立场》(1972)、《人的目的》(1980)等。《文学行动》是他上世纪90年代的新作,汇聚了他各个时期以来的文学思考,这既是一部哲学著作,也是一部异想天开的批评写作。   耶鲁大学的哲学家希利斯·米勒形容说:“解构一词使人觉得这种批评是把某种整体的东西分解为互不相干的碎片或零件的活动,使人联想到孩子拆卸他父亲的手表,将它还原为一堆无法重新组合的零件。一个解构主义者不是寄生虫,而是叛逆者,他是破坏西方形而上学机制,使之不能再修复的孩子。”   2001年,德里达曾来到中国,举行了一系列巡回演讲介绍他的理论。   一生的遗憾:没成为足球运动员   德里达被称为“解构主义之父”。从根本上来说,解构主义是反传统的,对自柏拉图、亚里士多德以来的西方传统的形而上学发起挑战。这让他在欧美学生和青年学者当中颇受欢迎。   《洛杉矶时报》一篇文章曾写道:“他为年轻人带来了一份特殊的礼物,那就是让他们意识到,他们不仅仅是所谓的二流哲学家,不仅仅是翻译外国大家的作品,他们有权去做探险者,去探索、去批判那些西方哲学思想中所谓的博大精深的,而又似是而非的隽语。”    毕竟是作为反传统的“先锋”,德里达教授在拥有越来越多的“拥趸”的同时,也从来不缺少批判和反对的声音。他的学生称他是“天才”,把他像流行歌星一样崇拜,但批评者则认为他不过是创造了一种蒙昧的含糊不清的相对主义的表达方式,在他的理论中,任何事物似乎都可意味任何事物。   矛盾在1992年激化到了顶点。当英国剑桥大学决定授予德里达教授荣誉博士学位时,全世界竟然有20位哲学教授,其中包括著名的哈佛大学逻辑学家W·V·奎因教授联名致信给剑桥大学,提出抗议。   除了是一位杰出的哲学家,德里达教授也是一位语言天才,虽然他的文字被常人看来都是那样艰深晦涩。上个星期,德里达教授还被认为最有可能获得本年度的诺贝尔文学奖,虽然最后这个奖项被授予了奥地利女小说家埃尔弗里德·耶利内克。   德里达教授兴趣广泛,他生前与夫人玛格丽特和两个孩子居住在巴黎南郊的里斯·奥兰吉斯区。与其他法国文学家、思想家都喜欢住在左岸不同,德里达教授更中意里斯·奥兰吉斯的安静。据他夫人介绍,德里达教授特别喜欢看电视,无论是新闻节目,还是肥皂剧,他都爱看。   而他有生之年也有一个深深的遗憾,那就是没能成为足球运动员。   在一次接受采访时,这位世界上最伟大的哲学家表示:“我年轻的时候曾梦想成为一名职业足球运动员,为阿尔及利亚国家队效力。但我最后不得不放弃了这个梦想,因为我踢得不够好。”    名词解释:解构主义   解构主义是对“结构主义”或传统哲学的反叛。简单地说,“解构”就是“反结构”。   德里达认为,自柏拉图以来的“形而上学”形成了一个潜在的定势:万物背后都有一个根本原则,一个支配性的力,这种终极的、真理的、第一性的东西构成了一系列的逻各斯,且逻各斯永恒不变,近似于“神的法律”,背离逻各斯就意味着走向谬误。这束缚了思想,也进一步束缚了人类文化和生活的方方面面。 解构主义就是打破这种霸道的秩序,如社会道德秩序和个人意识习惯以及无意识的民族性格等。 来源: 广州日报    05年01月03日 新华网 解构德里达   如果你把一生大部分时间都花在以下两件事上:一是声称语言无法表达客观真理,二是挑战西方理性主义传统的基础,那么我猜想,到你过世时,你必然会遭到一两句尖刻的评价。事实就是如此,在哲学家雅克•德里达(Jacques Derrida)上周末逝世后,一些人问,他的逝世是否可以有不止一种解释,其他一些人则问,我们能否肯定此事确实发生过,还有人写信给一份英国报纸,想知道这位法国知识分子将被土葬、火化或是被解构。   这里不是为德里达发讣告的地方,即使是,我也没有资格写讣告。但我的确对他有足够的了解,所以想知道,他会不会作为20世纪最有影响力的人物之一而名垂青史,原因倒不是他令人费解的学说的具体内容,而是他在促成“确定性”死亡的过程中所扮演的角色。   正如上周的各条讣告所记载的,德里达是“解构主义”之父。如果你想知道解构为何物,那可就难了,因为德里达自然舍弃了这种“实在论的”定义。但其基本原理似乎是,语言无法传达固定的意义或普遍的真理,因为所选用的词,以及选择这些词的人的观点,会不可避免地歪曲语言想表达的现实。解构就是通过拆散文本、揭示文本内部模棱两可和互相矛盾之处,从而揭露这种歪曲。在上世纪60、70和80年代间,德里达的影响渗透到各大学校园,尤其是美国的大学校园,因为正如周日《纽约时报》(New York Times)所指出的,在美国,女权主义、同性恋权利和发展中国家事业的倡导者信奉他的一些方式,他以这些方式来揭示柏拉图、亚里士多德、莎士比亚、弗洛伊德等已故白人男性的偏见和自相矛盾。   很快,解构概念就超越了语言学范畴,传播至人文和社会科学领域,进入建筑、法律和宗教领域,还进入时尚、广告和大众文化领域。在大众文化领域,解构概念导致1997年伍迪•艾伦(Woody Allen)为其一部电影定名为《解构哈里》(Deconstructing Harry)。   当然,解构的问题在于,它没有为绝对真理留下任何余地;一切都是变化的、相对的,而且有待质疑。18世纪的启蒙运动到此为止了,当时西方思想家和作家认为,通过采用科学、理性和逻辑等普遍价值观,文明可以将自己从无知、恐惧和迷信的暴政中解放出来。德里达则宣称,历史知识是不可能的。他将理性斥为对确定性不诚实的追求,并把对真理的寻求简单称为“西方形而上学的支配性幻想”,以此攻击西方思想的根基。   平心而论,他不是第一个散播怀疑种子的人。在20世纪,两次世界大战令人们对西方社会的进步产生一定的怀疑。但即使在此之前,爱因斯坦就抛弃了牛顿学说的确定性,建立了自己的狭义相对论。狭义相对论认为,时间和空间并不是绝对的,而是相对于观察者和观察对象而言,这个理论不可思议地预示了德里达思想的产生。几乎在同一时间,巴勃罗•毕加索(Pablo Picasso)和乔治•布拉克(Georges Braque)提出了立体主义,这是观察世界的一种革命性方法,它涉及对主题的解构,然后同时从多种角度来描述它。   在爱因斯坦之后,科学基本上离开了常识王国,并上升到如此复杂的水平,以致成为不可知论。在追求抽象的过程中,艺术也变得如此脱离对现实的传统感知方式,以致于到上世纪60年代,安迪•沃霍尔(Andy Warhol)嘲讽地将艺术定义为只要是你能得逞的东西。但德里达比任何人更多地向主流思想注入一种观念:你应该忘掉启蒙运动教给你的一切,即历史和进步是胡说,真理和现实只是观者所见的表象,任何事都不完全是它表面的样子。   由于德里达的这种做法,在把“讥讽”变成我们时代旋律方面,他要负很大责任。当没有什么东西可以信奉时,讥讽或多或少成为我们所能采取的唯一可能的立场。通过挑战人们长期珍视的假设和传统,他也对赋予我们生命以结构的确定因素予以痛击。他使持久不断的修正主义得以兴起,从而导致人们认同的真理被颠覆(莎士比亚是黑人,市场效率低下,每天吃个苹果对人有害);此外,他通过攻击一种观点,从而破坏了“权威”的概念,该观点认为某种人可以有更高的权利声称拥有智慧,懂得什么是正确的或最好的。”   德里达一直被指责为具有虚无主义思想,这并不奇怪,但一贯受风尚驱动的哲学界,现在也开始背弃他。虽然有些奇怪,但我必须承认,我对这个家伙有几分好感。毕竟,相对论的反面是绝对论,绝对论意味着采取思考和行为的单一标准。我想大多数人会同意,我们在20世纪已经受够了那种绝对的做法。   不协调的是,上周末去世的另一位名人是曾扮演超人的男演员克里斯托弗•里夫(Christopher Reeve)。你或许还记得超人的老式口号:“真理、公正和美国方式”。今天,这个口号才开始有点老掉牙,这或许表明德里达的影响正日渐式微。   作者:理查德•汤姆金斯(Richard Tomkins)   译者/伯弢   04年10月15日 英国《金融时报》 企业真相启示——专栏作家约翰·凯: 德里达的解构主义理论有助于人们把商业看成演变的复杂事物   “午餐室里没人听说过他。如果你需要,我可以到Google上查查他的情况。”当《卫报》纪念上个月去世的雅克•德里达(Jacques Derrida)的时候,伦敦金融城所能做的仅此而已。但是,法国总统雅可•希拉克(Jacques Chirac)称他为“我们时代思想生活中最重要的人物之一”。这种说法本身就足以在《华尔街日报》上令人们目瞪口呆。《华尔街日报》称,德里达的思想,“理应受到每一个关心思想生活中道德层面的人毫不吝啬的批判。”   德里达最著名的思想是解构主义。他有一句名言“文本之外别无他物”。当我还是个儿童演员的时候,我曾在戏剧《等待戈多》中扮演那个小信使。萨缪尔•贝克特的这部伟大作品对任何人来说都并不容易理解,要是你只有十岁,那就根本理解不了。我打算给贝克特写信,跟他解释一下我的困难,请他告诉我这部戏到底讲什么。可是那时候Google还没有发明,我也就一直都没能找到这位剧作家的地址。   现在,我知道贝克特当时在巴黎,也许正和德里达在左岸的某个咖啡馆相谈正欢。雅克会跟这位作者说如何回答我的问题:要重读剧本,因为“文本之外别无他物”。剧本不是教科书。阅读一本录像机使用手册的目的,是推断作者的意图,我们通过解读这些意图的难易程度,来判断这本使用手册的好坏。如果你把手册给丢了,通过一定的技巧和努力,你还可以把它的内容再写出来。录像机是一种功能明确而不变的物质设备。   但是,戏剧在动机与功能之间的关系就没这么简单了。如果莎士比亚想过要提醒人们野心的危险性,他完全可以利用PowerPoint的“内容提示向导”功能,制作一个幻灯片演示,而不用花心思创作《理查三世》。而他写的这部戏,有很多层含义,可以有不同的解释。而你从中领悟的都是个人的理解。有人曾经问天才儿童杰迪戴亚•巴克斯顿(Jedediah Buxton),对《理查三世》怎么看,他(准确地)说道,这个剧本有12455个单词。他和别人看的既是同一出戏,又是不同的戏。莎士比亚无疑从王权的角度考虑过《理查三世》。所有这些观点都是可以成立的,但没有一个是完全的,也没有一个(包括莎士比亚本人的观点)是值得特别看待的。   但是,我们却把商业看成录像机般的静态机器,而不是像戏剧那样不断演变的、复杂的事物。在我讲述商业史上某个片断之后,往往会有一位听众跳出来告诉我:“我当时就在那儿,这才是当时的真实情况。”但是,内部人员对真实情况不会有什么特别的洞见,而只有一种肯定存在局限性和偏见的看法。财经记者们往往相信,通过盘问一家公司的首席执行官,就能了解这家公司的真相,这就跟我当年试图向萨缪尔•贝克特求助一样犯了幼稚的错误,而理由甚至更不充分:贝克特至少亲自一字一句地写出《等待戈多》,可没有一个首席执行官能期望对他手下的企业具有这种程度的控制。   欧洲有一句愤世嫉俗的古老谚语:关于人的事情,没有最终的真相。这正可以解释《华尔街日报》的恼怒,该报的社论版每天都在证明这种说法的正确性。但是,不存在一个绝对属实的报道,只有用程度不同的各种解释。照某些字面上的意思,安然公司(Enron)的财务声明可能并没有错,但它的账目意在误导。帕马拉特公司(Parmalat)的账目目前在接受详细审查。如果我们能够了解意大利小镇的人类学和贪婪的心理学,我们就会对这些公司有更深的认识。   一部商业史就像一出复杂的戏剧,有许多线索纠缠在一起,即使其中一根被辨认出来,也还会有许多其他线索有待解开。在下个星期的专栏中,我将通过最著名的个案研究,即本田汽车在美国汽车市场上的成功,来阐明这一点。   哈佛商学院的MBA学员在讨论个案的时候都被告知,他们将要辩论的问题没有标准的正确答案。我怀疑,他们会意识到自己正在解构的过程中。但是,同学们,我倾向于认为德里达对此会表示认同。   作者:约翰•凯(John kay)   译者/彭伦   04年11月9日 英国《金融时报》 以上材料出处: http://www.8570015.sunbo6.net/show_hdr.php?xname=MV645U0dname=ST6C1U0xpos=110
个人分类: 千里旅行,万卷阅历 Travelling and reading help yo|6101 次阅读|0 个评论
[转载]2013年国家社科基金年度项目立项名单(语言学)
carldy 2013-6-18 23:28
2013年国家社科基金年度项目和青年项目立项结果公布 http://www.npopss-cn.gov.cn/n/2013/0617/c219469-21868735.html 2013年国家社科基金年度项目立项名单(语言学 一般项目): 序号 项目名称 负责人 工作单位 计划完成时间 预期成果 1770 汉语句法语义互动中的功能成分研究 彭家法 安徽大学 2016-6-30 专著 研究报告 1771 名词指称义的情境植入理论研究 牛保义 河南大学 2016-12-31 专著 专题论文集 1772 子句论元的语段性质及指称实现研究 满在江 江苏师范大学 2016-6-30 专著 1773 平行建构理论框架下话题结构的跨语言比较研究 高秀雪 青岛农业大学 2015-12-31 专著 1774 中国当代语言学口述历史研究 张宜 沈阳师范大学 2016-12-31 专著 研究报告 1775 现代汉语宏事件语义类型学实证研究 李福印 北京航空航天大学 2016-7-30 专著 专题论文集 1776 汉语句子信息结构的类型学研究 周士宏 北京师范大学 2016-6-30 专著 1777 边界移动与语言创新 刘辰诞 河南大学 2016-6-30 专著 1778 认知语义学视角下的动词语义表征与动态论元结构研究 张韧 南京大学 2016-12-31 专著 1779 跨语言的韵律研究及外语口音探析 丁红卫 同济大学 2016-9-30 专著 1780 类型学视野下英汉“XP是(BE)YP”断定构式的认知研究 匡芳涛 西南大学 2015-12-31 专著 1781 汉语话语标记系统的认知研究 周明强 浙江外国语学院 2016-6-30 专著 1782 基于使用的汉英“低调陈述”认知维度拓展研究 鞠红 安徽大学 2016-6-30 专著 1783 基于语料库的英汉话语标记语语义结构与语用功能研究 向明友 北京航空航天大学 2016-6-30 专著 1784 基于句法语义互动的英汉分裂结构研究 刘伟 北京交通大学 2016-6-30 专著 1785 基于语料库的中国文化英语表述中外对比研究 李文中 北京外国语大学 2016-6-12 专题论文集 研究报告 1786 英汉评价语义的语法结构对比研究 王天华 黑龙江大学 2016-6-30 专著 1787 汉英“名形表量构式”句法语义互动的历时对比研究 罗思明 宁波大学 2016-6-30 专著 1788 基于语料库的汉英人体隐喻模式对比研究 李毅 山东财经大学 2016-7-1 专著 1789 基于汉英平行语料库的汉英动宾搭配对比研究 王志军 上海财经大学 2016-8-31 研究报告 工具书 1790 文化翻译学的学科建构研究 杨仕章 解放军外国语学院 2016-2-28 专著 1791 翻译伦理学研究 陈志杰 南京信息工程大学 2016-12-31 专著 1792 中国戏剧外译史研究 孟伟根 绍兴文理学院 2016-6-30 专著 1793 基于语料库的英汉文学译本描写理想模型研究 许文胜 同济大学 2016-8-31 专著 专题论文集 1794 基于汉英双语平行历时语料库的汉语言语幽默及其英译研究 戈玲玲 南华大学 2016-1-15 专著 研究报告 1795 林语堂创作与翻译的互文关系研究 李平 南京信息工程大学 2016-6-30 专著 专题论文集 1796 国家文化安全视域下的文化翻译研究 张全 曲靖师范学院 2016-12-31 专著 1797 基于俄汉平行语料库的人文社科类学术文本翻译研究 陶源 陕西师范大学 2016-10-31 专著 1798 中国网络翻译批评研究 王一多 国际关系学院 2015-12-31 专著 1799 基于副文本的中国古典诗歌国外英译新论研究 蔡华 大连大学 2015-12-31 专著 1800 茶典籍系列的互文模因追溯及其英译的多维视域融合研究 姜怡 大连理工大学 2016-12-1 专著 1801 儒家经典翻译传播与国家文化软实力建设研究 李玉良 青岛科技大学 2016-6-30 专著 研究报告 1802 基于《大中华文库》的中国典籍英译翻译策略研究 王宏 苏州大学 2016-12-31 专著 1803 《诗经》英译译本分析研究 赵彦春 天津外国语大学 2016-6-30 专著 译著 1804 《大清律例》英译比较研究 熊德米 西南政法大学 2016-2-25 专著 1805 霍克思《红楼梦》英译研究 鲍德旺 解放军理工大学 2015-12-31 专著 研究报告 1806 新月派翻译文化研究 黄焰结 安徽工程大学 2015-12-31 专著 1807 中国现当代文学在英语国家的翻译和接受研究 马会娟 北京外国语大学 2016-12-31 专著 1808 基于平行语料库的认知叙事学视域下的莫言作品汉英版本比较研究 楚军 电子科技大学 2015-12-31 专著 1809 基于语料库的《中国文学》(英文版)作品英译研究(1951-1966) 韩江洪 合肥工业大学 2016-6-30 专著 1810 中国当代小说的英译研究 吴赟 上海外国语大学 2016-6-1 专著 1811 ICT环境下计算机辅助口译学习系统研究 许明 北京语言大学 2016-12-31 专题论文集 1812 英汉对比视角下作为重写的翻译过程研究 顿官刚 湖南师范大学 2016-10-30 专著 1813 翻译写作学的学科建构与拓展研究 杨士焯 厦门大学 2017-12-30 专著 1814 江苏江淮方言语法比较研究 王健 常熟理工学院 2016-12-30 专著 1815 闽台闽南语方言语法比较研究 陈曼君 集美大学 2017-6-30 专著 研究报告 1816 浙江沿海明清卫所驻地方言与周边方言的接触及其历史演变研究 阮咏梅 宁波大学 2016-12-31 专著 1817 类型学视野下的晋方言语法比较研究 史秀菊 山西大学 2016-12-30 专著 1818 方言自动处理系统功能扩展研究 李蓝 中国社科院 2014-12-31 电脑软件 研究报告 1819 两岸客家话比较研究 温昌衍 嘉应学院 2016-12-30 专题论文集 研究报告 1820 闽语特征研究 李如龙 厦门大学 2016-9-1 专著 1821 语言地理学视域中的宁波方言调查与比较研究 赵则玲 浙江外国语学院 2016-12-31 专著 1822 山西晋方言地图集 李建校 晋中学院 2016-5-30 专著 研究报告 1823 晋方言代词连用和重叠的类型学研究 武玉芳 山西师范大学 2016-12-30 专著 1824 基于语言地理学的北京方言调查研究 卢小群 中央民族大学 2016-12-31 专著 1825 新词语规范及科学语言规范观研究 刘楚群 江西师范大学 2015-12-30 专著 研究报告 1826 美国国防语言规划研究 吴承义 解放军外国语学院 2015-6-30 专著 1827 国际化城市的外语规划:上海与纽约、东京的比较研究 赵蓉晖 上海外国语大学 2015-8-31 研究报告 电脑软件 1828 新疆维吾尔族汉语使用的社会语言学研究 朱学佳 北京政法职业学院 2016-12-30 专著 1829 汉语实词虚化的变异社会语言学研究 蔡冰 江苏师范大学 2016-12-31 专题论文集 译著 1830 社会语言学视角下的汉语委婉语研究 李军华 湘潭大学 2016-12-31 专著 1831 面向社会计算的维吾尔文本体库建设理论与方法研究 赛牙热·依马木 新疆大学 2016-12-31 研究报告 电脑软件 1832 “政治等效”视角下中国外交话语翻译原则与策略研究 杨明星 信阳职业技术学院 2016-7-1 专著 专题论文集 1833 基于语料库的法律信息挖掘模式研究及应用研究 杜金榜 广东外语外贸大学 2016-12-31 专著 1834 汉语法律术语理论研究 王东海 鲁东大学 2015-6-30 专著 1835 庭审话语的社会认知研究 张丽萍 南京理工大学 2016-12-31 专著 1836 动词论元结构的儿童习得研究 范莉 北京林业大学 2016-9-30 专题论文集 1837 结构启动在外语学习中的作用研究 王敏 西安交通大学 2016-6-30 专著 1838 汉语时制范畴加工的认知神经机制研究 齐振海 北京第二外国语学院 2016-12-31 专著 研究报告 1839 基于神经语言学的汉英关系从句加工的多因素作用模型研究 王慧莉 大连理工大学 2016-6-16 专著 1840 汉语阅读障碍儿童的心理基础与干预研究 王敬欣 天津师范大学 2016-6-30 专著 研究报告 1841 基于大型可比语料库的中国学者(科学家)学术英语现状研究 卫乃兴 北京航空航天大学 2017-12-30 专著 电脑软件 1842 中国高校教师双语教学能力研究 李颖 杭州师范大学 2015-12-31 专著 1843 国培计划-基于动态需求分析的农村中小学英语教师置换脱产研修项目特色课程体系的构建 刘晓华 湖北科技学院 2016-12-31 专著 研究报告 1844 西部儿童外语能力战略发展的语言文化生态环境研究 汤红娟 乐山师范学院 2016-6-30 专著 研究报告 1845 中国研究型高校本科生“学术英语素养”发展模型研究 龚嵘 华东理工大学 2016-6-30 专题论文集 研究报告 1846 英语教师课堂教学规范与评价指标体系的研究 王斌华 华东师范大学 2015-12-31 专著 1847 英语语言学研究生实验研究能力系统评价研究 鲍贵 南京工业大学 2016-12-31 专著 专题论文集 1848 以培养具有国际竞争力人才为取向的新非英语专业大学生英语能力标准研究 崔校平 山东大学 2016-12-31 专著 1849 任务型教学与教师角色研究 谢元花 广东外语外贸大学 2016-12-30 专题论文集 1850 应用认知语言学视域下的英语教与学实证研究 卢植 宁波大学 2016-12-31 专著 1851 基于语料库和云技术的网络自动作文评阅系统信效度及其辅助教学研究 张荔 上海交通大学 2016-12-31 专著 1852 整体效度观下的计算机化语言测试效度研究:基于证据的效度验证 高怀勇 四川农业大学 2015-12-31 专著 研究报告 1853 应用语言学研究中的混合法研究 张培 天津财经大学 2016-6-30 专著 1854 大学生英语学术文献阅读与引用能力的发展及影响因素研究 马蓉 北方民族大学 2016-8-30 专题论文集 研究报告 1855 体验-建构融通式笔译教学创新模式探索 曾利沙 广东外语外贸大学 2015-6-30 专著 研究报告 1856 基于认知诊断的大学英语阅读障碍及教学补救措施研究 段惠琼 南昌航空大学 2015-6-30 专著 1857 英语创意写作教学框架研究 戴凡 中山大学 2016-12-31 专题论文集 1858 汉语言文化在海外的传播与发展研究 耿红卫 河南师范大学 2016-7-31 专著 1859 海外华语语言生活状况调查及多媒体语言资源库建设 刘华 暨南大学 2016-6-1 研究报告 1860 汉语作为第二语言的界面关系习得研究 赵杨 北京大学 2016-8-31 专著 1861 外国学生汉语体貌成分习得研究 丁崇明 北京师范大学 2016-9-30 专题论文集 1862 基于语料库的聋人汉语书面语研究 吕会华 北京联合大学 2016-12-31 研究报告 电脑软件 1863 商务管理英语知识库构建及其在商务英语写作自动评分中的应用研究 葛诗利 广东外语外贸大学 2016-3-31 专著 1864 东南亚英语口语语料库的研制与英语变体研究 纪可 广西大学 2016-7-1 研究报告 电脑软件 1865 互动-共享型汉语幼儿会话语言知识库研究 李葆嘉 南京师范大学 2016-6-30 专著 电脑软件 1866 英语学术论文写作诊断性在线反馈系统研究与构建研究 杨瑞英 西安交通大学 2015-1-31 研究报告 电脑软件 1867 接受学视阈下的《切韵》学史研究 李子君 吉林大学 2016-12-31 专著 1868 元代八思巴字的推行情况及其与汉语韵书的相互影响研究 宋洪民 山西大学 2016-12-30 专著 1869 上古汉语闭口韵与非闭口韵通转关系研究 孟蓬生 中国社科院 2016-12-31 专著 1870 燕系文字材料的整理与研究 张振谦 河北大学 2016-6-30 专著 工具书 1871 从书写角度对简帛碑刻隶书笔形变化的动态考察 郑振峰 河北师范大学 2016-12-30 专著 1872 秦至西汉简帛文献中字形与音义关系研究 陈斯鹏 中山大学 2016-9-30 专著 1873 明末以来西方人创制的汉语罗马字拼音方案研究 庄初升 中山大学 2016-6-30 专著 1874 明代-民国时期方志所载方言词汇研究 曹小云 合肥师范学院 2015-12-31 专著 电脑软件 1875 出土战国文献实词研究暨词典编纂 张玉金 华南师范大学 2016-6-18 工具书 1876 古白话词汇研究 徐时仪 上海师范大学 2015-8-28 专著 专题论文集 1877 宋朝两代“篇韵”及其相关辞书的综合比较研究 张渭毅 北京大学 2016-12-20 专题论文集 研究报告 1878 基于梵汉平行语料库的汉译佛经时体标记研究 王继红 北京外国语大学 2016-12-30 专著 1879 汉语使令类兼语动词的产生、发展及其对句法结构的影响研究 刘文正 湖南大学 2016-12-31 专题论文集 研究报告 1880 近代汉语的语用标记及其演变研究 李宗江 解放军外国语学院 2016-12-1 专著 专题论文集 1881 现代汉语配“动+介”组配及“动·介”词汇化研究 罗耀华 华中师范大学 2016-6-30 专题论文集 研究报告 1882 汉语介词语义演变模式研究 马贝加 温州大学 2017-12-30 专著 1883 汉语句子的非现实情态研究 张雪平 河南大学 2016-6-30 专著 1884 现代汉语主观量副词研究 蒋静忠 河北大学 2015-3-22 专著 1885 汉语句序类型和构式的多角度研究 伍依兰 华中师范大学 2016-12-30 专著 专题论文集 1886 基于语义地图的句末助词多功能研究 赵春利 暨南大学 2016-6-30 专著 1887 现代汉语语气词系统研究 王珏 上海交通大学 2015-12-31 专著 1888 类型学视野下的汉语连动式研究 高增霞 中国人民大学 2016-9-30 专著 1889 现代汉语常用词的构成理据研究 孙银新 北京师范大学 2016-12-31 专著 1890 词概念框架视域下汉语超常与规范研究 廖光蓉 湖南师范大学 2016-10-30 专著 1891 汉语词缀标记的类型学研究 曹跃香 江西师范大学 2016-6-30 专著 1892 广义修辞学视角下的夸张研究 高群 阜阳师范学院 2016-12-30 专著 1893 当代汉语非结构化人际冲突话语研究 李晗蕾 哈尔滨师范大学 2016-6-30 研究报告 1894 汉语意识流语篇的语言学研究 杨增宏 合肥师范学院 2016-6-30 专著 专题论文集 1895 中国修辞学思想发展研究 罗渊 湖南科技大学 2016-12-31 专著 1896 汉语篇章信息配置方式的选择性研究 胡建锋 上海师范大学 2016-12-31 专著 1897 满语词汇语义研究 赵阿平 黑龙江大学 2016-6-30 专著 1898 蒙古语方言的记录保存与传承复兴研究 巴达玛敖德斯尔 内蒙古大学 2015-12-31 研究报告 工具书 1899 中国朝鲜语方言调查研究及有声语料库建设 李锦花 南京大学 2016-6-30 研究报告 专著 1900 维吾尔语方言语音声学参数库研制 吐尔逊·卡得 新疆财经大学 2015-12-30 研究报告 1901 维吾尔语达里雅博依话的研究与音档建设 颜秀萍 新疆大学 2016-12-30 专著 1902 传世文献《伊立米自理纳伊亚》手抄本第二册研究 玛丽亚木 新疆师范大学 2016-6-30 专著 1903 面向自然语言处理的藏语句型自动分析及分布统计 才智杰 青海师范大学 2016-12-30 电脑软件 研究报告 1904 藏语言文字学初探 吉太加 青海师范大学 2016-12-30 专著 1905 汉藏历史比较语言学研究 杨光荣 四川大学 2016-12-31 专著 1906 敦煌佛典词汇汉藏对照文献研究 夏吾拉旦 西北民族大学 2015-12-31 专著 1907 从社会语言学视觉研究语码转换学理论及藏语卫藏方言中的语码转换行为 格桑益西 西藏社科院 2015-7-2 专著 1908 跨境彝族倮人(濒危)语言调查研究 邱富元 西南民族大学 2016-6-30 专著 1909 彝族有声语言及口传文化保护和传承的数字化方法及其基础理论研究 苏连科 西南民族大学 2016-7-31 专著 1910 格曼语的深度描写及其与藏语、羌语的语法对比研究 李大勤 中国传媒大学 2016-3-1 专著 1911 语言接触视野下的南部壮语语法研究 吕嵩崧 百色学院 2016-8-30 研究报告 1912 壮侗语族语言致使范畴的类型学研究 袁善来 南阳师范学院 2016-6-30 专著 1913 基于数据库的傣语长篇语料语法标注和类型特征提取研究 刀洁 云南民族大学 2016-12-30 专著 1914 云南耿马佤语黄佤话参考语法研究 赵岩社 云南民族大学 2016-6-30 专著 1915 云南民族古文字接触的地理类型学研究 刘青 云南民族大学 2016-7-30 专著 1916 中国英语学习者句法与语义加工的ERP研究 李霄翔 东南大学 2016-12-31 专题论文集 1917 基于语料库的词根词缀习得顺序研究 姚鸿琨 莆田学院 2015-12-30 专著 1918 二语习得不对称现象的形意互动研究 于善志 宁波大学 2016-12-31 专著 1919 指量结构在关系从句加工进程中的消歧与结构预期的作用 吴芙芸 上海外国语大学 2016-6-30 专题论文集 研究报告 1920 基于概念匹配、释义与连通的衔接功能语用研究 王军 苏州大学 2016-9-1 专著 1921 基于语料库的内、外向型汉外词典的字母词收录及其释义问题研究 吴建平 厦门大学 2016-7-31 专题论文集 专著 1922 认知框架下的语篇视角研究 刘瑾 贵州师范大学 2015-12-30 专著 1923 心智哲学视域下的英语辞格系统 何爱晶 湖北民族学院 2015-12-31 专著 1924 以语料库为基础的英汉学术语篇对比研究 陈莉萍 南京师范大学 2016-6-30 专著 专题论文集 1925 英语学术论文语篇的话语策略研究 庞继贤 浙江大学 2016-6-30 专著 1926 中日同声传译教学方法论研究 宋协毅 大连大学 2016-12-30 专题论文集 研究报告 1927 大学日语学术论文写作及教材开发的研究 黄明侠 哈尔滨师范大学 2016-6-30 专题论文集 研究报告 1928 语料库视阈下面向学习者的汉日动词配价对比研究 许宗华 解放军外国语学院 2016-12-31 专题论文集 电脑软件 1929 基于语料库的近现代中日语言接触研究 刘凡夫 辽宁师范大学 2015-12-31 专著 1930 基于语料库的中国日语学习者认知研究 毛文伟 上海外国语大学 2016-6-30 专著 1931 俄汉互参式意义重构的译学研究 赵小兵 河北大学 2016-12-31 专著 1932 基于PBL的翻译人才创新能力培养理论与实证研究 王湘玲 湖南大学 2016-6-30 专题论文集 工具书 1933 俄罗斯语言学家帕杜切娃动态语义学思想研究 蔡晖 首都师范大学 2016-7-1 专著 2013年国家社科基金青年项目立项名单(语言学) 序号 项目名称 负责人 工作单位 计划完成时间 预期成果 1124 “话题链”的语法——语篇界面研究 詹宏伟 杭州师范大学 2016-6-30 专著 1125 短语学视阈下句法和语义的界面研究 孙海燕 河南师范大学 2016-9-1 专题论文集 研究报告 1126 基于语料为的汉英省略限制条件的句法语义对比研究 张天伟 河北大学 2016-12-31 专著 专题论文集 1127 事件名词的类型学特征和词类类型学研究 吴怀成 上海对外贸易学院 2016-6-30 专著 1128 认知突显的构式表征与主观调控研究 李文浩 上海师范大学 2016-6-30 专著 专题论文集 1129 生成类型学视域下的英汉广义体范畴对比研究 马军军 西南大学 2016-6-30 专著 1130 汉籍外译的价值取向与文化立场研究 周晓梅 上海财经大学 2016-3-1 研究报告 1131 中国古典文论在西方的英译与传播研究 王洪涛 天津外国语大学 2015-12-31 专著 1132 翻译行为的构成体系、影响因素及影响机理研究 钱春花 中国矿业大学 2016-6-30 专著 专题论文集 1133 中国太极拳汉英翻译研究 张明玺 河南农业大学 2016-6-30 研究报告 工具书 1134 新时期中国政府部门名称标识语在西方世界的接受度调查及英译对策研究 郭虹宇 浙江工商大学 2015-2-18 专著 研究报告 1135 《哈姆雷特》汉译专题研究 吴颖 安徽师范大学 2015-12-31 专著 1136 《中庸》英译与中庸翻译思想研究 宋晓春 湖南大学 2016-12-30 专著 1137 二十世纪后半期美国译入老舍小说及其对中国文化形象构建研究 夏天 华东政法大学 2016-6-30 专著 1138 基于语音识别的口译自动评测系统研究 刘梦莲 广东外语外贸大学 2016-6-30 专题论文集 1139 江苏省内方言声调的生成与感知模型研究 章婷 南京师范大学 2016-12-31 专题论文集 1140 豫皖两省境内沿淮方言语音的比较研究 贡贵训 湖南科技学院 2016-12-31 专著 专题论文集 1141 丹阳方言语音层次与边界性特征研究 徐娟娟 上海师范大学 2016-12-31 专著 1142 语言接触下的关中山东方言岛语言演变研究 陈荣泽 西藏民族学院 2015-12-30 专著 1143 社会语音学视角下的汉语声调类型研究 梁磊 南开大学 2016-12-31 专题论文集 专著 1144 中国西部地区少数民族濒危语言的接触、借用和融合性研究 尚华 西安理工大学 2016-6-30 研究报告 1145 现代汉语新闻语体计量研究 黄伟 北京语言大学 2016-12-31 专题论文集 1146 二语学习者句法能力发展及其影响因素研究 晏小琴 江西师范大学 2016-6-30 专题论文集 研究报告 1147 汉语儿童语言中的句法语用接口研究 吴庄 湘潭大学 2016-12-30 专著 1148 普通话婴幼儿声调范畴的建立机制研究 高军 中国社科院 2015-12-31 研究报告 1149 汉语关系从句加工过程中句法、语义作用机制及其神经基础的研究 何文广 曲阜师范大学 2016-12-31 专著 研究报告 1150 自闭症儿童早期读写能力发展及家庭读写环境影响因素研究 赵静 中山大学 2016-12-30 专题论文集 1151 中学英语新教师发展及培养模式研究 徐浩 北京外国语大学 2015-12-31 研究报告 1152 “出国留学”语境下中国大学生英语产出型技能发展的规律与特点研究 吴建设 北京第二外国语学院 2015-12-31 研究报告 1153 中国大学生英语写作能力的认知诊断评估 李航 浙江大学 2016-6-30 专著 专题论文集 1154 英语国际语视角下高校学生跨文化交际能力提升研究 任伟 中国科学院大学 2015-12-31 专著 1155 标准化语言测试的标准制订与效度研究 范劲松 复旦大学 2015-12-31 专著 专题论文集 1156 我国大学英语学习者“学习文化”的实证研究及理论阐释 黄文红 外交学院 2016-6-30 研究报告 1157 外国留学生汉语中介语“洋腔洋调”的产生机制研究 陈默 北京语言大学 2016-12-31 专著 1158 课堂教学环境中韩国学生汉语介词习得认知过程研究 周文华 南京师范大学 2016-12-31 专著 1159 面向二语习得的汉语双音复合词构词及词汇语义的认知研究 张巍 上海师范大学 2016-6-30 专著 1160 现代汉语词类句法功能的概率分布研究 高松 黑龙江大学 2016-6-30 专著 1161 汉语复句关系词搭配依存树库的构建方法和实现策略研究 胡泉 华中师范大学 2016-6-30 专题论文集 研究报告 1162 甲骨文字形的配准识别研究 顾绍通 江苏师范大学 2016-12-31 专题论文集 电脑软件 1163 汉语语体多维度、多特征计量研究 刘艳春 中国传媒大学 2016-6-30 专题论文集 电脑软件 1164 基于数据库的楚系简帛文献音韵研究 胡海琼 广东技术师范学院 2016-6-30 专著 电脑软件 1165 南曲韵书与明清语音研究 李超 广西大学 2016-7-1 专著 1166 曲韵书音系比较研究 陈宁 华中师范大学 2016-12-31 专著 专题论文集 1167 元代少数民族作家汉文诗歌的用韵特点 王冲 内蒙古大学 2015-12-30 专著 1168 十六世纪以来闽南方域文字的调查与研究 李春晓 福建师范大学 2017-12-30 专题论文集 研究报告 1169 郭店、上博古竹书字词研究 刘传宾 天津师范大学 2016-6-30 专著 1170 楚卜筮简整理与研究 蔡丽利 潍坊学院 2016-6-30 专著 1171 清至民国粤西手抄、刻本文献俗字整理与研究 王建军 梧州学院 2016-6-30 研究报告 专题论文集 1172 汉字与古埃及文字比较研究 陈永生 中国海洋大学 2016-1-30 专著 1173 肩水金关汉简名物词语研究 聂丹 贵州财经大学 2016-6-30 专著 1174 辽金辞书辑佚及研究 魏现军 河南理工大学 2016-12-30 专著 1175 出土两汉文献古白话词研究 吕志峰 华东师范大学 2016-8-31 专著 1176 明代朝鲜使者汉文著述词汇研究 钱慧真 南京师范大学 2016-12-31 专著 1177 敦煌诗词曲词汇研究 洪帅 西北师范大学 2015-12-31 专著 1178 走马楼吴简词汇研究 陈荣杰 西南大学 2016-12-31 专题论文集 研究报告 1179 上古汉语状语研究 苏颖 北方工业大学 2015-12-31 专著 1180 比较句法学视野下的近代汉语致使结构研究 陈国华 盐城师范学院 2016-6-30 专著 专题论文集 1181 汉语量词发展史及其语法化研究 李建平 淮阴师范学院 2016-12-31 专著 1182 基于认知的可逆句式句法语义研究 鹿荣 济南大学 2016-12-31 研究报告 1183 汉语构式省略的理论建构与实证研究 董正存 中国人民大学 2016-9-30 专著 1184 基于语料库的汉语应答性成分语义和话语功能研究 侯瑞芬 中国社科院 2016-6-30 研究报告 1185 类型学视野的疑问和焦点互动关系研究 祁峰 中国社科院 2015-12-30 专著 1186 汉语形容词的词类属性和句法功能研究 陈刚 安徽大学 2016-12-31 专著 1187 类型学视野下的汉语动词“完结”范畴研究 玄玥 北京语言大学 2015-12-1 专著 研究报告 1188 理想认知模式理论视域下汉语被字句的特点研究 颜力涛 大庆师范学院 2016-6-30 专著 1189 基于大规模语料的北京话虚词的发展演变研究 崔蕊 对外经济贸易大学 2016-7-1 研究报告 1190 基于语料库的汉语假设范畴句法标记模式研究 董秀英 河南大学 2016-7-1 专著 1191 语义演变视角下源于短语的汉语虚词研究 周莉 吉林大学 2015-12-30 专著 1192 汉语信息科技常用词定量研究 宛东生 解放军电子工程学院 2015-6-30 专著 研究报告 1193 当代汉语三音词的造词理据—功能模式的研究 杨爱姣 深圳大学 2016-12-28 专著 工具书 1194 基于句法—语义界面的汉语变读构词研究 谢维维 浙江大学 2015-12-31 专著 1195 朱熹语录宋本及明清传本语言研究 冯青 海南师范大学 2016-6-30 专著 专题论文集 1196 秦汉时期楚方言与南方民族语言关系研究 谢荣娥 中南民族大学 2016-12-31 专著 1197 基于实验语音学的朝鲜语方言研究 郑义香 扬州大学 2016-12-31 专著 1198 蒙古语短语结构-在最简方案框架内的研究 高莲花 中央民族大学 2016-12-30 专著 1199 汉维翻译对现代维吾尔语语法的影响研究 尼扎米丁·尼亚孜 新疆师范大学 2016-12-20 专著 研究报告 1200 粟特语、吐火罗语与古代维吾尔语接触研究 木再帕尔 中国社科院 2016-12-30 专著 1201 彝语动作核心词研究 刘晓静 贵州民族大学 2016-6-1 专著 1202 土家语基本词研究 熊英 湖北文理学院 2016-12-31 专著 1203 西藏存梵语语言学文献《妙音声明经》汉译与研究 尼玛 西藏大学 2016-6-30 专著 1204 中老跨境哈尼语对比研究 赵敏 云南师范大学 2016-6-30 专著 1205 标话语言文化典藏研究 杨璧菀 贺州学院 2016-6-30 专著 电脑软件 1206 藻敏瑶语汉借词的历史层次及其在瑶语历史研究中的作用研究 龙国贻 中国社科院 2016-6-28 专著 1207 中国学生英语朗读口语的韵律特征研究 何家勇 成都理工大学 2016-5-30 专著 研究报告 1208 法语生成句法研究 吴桐 南开大学 2016-7-1 专著 1209 英汉情感强化副词的认知研究 刘芬 邵阳学院 2016-12-31 专著 1210 中国当代大众语篇中的篇际互文性研究 武建国 华南理工大学 2016-12-31 专著 专题论文集 1211 英语元话语语域变异的多维度研究 张曼 华中师范大学 2016-3-1 研究报告 1212 言据性与语篇类型的系统功能语言学研究 杨林秀 山西大学 2016-7-1 专著 1213 致使结构中属性化问题的汉日对比研究 王鹏 北京第二外国语学院 2015-12-28 研究报告 1214 现代日语形容词语法语义互动机制的实证研究 周彤 北京科技大学 2016-12-31 专著 1215 基于认知语言学角度的日语“に‐が”构式研究 赵蓉 清华大学 2016-6-30 专著 1216 机器翻译理论框架下俄汉语篇内句子的同义转换研究 胡连影 北京大学 2014-4-1 研究报告 1217 基于词汇函数理论的俄汉动词语义世界图景对比研究 徐涛 哈尔滨师范大学 2016-6-30 专著 研究报告 1218 认知语言学视野下俄语空间概念的人类中心性研究 赵亮 解放军外国语学院 2016-6-30 专著
个人分类: 语言学探讨 Linguistics|9406 次阅读|0 个评论
澳女子车祸后说话带法国腔的语言学解释
gothere 2013-6-18 21:39
消息来源: http://news.xinhuanet.com/mrdx/2013-06/18/c_132463327.htm 新闻视频: http://news.joy.cn/video/4308154.htm 澳女子车祸后说话带法国腔 据新华社专电一名澳大利亚女子在车祸中脑部受伤,康复后说话带起“法国腔”。女子倍感困扰,她的医生认为,她可能患上罕见的外国口音综合征,成为澳大利亚第二名病患。   利安娜·罗在澳大利亚南部的塔斯马尼亚岛出生并长大。8年前,罗遭遇车祸,头部和背部受重伤。她颌部伤口刚愈合时,说话有些“不利索”。一开始,医生怀疑是治疗用强效药的影响,但后来,罗发现,这其实是“法国腔”。   罗的家庭医生罗伯特·牛顿认为,罗患上外国口音综合征。“我之前认识她的时候,她一直是正常的澳大利亚口音。她在学校学过法语,但从没去过法国,也没有法国朋友。” 无独有偶,CCTV-10也报道过国内的病例 ,但专家均表示不知缘由,直到法国人出事,有了外文翻译,才引入外国口音综合征(Foreign accent syndrome) 一词。 见当年的报道 http://news.163.com/08/0331/06/48BG6VDT00011229.html 河南一村妇车祸后,昏迷10多天。当她醒来后却不会说家乡话,改说普通话。有人说她“灵魂附体”,有人说她“装洋”。专家还未找到病因。 专家还未找到病因 出现这种现象的原因是什么呢? 孙凤莲的主治大夫,扶沟县公安局法医门诊外科医生谢建华说,孙凤莲被送到医院后,被诊断为脑出血、颧骨骨折,伤势非常严重。但他也没法解释,孙凤莲为什么突然说普通话,医院的设备也检测不出问题。 该院外科医生袁俊超说,他从医20多年,只听过一次病人突然不会说话了,还没听说过不会说家乡话改说普通话的病例。他觉得,可能是病人的语言中枢受损伤了。 郑州市第一人民医院脑外科主任孙郑春说,他曾经看过孙凤莲的脑核磁共振图,她的语言中枢并没受损伤。他分析,孙凤莲可能是受惊吓,导致精神上出现了问题。 郑州市第六人民医院精神病专家孔德荣说,由于没看到病人的相关资料,一时无法判断出致病原因。她说,引起人类突然失语或改变口音的原因有两个,一是由于脑损伤,二是由于惊吓,产生精神障碍。 孔德荣分析,孙凤莲出现了10多天的昏迷,可能会伤到脑神经,但这需要拍片观察。也有可能是受到惊吓,不能自控。孙凤莲的病症不会影响到生命,但至于是否能治愈,她也说不准。 【相关新闻】 突然变口音的 还有这几例 ●郑州市民王先生说,5年前,他老家鹿邑县城郊乡田园村,有个20多岁的女子生孩子后和家人生气,突然开始说普通话,去全国各地看医生,也没治好。但两个多月后,又突然好了。 王先生说,此后,这名妇女每次和家人生气后,就会“犯病”(说普通话),短则几个小时,长则持续几个月。 ●2005年7月25日《重庆晚报》报道,一男子维修电梯时不慎从3楼摔下,原本地道的重庆话“丢”了,出口就是“准”普通话。 ●华龙网曾报道,重庆市梁平县人民医院外三科薛南平医生介绍,他曾收治了一头顶骨粉碎性骨折的女中学生陈花,治疗8天后,陈花苏醒过来,只能说普通话。 ———————————————————————————————————————————— 下面是借助互联网的考证: 外国口音综合征(Foreign accent syndrome)是一种临床上很罕见的病症通常伴随着严重的脑损伤,例如中风。此病导致患者说母语时如同带有外国口音。 1907年法国的神经学家Pierre Marie首次发现这种现象,另一个则是1919年捷克的病例。较有名的有记录的外国口音综合症病例于1941年出现在挪威一个女孩空袭中遭到脑损伤之后。康复过程之后她落下了说话带严重德国口音的病根,并遭到了挪威同胞的排斥。 有些研究认为可能是特定部位脑缺血导致某些短期记忆丧失,而长期记忆却被唤起,因而在对以前某些人的口音的记忆的影响下,患者的口音发生了变化。而有些医生则认为是患者舌头灵活性受到病患影响所致。 PS:(1)从报道上看,国内外的研究差距巨大(2)国外的研究印证了多年前的一个猜想,人的语音语调的系统性,一个参数变了,会引起整体性的调整,从而和某种语言的语调相近。举例来说,日语的发音比较靠前,英语德语的发音靠后,显出一种整体性的舌动对应。这会导致一个很有意思的结论,脑中的自组织的重构能力远比想象厉害,可以一步到位,变成另一种语调。如果这样的话,可能给外语教学、口语机器翻译带来巨大的动力,有可能对语调重新建模,找到关键性的参数,就可以自适应各种语言了。 Wiki的参考文献: Dankovičová J, Gurd JM, Marshall JC, MacMahon MKC, Stuart-Smith J, Coleman JS, Slater A. Aspects of non-native pronunciation in a case of altered accent following stroke (foreign accent syndrome). Clinical Linguistics and Phonetics 2001;15:195-218. Gurd, J. M.; Bessell, N. J.; Bladon, R. A.; Bamford, J. M. (1988). A case of foreign accent syndrome, with follow-up clinical, neuropsychological and phonetic descriptions. Neuropsychologia 26 (2): 237–251. PMID 3399041. Gurd, J. M.; Coleman, J. S.; Costello, A.; Marshall, J. C. (2001). Organic or functional? A new case of foreign accent syndrome. Cortex; a journal devoted to the study of the nervous system and behavior 37 (5): 715–718. PMID 11804223.
个人分类: Linguistics|5226 次阅读|0 个评论
[转载]2013年国家社科基金立项名单公示:语言学
carldy 2013-6-5 16:24
来源: 全国哲学社会科学规划办公室 2013年06月04日17:49 一般项目 语言学 http://www.npopss-cn.gov.cn/n/2013/0604/c220439-21734741.html 青年项目 语言学 http://www.npopss-cn.gov.cn/n/2013/0604/c220439-21734768.html
个人分类: 语言学探讨 Linguistics|2333 次阅读|0 个评论
[转载]【计算语言学】201205Statistical metaphor processing
lcj2212916 2013-6-1 13:24
Statistical metaphor processing 共54页。 摘要: Metaphor is highly frequent in language, which makes its computational processing indispensable for real-world NLP applications addressing semantic tasks. Previous approaches to metaphor modeling rely on task-specific hand-coded knowledge and operate on a limited domain or a subset of phenomena. We present the first integrated open-domain statistical model of metaphor processing in unrestricted text. Our method first identifies metaphorical expressions in running text and then paraphrases them with their literal paraphrases. Such a text-to-text model of metaphor interpretation is compatible with other NLP applications that can benefit from metaphor resolution. Our approach is minimally supervised, relies on the state-of-the-art parsing and lexical acquisition technologies (distributional clustering and selectional preference induction), and operates with a high accuracy. 下载地址: http://www.pipipan.com/file/22095585
1184 次阅读|0 个评论
[转载]【计算语言学】201205Mildly non-projective dependency grammar
lcj2212916 2013-5-29 20:24
Mildly non-projective dependency grammar 共34页。 摘要: Syntactic representations based on word-to-word dependencies have a long-standing tradition in descriptive linguistics, and receive considerable interest in many applications. Nevertheless, dependency syntax has remained something of an island from a formal point of view. Moreover, most formalisms available for dependency grammar are restricted to projective analyses, and thus not able to support natural accounts of phenomena such as wh-movement and cross–serial dependencies. In this article we present a formalism for non-projective dependency grammar in the framework of linear context-free rewriting systems. A characteristic property of our formalism is a close correspondence between the non-projectivity of the dependency trees admitted by a grammar on the one hand, and the parsing complexity of the grammar on the other. We show that parsing with unrestricted grammars is intractable. We therefore study two constraints on non-projectivity, block-degree and well-nestedness. Jointly, these two constraints define a class of “mildly” non-projective dependency grammars that can be parsed in polynomial time. An evaluation on five dependency treebanks shows that these grammars have a good coverage of empirical data. 下载地址: http://www.pipipan.com/file/21835772
1545 次阅读|0 个评论
语言学基础研究的两个进展(邹晓辉提纲挈领总结的三个要点)
geneculture 2013-5-17 16:09
语言学基础研究的两个进展(邹晓辉Geneculture提纲挈领总结的三个要点) (2013-05-17 15:50:29) 区分言和语的双重价值: 1 在索绪尔区分语言和言语的基础上以汉语为例前进一步,可明确普通语言学的基本研究对象(言)和派生研究对象(语); 2 在塔斯基区分对象语言和元语言的基础上以汉语为例前进一步,可在大字符的中文形式体系框架内验证语言分层理论的理想即排除演绎推理的悖论。 3 由于汉语的基本研究对象(言,即:单音节的字)和派生研究对象(语,即:双音节和多音节的字组),正好在大字符的中文形式体系框架内也是对象语言(言,即:单音节的字)和元语言(语,即:双音节和多音节的字组),因此,这就首次实现了普通语言学和形式语言学在最一般和纯形式上的统一。 图1 类的划分即宏观模型.jpg 新的(普通和形式)语言观(图1理论模型——明确了言和语的基本关系,事实上是从宏观上明确区分了基础的类和派生的类): http://photo.blog.sina.com.cn/photo/65197d93x7a802e758e9e 图2 类的划分以及例的枚举即宏观模型与微观模型的结合及其实际应用.jpg (算术和语文、中文和英文、术语和俗语)三类双语(即语言、知识、软件)协同智能计算平台(图2实践应用举例——发挥了言和语在形式上区分的实际作用,实际上也就是从微观上体现了言和语的序位演绎关系,这是以往的理论和实践都忽略的基本事实): http://photo.blog.sina.com.cn/photo/65197d93gca49d111b5e8 附录: 当代中国大学新使命:基于汉语思维与双语处理的文化传承和创新(核心期刊) ( 2012-11-22 07:34:56) http://blog.sina.com.cn/s/blog_65197d9301014ggw.html 与其说是字本位,不如说是言本位(世纪对话179-193页)邹晓辉 ( 2013-05-07 14:02:54) http://blog.sina.com.cn/s/blog_65197d9301018eed.html
个人分类: 语言学基础研究|1526 次阅读|1 个评论
冯志伟教授“用计量方法研究语言”学术报告听后感
热度 2 wuxiaolananhui 2013-5-6 09:34
5 月 5 日下午两点半开始,冯教授给我们作了长达两个小时的学术报告,这场学术报告以论文篇章结构的形式进行阐述,内容涉及用计量方法研究语言的国内外发展概况和计量方法研究语言的地位、定律及发展趋势等。整场报告中详细阐述了“使用数学方法从计量的角度来研究语言的结构和规律”的数理语言学的分支情况(分为代数语言学、统计语言学)及其区别,尤其重点介绍了分支中的统计语言学(即计量语言学, Quantitative Lingustic,QL )中分布定律(齐夫定理)、函数定理、演化规律。虽然我一直在用语言进行交流、写作,但从未深思过语言学这个领域的研究内容及其作用,在听了冯教授的报告后,才恍然意识到我对这个领域的陌生及认识到语言学研究的重要性,但我个人觉得研究这个领域非常复杂,不仅需要有好的数学基础,还需要具备语言学的知识和大胆的想法 ~
3794 次阅读|3 个评论
用计量的方法研究语言
热度 1 leileiya 2013-5-6 00:31
今天(5月5号)在南京师范大学随园语言科技研究所听取了教育部语言文字应用研究所研究员,杭州师范大学外国语学院特聘教授,冯志伟教授的报告,题目是“用计量的方法研究语言”。 首先冯志伟教授通过Shuly Wintner的文章提出 近几年计算语言学被提到了一个非常重要的地位,但是在计算语言学的研究中,大部分只重视程序算法,没有将根本的语言学提到重要的地位。在自然语言处理的应用中,例如:词性标注、机器翻译等,没有明确的语言学知识作为基础。进而提出计量语言学是对语言学的基础性研究,是用计量的方法来探索语言的数学面貌,属于数理语言学。简而言之,计量语言学就是基于实际语言,利用计量方法发现其中的规律。进一步冯志伟教授对计量语言学的定律进行了详细的介绍,主要包括分布定律,代表人物有齐普夫、艾思杜、朱斯等;函数定律;演化规律,代表人物瓦德土。最后介绍了科勒提出的协同语言学,就是将各种规律综合起来使用。 冯志伟教授已经70多岁高龄了,对语言学进行了深入的研究,值得我们好好学习。 附上冯志伟教授详细研究成果: http://www.lingviko.net/feng/feng.htm http://ling.cuc.edu.cn/staff/fengzhiwei/index.htm
个人分类: 讲座心得|4071 次阅读|2 个评论
语言学和信息学以及软件工程学和高等教育学的基础之交叉研究
geneculture 2013-4-21 20:02
当代中国大学新使命:基于汉语思维与双语处理的文化传承和创新 ( 核心期刊公开发表 ) 邹晓辉9月份修改稿-意思不变但是不仅图更加清晰了而且语句也更加通俗了.pdf ( 全文通俗稿 ) http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=635009 邹晓辉《软件》杂志2011年第5-9期五篇论文的全文下载地址 http://blog.sciencenet.cn/blog-94143-508331.html 晓辉 2013-4-21 19:49 什么是语言科学的研究对象——“言本位”从根上解决问题 精选 http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=555849 邹晓辉 2013-4-21 19:47 第五代计算机为何在“智能化”阶段的发展像蜗牛般的徘徊前行? 精选 http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=604730
个人分类: 融智学前期探索|1254 次阅读|1 个评论
[转载]六年的语言学心血——世界各语言的梳理
热度 1 liumeao 2013-4-21 12:11
来源: 黄远杰的日志 六年的语言学心血——世界各语言的梳理 前记 最近时常在实验室中忙碌毕业设计到晚上12点,很多时候是因为呆呆地望着材料楼的窗外,回想着四年的大学时光从指缝中悄悄流过,众多回忆如黑白无声默片般地飘过脑海,而其中为数不多的色彩却来自于我永远深深迷恋的一种艺术——语言。 作为一个行将毕业的材料学渣,撰写材料科学方面的毕业论文很大程度上只是例行公事,就像婚龄稍长的夫妻一样,例行公事大于正常的激情需求。而在这段并不享受的时光之中,我一直在寻找过去四年中,一个能够引起看客共鸣,也同时能够感染自己的激情。有人也许会说是爱情,但是对于一个屡次在这个方面“挂科”的童鞋来说,我的情感经历并不是一件让人愉快的谈资,当然如果各位看客真有兴趣了解怎么在大学里面谈恋爱,请咨询我室友金纪伟童鞋。 而我要记录的是那一个燃烧了数年的语言梦,那一段激情燃烧的岁月。(好红的感觉,有木有!不是党员可惜了我!) 英雄不问出路虽是好事,但是说明一下我个人的背景情况服务于本文章。 黄某某,字译能,世人俗称伊莱。高中悬梁刺股,自认为考学能成大事。09年6月的“斯大林格勒”之役之前,大笔一挥豪泼墨得准备在志愿书上写下上海外国语大学这五个大字。然,壮志未酬。家长前辈皆炮轰这个略带“娘气”的决定(不是故意黑友校的,只是男女比例的确容易让人联想到这个两个字),于是,挥着泪告别了我心中的圣地,默然跟随父辈的脚步,来到了上海西南某高校。传说西南某高校有“三宝”:自行车;自行车后坐垫;自行车后坐垫上坐着的姑娘或者汉子(根据个人的口味不同而不同)。据说集齐之后能在校园里所向披靡。可惜,自从我的“汗血宝马”早早遭窃之后,三宝再也和我无缘,于是我要寻找到一样全新的东西来充填我的生活。 正文 大学初期,一次机缘巧合读到松田行正所著的《零》,其中汇集了121类各式符号和文字,书中虽是每种符号文字仅仅是寥寥几笔的带过,但是对于我来说,却是在我脑海中勾勒出了一幅极其清晰的世界符号语言的历史脉络图,而当时我所掌握的两门语言(即,中文和英语)仅仅是经过历史狠狠简化过的“高级语言”,而那些蕴藏更丰富文化和历史的语言恰恰是那些更“低级”的语言。从那时,我便开始研究语言及其承载的文化。 要解释众多语言的关系就要从我所操持的母语方言说起。 有外省的朋友经常会问,上海人到底操持着多少不同的方言?对于这个问题来说,我难以回答,因为针对方言的划分来说,缺乏较为精确的纲目,更何况上海松江的更西边的区域更是一个村庄操持不一样的方言,按不用的辨识等级,上海方言的划分也相当不同。但是按照一个较为官方的划分来说,上海方言的属于吴语,而更完整的语言层次应该是汉藏语系(语系)--汉语族(语族)--吴语(语言)--太湖片(语片)--苏沪嘉小片(语小片)。而更从广义的行政和地缘上分类,可为上海主流方言、浦东方言、松江方言、嘉定方言、崇明方言、金山方言和吴江方言。所以在语片层面上,上海各方言使用的是用一种语言逻辑,只是在语言发声上的差异较为明显。在这个举个“栗子”,我来自南汇,属于浦东方言,南汇话中浊音较多,很多时候需要压着喉咙发音,而这种特点是沿袭了楚地古代汉语的特点,所以听起来会更土,而相比上海主流方言,其拥有广式的连续变调系统,同时其咬字清浊对立,所以主流方言听起来更加洋气、更加具有新时代的气息。 在这个例子中,我们已经看到了仅仅在语言层面上的千差万别,所以说语言学家需要在更广泛的范围里面划分语言。这个工作可以参照生物学家的对大千生物世界的分类。于是世界上公认的语言分类是将语言按照相似程度分为语系、语族、语支和语种。 语系 代表语种 占世界总人口比例 印-欧 英语、法语、俄语、印地语、波斯语 48% 汉-藏 汉语、藏语、泰语、缅甸语 24% 尼日尔-刚果 斯瓦希里语 6% 亚-非 阿拉伯语、希伯来语 5% 马来亚-玻利尼西亚 印度尼西亚语、马来西亚语 5% 德拉维达 泰米尔语 3% 阿尔泰 土尔其语、蒙古语、哈萨克语 2% 以上的分类仅仅是粗略的分类,还有更多的语言是无法分类的,比如说加勒比语。另外,还有一些“孤立”的语言,比如说日语、朝鲜语和越南语。这些语言可被统称为孤立语系,所以根据现在的研究,他们与所有现存的语言都没有直接的联系。虽然我们看到日语中大量出现繁体中文字,但是因其语言构成的“黏着”特性,所以即使出现大量“盗用”,也无法否认语言构成层面上的孤立。 印欧语系 作为世界上最大的语系,印欧语系的分布范围几乎覆盖整个地球,而其得名的来源也颇为地域化。起初因为整个语系分布印度和欧洲所以得名为印欧语系,之后因为热爱批判的德国学者,印欧语系得到了一个全新的名字——印度-日耳曼语系,其得名的理由为,该语系中,最东边的阿萨姆邦操持的阿萨姆语属于印度语的范围,而最西边的冰岛语属于日耳曼语言,所以极富民族自豪感的德意志人民广泛运用该术语,更有民族主义者使用“雅利安语系”这个定义,然而在世界范围内,还是印欧语系这个说法较为通用。 因为印欧语系的地缘分布,所以造就了该种语系形成较早,也非常容易受到外族文化的冲击。原始的印欧人是否拥有一种固定的语言一直是语言史学家争辩的话题之一。然后由于语言的形成时间远比文字形成的时间远久,所以基本不可能有处考证。但是在学界,由于地缘性对于语言的重大影响,所以比较语言间的相似程度很大程度上就能分析出语言出现的时代。而在这个我们需要假定如果一个词语在大多数的印欧语言中都是十分相似的,那么这个词便是生活在那时的印欧人民所能直接表述的概念,也就是这个词语代表的事物是其生活中直接能接触得到的,反之便可以认为该概念是之后才得到引进了解的。这个假设便是语言学家在重塑“石化语言”中使用的假定方法。 在这个方法的指引下,古印欧人的语言就渐渐被重建出来了。我自己可以推测,这些古人生活的环境并不是现在狭义欧洲人所生活的区域和环境,却很大程度上与现今生活在离黑海和里海不远,但更为北方的人们所处的生活环境差不多,即远离江湖海,幅员辽阔的区域。有些北欧学者在这个问题上持有着不同的意见,他们认为北欧语族继承了很大部分的古印欧语的语言特点,即屈折同时还带有鲜明的口腔震颤。我对这个观点并不全盘否认,我学习了一点芬兰语之后的确发现北欧语言带有很强烈的“原始语言”的感觉,但是由于所处文明圈的不同,我更愿意认为当时的北欧文明源自于当时更南方的原始古印欧人的后裔。因为北欧的气候环境和地理位置较为苛刻和隔离,所以少有外族的入侵,在这个前提之下,文化很大程度上受到了较好的保护,所以以芬兰语代表的北欧语言在众多方面都有很强的原始印欧语的影子。在这里举个“栗子”,北欧神话很大程度上承载较为原始的北欧文化,其中广为人知的雷神名为Thor,其在发音中h为虚音,构字实为多了一个h;再反观古英语,我们也经常会发现h虚化的现象。所以我们有理由相信,以芬兰语为代表的北欧语的久远,但是其决不是古印欧语的原型。(但是很讽刺的是,芬兰语却没有被列为印欧语系,可能常年受到孤立的芬兰学者要以此争辩成为语言方面的“欧洲之祖”。) 重建古印欧语之后,学界认为“原始印欧文明起自于公元前三千年,也就是五千年以前的中欧偏东某地,大约在公元前二千五百年它分裂了,人们离开故乡分好几路向四面八方迁移。其中一路到了希腊,另一路到了意大利(这两路分别是古希腊和古罗马文化的起源)。另一路穿过中欧一直到达不列颠诸岛(他们是苏格兰人,爱尔兰人和威尔士人的祖先)。还有一路北上到了俄国,同时又有一路跨过伊朗,阿富汗最终到了印度。他们每到一处,就征服或同化当地的土著,把自己的语言传播到那里。” 在原始印欧语系的重建中牵涉到太多的专业推论,我在这里与不多赘述。 跟人类一样,众多语言总是从同一个祖先演化出来的。有人会认为现在众多的印欧语言是源自于这个语系中两个伟大卓越的语言,即拉丁语和希腊语。此话虽然不假并且这两门语言传承了大多数中古以来最有影响力的思想,但是推根溯源来说,希腊语和拉丁语只是语言演进过程中的一个中间产物,虽有里程碑式的意义,但是并不是始祖。(话说大家都知道宙斯是万神之王,有谁能说出万神之祖又是哪位神?)但是拉希二语却在学界推断原始印欧语之上助力甚多。在16世纪时,欧洲和亚洲逐步开始进行初级的接触,很多的商人和传教士开始学习当时较为主流的亚洲语言——梵语。在这个学习的过程中,人们逐渐发现东方的梵语和西方的拉丁语和希腊语有着较为广泛的相似性,所以之后语言学家就以上述假想推断,这些语言来自于同一个祖先,而这个祖先是什么,现在还无法得到世界公认的答案,但是学界在这个分歧上进行了一个模糊的定义——原始印欧语。 而印欧语发展至今,衍生出了数十种可以辨认的语言形态,而以下我想通过一个各语言词汇上的比较,让各位看客较为直观得感受到什么叫做较为广泛的相似性。 语言、词汇 月份 父亲 新的 鼻子 三 英语 Month Father New Nose Three 德语 Monat Fater Neu Nase Drei 法语 Mois Père Nouveau Nez Trois 意大利语 Mese Padre Nuovo Notte Tre 瑞典语 Månad Fader Ny Näsa Tre 俄语 месяц отец новое нос три 梵语 Mas Matar Nava Tas Trayas 从上面的表格中,我们看到现代西方很多主流语言在许多表达上都是趋向一致的,除了由于地缘造成的发音形式有所区别之外,只要的构词都是相近的。而梵语和俄语在于西方主流语言的对比中,也显现了相当大的相近性,从而进一步论证了印欧语系在地域上划分的合理性。 在总体谈论了印欧语系之后,我想在下面一个部分着重谈及现代印欧语系中较为代表性的两门语言——英语、法语。 - 英语 英语因为日不落帝国在大航海时代的全球扩张以及新大陆在新时代的强势崛起从而实现了对旧欧洲众多古老语言的强势逆袭。在语言学界,英语的历史时期共分为三段:古英语时期(公元449年至1100年);中古英语时期(公元1100年至1500年);现代英语(公元1500年至今)。而回顾“屌丝”逆袭众多“高富帅”的过程之后,我们可以发现在语言的世界中,胜在传播而非传统。 最早期居住在英伦三岛的人类文明圈是塞尔特文明圈(Celtic),而从印欧文明的发展时间轴上来看,塞尔特文明属于印欧文明最为西边的一支。史书记载,塞尔特人原先驻扎在德国南部,拥有十分强健的体魄,在较为寒冷的环境下依然生活地十分顽强。而因为某种不可抗力,在公元前500年时,该族向西迁移,最终渡过海峡,成为了印欧文明对英伦三岛的第一次“侵略军”。 所以说古英语的起源在于celtic民族,所以大家经常可以在英语区文化中看到celtic这个词语。在新世纪音乐(New Age)中就有一个叫做凯尔特女人(Celtic Woman)的组合,她们的音乐风格就是在新世纪音乐的风格下尽可能多融入英伦三岛当地的民歌元素。 而大家都知道,屌丝的逆袭都要分为各个阶段,第一次的文化入侵,只是让屌丝们了解了高富帅的优良血统,而时处公元5世纪的第二次入侵正式奠定了古英语的形成环境条件。 那时较为早起的日耳曼民族的四支部落,即央格鲁(Angles)、撒克逊(Saxon)、朱特、弗里西。这四个民族中,前两个民族对于古英语的形成的影响较为直接。央格鲁民族早起居住在石勒苏益格(Schleswig)地区,而撒克逊民族居住在离央格鲁民族不远的荷尔斯泰因(Holstein)地区。现如今,这两个地方合称石勒苏益格-荷尔斯泰因(Schleswig-Holstein),在德意志国最为北边的地方。在这四个民族横跨海峡进入英伦三岛之后,主要占据了英格兰地区,因为较为先进的“四大家族”对原先生活在当地的塞尔特民族进行较为残忍的驱赶政策,所以第一次入侵的“元老们”一边念叨着“大江东去浪淘尽”,一边狠狠地退守到了威尔士、爱尔兰和苏格兰高地。在这次文化大入侵就造成了英伦三岛世世代代的恩怨,也直接引致了英伦三岛在之后的国家制产生之时,三地更愿意作为联邦国家形成出现在历史的舞台,而同时三地更是充满着或温和或激烈的摩擦,特别指出的是爱尔兰作为塞尔特人血统最为纯正的后裔在争取独立权方面与英联邦各部的抗争是相当惨烈的。这次入侵很大程度上决定了古英语区的民族心态,所以在英伦三岛发生多数的历史事件与第二次印欧文明大入侵有着较为直接的联系。而退守外乡的塞尔特人在当时就显现出了腐国人民黑色幽默的气质:英格兰(England)一词出自于塞尔特人对于央格鲁民族占据的土地的“昵称”—Engle-Land,来自于大陆“角落”的人民所占据的土地,以显示自己“国中之国”的恢弘气势。(贱人就是矫情!被赶出去了还嘴硬!) 因为这次大入侵,英伦的主流文化受到了重新的洗牌。入侵者的语言逐渐形成了“古英语”,而因为迁徙地的源语言的影响,很大程度上,当时的古英语还是带有强烈的拉丁语言的影响,自己发展的空间其实不大。比如说,英语中的audio,video,kitchen等等的词语都是源自于拉丁语词根,而且动词偏多,如果有接触过拉丁语的朋友们会发现前两个的词语基本上就是拉丁语的词性变格而来的( videre-video)。 同时北欧的斯堪的纳维亚词汇对其也有一定的影响,但是名词偏多。原因是公元九世纪北欧人大举挺进英伦,几乎占领了整个东海岸,所以说这个环境下,以日耳曼语为日常语言的民族第二次入侵英伦,使其操持的古英语中大量融入当时北欧人的语言习惯和词汇。比如说egg,odd等等的词即源自于瑞典语的ägg和udda。而了解瑞典语的朋友也知道,其也恰恰是日耳曼民族渡过波罗的海峡之后将日耳曼语言带向北欧所形成的。举个栗子,很多在德留学的天朝童鞋表示,瑞典语虽然听不懂,但是很多标示上面的词语都是基于德语模板的,所以学会德语就可以在瑞典基本无障碍旅游了。在车站或地铁上比较常见的一个德语词就是Ausgang,名为出口,瑞典语中的说法为utgång,我有时会看到Ausgång这个写法。 第三次重大入侵是发生在1066年诺曼征服英伦之时。当时的诺曼地区已经形成了较为系统的法语体系,而这种体系由于长期与欧洲其他民族语言进行融合,使其从原始的多屈折演变成为了较少屈折。所以在法语融入英伦文明的过程中,古英语也迫使从多屈折演进成为少屈折的语言,这个改变宣告古英语正式进入中古英语的时代。在英语中的一些词,比如说annual,chamber,desire等等的都是源自于法语的annual,chambre,desire。有一个有趣的现象是产肉的动物多是英语词,比如cow,sheep,deer,而它们的肉则是法语词,如beef,mutton,venison。大概持法语的多为贵族统治者,只注意他们餐桌上的肉,并不在意牲畜们叫什么。 语言体系的简化虽很大程度上抹去了较多的原始文明的迹象,但是在传播文明的方面却带来了更大的胜负手。1399年继承王位的亨利四世是第一个以英语为母语的英国国王,其昭示了英语逐渐受到了英国高层的认可。而随着大英帝国开始工业革命,并不断向着世界各地进行扩张,现代英语的基本框架正式敲定。而在1800年之后的两百多年中,英语的发展给我们带来一个启示,在语言的世界中,传承传播的理念要重于传统的理念。自此,中古时期的正统日耳曼语族遭到了屌丝英语的逆袭,而作为国际上唯一认可的交流语言,它的崛起带有着更多屈辱的意味,然而逆袭终究是逆袭,王侯将相宁有种乎。 - 法语 法国在国际上自称为高卢雄鸡,自认为是高卢人的后裔。其实说这句话的性质就像我们天天说自己是炎黄子孙一样没有根据。其实在罗马进驻高卢之前,该区一直是塞尔特族的影响范围,所以很大程度上英法两门语言在两千年前是一家人。但是高卢地区在公元前二世纪落入了罗马的统治,所以法语从那个时候就开始了与以拉丁语为代表的罗曼语系的融合。 由于高卢地区远离教廷,所以该地操持的拉丁语更加俚语化,导致了这种通俗的拉丁语在高卢地区的演进走上了一条完全不同的道路。教廷在之后的时间内不停向西面扩展,使得高卢地区使用的拉丁文受到了其他语言体系的影响,尤其是另外一门伟大的中古语言——希腊语的影响。同时,该地的法语在音韵和构词上都发生了不小的变化。其中的一条音规直接导致了拉丁语语音体系的重塑,即重音规律。再加上高卢地区在公元五世纪受到了日耳曼民族的入侵,而使得该地的拉丁文又带上了十分浓重的日耳曼语族的特点,很大程度上加固了重音规律在高卢拉丁文中的地位。(日耳曼语族有着十分明显的重音现象。)同时,日耳曼语族中颇多的单字也得到了引进。比如说,法语中的东(est)、南(ouest)、西(sud)、北(nord)就是来自当时罗曼语族。这个时段也开启了古法语时期。 当时的古法语与现在的法语体系和当时的拉丁语体系都相当不同。在那个时期,古法语有双格位体系的出现,也就是阳性名词和形容词上所凸显的主格(主词)和斜格(受词)。学过拉丁语的朋友都知道,拉丁语有六个格,分别是主格、属格、与格、宾格、夺格、呼格。六个格的存在赋予了拉丁语的语序自由。我这里举个栗子:在电影《V字仇杀队》里面出现一句《浮士德》中的名言,即Vi veri veniversum vivus vici,意思是by the power of truth, I, while living, have conquered the universe. Vi原形为vis,意为by the power;veri原形为verus,意为truth;veniversum原形为universus,意为universe;vivus意为living;vici原形为vincere,意为have conquered。大家可以看到拉丁语通过格位赋予语序上的相对自由。同样在古法语的规则中,主格和斜格的的差异主要在字尾有无词性变化词尾-s上。按照相关文献中的例子来讲,“拉丁文murus产生古法文murs,而muri、murum、muro则合并为mur。就复数形态而言, muri成为mur,而muros、muris则合并为murs。主格单数与斜格复数及主格复数与斜格单数是由定冠词或某些类似的修饰语(指示词或所有格形容词)来区分的。结果,li murs意思是墙(主词);le mur墙(动词或介词的受词);li mur墙(复数)(主词);以及les murs墙(复数)(受词)。”所以同样,这种规则也赋予了古语法在语序上的相对自由性。 而从十三世纪开始,法语的现代模板渐渐形成,即双格位的现象渐渐转变为以形容词和名词为模板的格位体系。也就形成了现在大家所熟知的现代的标准法语。由于一定程度上依然沿袭着拉丁语的严肃性,所以像法律条文这种严谨的重要文件在国际上都是用法语书写,联合国将法语为第一书写语言。 汉藏语系 结束了印欧语系的叙述之后,我要把各位看客的眼球引到同一个大陆,但是最东边的地区。在那里,汉语的语言作为“扛把子”的带头大哥,带领了众多“小喽喽”,并称为汉藏语系。虽然,汉藏语言因为汉语的存在,所以其历史深远的程度远远大于很多印欧语系的语言,但是具有讽刺意味的是,学界对于汉藏语系的研究不仅没有像印欧语系的研究那样深入,甚至对于其起源、发展、演进中的众多关键性问题还有待解决。 从学界的角度来分,汉藏语言分为四个语族:汉语、藏缅语族、苗瑶语族和壮彝语族。其实还有一些难以界定的语言存在,比如说越南语。有证据表明,越南语有很多的词都直接来自于汉语,所以很多学者认为其为汉语的远亲,但是因为构字方法不同,所以很难确定其真实性。 - 汉语 针对汉语的理解,我肯定没有汉语言文学的学者了解的多,但是由于要服务于整篇文章的结构,所以我略微谈一下。 如同所有具有悠久历史的古老文字一样,汉字在形成之初是为了辅助当时的原始语言。当时的人类社会虽持有的信息不能算是多,但是也有无法记忆的时刻。这时,汉字便出现记录那些当时社会较为重要的信息。同时,因为当时文字系统相对来说较为简单,而以视觉印象记录的信息较为容易获得保存,所以最初的文字系统都是以象形作为逻辑基础。而“史书”记载的“仓吉造字”只是中华文化的一大粉饰,不能算是“史实”,而应该算作“神作”。之后,在象形文字发展到较为完善的程度之后,古老的汉文明先祖们发现,很多的信息已经无法仅仅使用象形逻辑来记录了,于是衍生出了形声的逻辑。春秋战国时期的剧烈而又频繁的交战虽然使得民不聊生,但是很大程度上还是促进了各地区各民族的大交融,这是大江南北的众多新兴概念发生了交换,由于在当时各地使用的文字并没有统一,所以处理这些新概念的方法较为不同,我们就拿之后成为统治文字的秦篆来说,因为当时的形声的逻辑已经发展到了较为成熟的时期,所以在这个大熔炉的时期,秦篆的形声字大增。在很多时候,每有新概念的引入,秦篆就通过使用形声逻辑创造一个新词来应对新事物。这个方法免除了用句法解释的麻烦,所以秦时代见证了形声逻辑的大发展。 虽然自秦朝来,汉语的文字系统在大多时候都是统一的,但是由于地方发展环境的差异,所以方言系统也在这种统一的大背景下另起炉灶。同时形声逻辑的发展壮大也使得方言系统不断自我充盈。而方言的纷繁多杂一方面成为各地交流的一个屏障,但是很大程度上更是各地民族性格和文化的载体。海德格尔说:语言是存在的家。方言的存在让某一特定种群的人在偌大的中国大地上多了一份认同感和存在感。同时在现在这个“天下一统”的时代,后者的意义远远重要于前者的困扰。 在我游历祖国大好江山之时,我也尝试学习当地的方言。除了好似来自外星球的潮汕话和温州话之外,我多少能够侃上几句,也同时发现各地方言的可研究性丝毫不差于其他的语族、语系或者语言。因为在文章开篇处已经略微介绍过上海闲话了,那这里我就重点谈一下长沙话。 - 长沙话 长沙也算地处中南富庶之地,建城时间为公元前二二一年,已经将近有2400年的时间了。这样的历史环境为长沙方言的形成提供了较为充沛的时间。由于地域没有沿海城市那样交通便利,所以说该方言的形成环境较为封闭,形成风格较为独特。而我在这里谈论的长沙方言值得是广义长沙地区所操持的乡音。 首先从语音上分析,除轻声外,共有六个阴平、阳平、上声、阴去、阳去和入声6个声调。而音调则分别对应着上述的阴平、阳平、上声、阴去、阳去和入声六个声调。这个音规使得长沙话在情绪表达上面有着较为丰富的形式。同时,长沙方言最具韵味的语调就要数在发音上扬的时候。有一句话:湘音缭绕、楚语云飞,说的就是长沙方言在语调上扬时的独特韵味。如果大家身边有长沙朋友,你可以让他们发一下“嬲”这个词音,我保证你心情再差,也会照样原地满血复活。 在很多词汇的表达上面,长沙方言更多使用象形的逻辑,比如说,长沙人特别喜欢使用“脑壳”两个字再加上相应的动词来表达一种状态。举个栗子,“棒哒脑壳”就是形容脑子进水;“叫脑壳”就是形容比较务虚的人。还有,湖南的麻将文化也能非常恰如其分得体现出该地方言的特殊,我从网上摘录下了一段比较经典的方言段子: 女:你快点放萨!又不是输你那堂客! 男:等哈子咯,催韶啊! (空一会) 男:跌跌跌,把杂鸟索把你。 女:踩一脚,我恰哒。 男:嬲!你随么子哈恰得进咯! 第一句意为:你快点打出去,打输了跟你老婆又没关系!这句话其实来自于湖南非常有名的相声组合奇志和大兵所表演的一个段子中的节选,其中的“堂客”就是老婆的意思,起初学习长沙方言的时候,一直认为“堂客”是顾客的意思,但是了解的“客”其实有主人的意思后就豁然开朗。“大堂的主人”非老婆莫属,从这句话便可以看出湖南女人在家庭单位中的占据的较为强势的位子。 第二句意为:等一下,都被你催死了。长沙方言中经常把“死”字放在嘴边,看起来粗俗,但是缺了这个词就很难表达激动情绪。在文雅择言和激情放肆之间,长沙人民毅然决然得选择了后者,也是这种选择决定了长沙人民的总体性格特征。 第三、四句意为:给给给,给你个一索。等一下,我要吃。其中的“踩一脚”特别有意思。在老长沙,中巴车不会站站都停,如果你到了,你就必须要跟司机说“司机,油里踩一脚。”所以“踩一脚”就衍生成为等一等的意思。 第五句意为:娘希匹,你丫什么牌都能要!看你会不会长沙话,只要听“嬲”这个词发音是否到位。而这个词也是长沙当地表达愤怒情感最为普通、也最为有韵味的一个词了。 在生活中很多人会说“常杀人”好凶哦,说话好凶哦,其实都是因为长沙方言的特有的发音和词汇体系。也正是语言承载的民族性格能够撰写下四次长沙会战这样的壮烈篇章,所以毫无疑问的是,长沙方言(湘语)对于整个中国方言体系,甚至是中国历史的重要意义,虽然其并不像北京方言那样不停地向外输出,有着不可否认的统治意义,但是自成一派并且养育一批开创新时代的伟人便完成了湘语在历史上最为重要的逆袭。 在了解完中国大陆的“统治语言”后,我要向大家顺便提下中国境内其他的语言。因为中国境内民族的多样性,不同的文化操持不同的语言,所以语言也相当多样。文献统计“北方的语言多属阿尔泰语系,有属阿尔泰语系突厥语族的维吾尔语、 哈萨克语、乌孜别克语、柯尔克孜语、塔塔尔语(鞑靼语)、撒拉语(青海境内的撒拉族);阿尔泰语系通古斯语族的满语、锡伯语、鄂温克语和鄂伦春语;阿尔泰语系蒙古语族的蒙古语、达斡尔语、东乡语和土语(青海土族的语言);还有印欧语系的俄语和伊朗语族的塔吉克语等等。南方的语言多属汉藏语系,除了上文提到的汉-藏语系诸语言外,尚有属南亚语系孟-高棉语族的佤语和德昂语、布朗语,以及属南亚语系印度尼西亚语族的高山语(台湾高山族)。” 亚—非语系 亚—非语系旧称闪含语系(闪米特—含米特语族),这个说法最初源自于圣经中挪亚(נח)儿子的名字,其中他的儿子闪(שם)是希伯来人和亚述人的祖先,而另一个儿子含(םה)是非洲人的后代。从亚-非语系的族谱来看,亚述人是阿拉伯人的祖先,所以很大程度上阿系在意识形态上源于一家。(假如有伊斯兰极端主义者看到请谅解,我只是在宗教神话的基础上稍加了一点推论而得出上述结论。)我选择在印欧语系和汉藏语系之后提到亚非语系是因为抛开覆盖范围最广和使用人数最多而言,亚非语系是最古老文明的发祥地,同时起源于该处的拼音文字是众多语言当之无愧的祖先。 也许不学习亚非语系的童鞋对其分类丝毫不知,即使将其按照列表分类也会觉得不知所云。 地理分布: 非洲之角、北非、中非北部、西非北部、西南亚 谱系学分类: 闪含语系 分支: 柏柏尔语族 乍得语族 埃及语族 (已灭绝) 闪语族 库希特语族 奥摩语族 以上是学界公认的对该语系分类。实话说,我研究语言这么久,其中能分辨出的也仅仅是乍得语族、库希特语族和闪语族其中的一部分,能大略阅读和交流的也只是区区的阿拉伯语和古希伯来语罢了。可想,在这个语系中,语言的种类有多少繁杂。而其中较为主流的语言就数同为闪语族的阿拉伯语和希伯来语了。 - 阿拉伯语 阿拉伯语作为一门语言是社会统一的结果,而更为早期,亚兰文作为该地区较为流行的公认语言为人所操持。由于出现的时期较为久远,当时的宗教系统还没有完全成形,所以亚拉文成为旧约圣经后期书写时所用的语言,及被认为是耶稣基督时代的犹太人的日常用语。这对该语言的传承具有重要意义。公元前6 世纪以前的2000年中,古代语言阿卡德语的两种方言──亚述语和巴比伦语──在近东广为通行,但到公元前6世纪,阿拉米语逐渐取代了它们,成为近东的共同语言,其后又成为波斯帝国的官方语言。基督教《圣经》的《旧约全书》 中有一部分是用阿拉米语写的,历史传说认为,耶稣也使用阿拉米语的一种方言。而在亚兰语成为波斯帝国的官方语言的数百年之后,其语言开始演化,一部分保留亚兰语成为现今的波斯语;还有一部分便脱离这个框架成为阿拉伯语和希伯来语,希伯来语在下一部分中详述。 与其他所有古老语言一样,阿拉伯语也经过了一段时间非常长的同化期。在当时各部落使用的古阿拉伯语有诸多用词完全不同的方言。比如说,在当时对于“灾难”的表达就达到惊人的400种之多,所以民间流行一句谚语“学习灾难就成了灾难”。 之后,因为麦加成为伊斯兰教的权力中心,直接促成了古莱氏人的语言成为了阿拉伯人的通用语。而伊斯兰教经典古兰经便是由古莱氏人的文字写成的。之后古兰经和古莱文互相促进,不仅古兰经成为了阿拉伯地区伊斯兰教徒的通用宗教圣典,同时古莱氏文也成为了阿拉伯地区通用的标准语言,在之后成为了阿拉伯标准语(اللغة العربية)。 在阿拉伯语标准化的发展演进中,语言的字母表达形式一直在改变。原先的阿拉伯语是没有音符的,甚至在有一些古典文献中,比如说“古兰经”,不但没有音符,连基本的“ا‎”、“ﻭ‎”、“ﻱ”柔音字母(这些字母本身也能发音,但是在组词中是作为长音符为前面的字母做辅音的。)都没有,造成了很大的阅读障碍,所以说,在阿拉伯语演进的初期,文字的阅读是一件较为困难的事情,所以学习古兰经其中的内容需要超出想象的天赋和毅力。 同时当时阿拉伯文的所使用的“古体书法”——“库法体”也对学习阿拉伯语的人造成了比较大的麻烦。(如下图) 因为发现了这个问题,公元八世纪的伍麦叶王朝末期增加了阿拉伯语的注音,再加上了上述的三个柔音字母,同时也创造了一种相当于中国的“正楷书法”的“纳斯赫体”。(如下图) 也就是下图中何炅老师背后黑板上书写的书体。(何炅老师我好崇拜你,我是看着你的节目长大的!) 形成阿拉伯标准语后,阿拉伯语的传播达到了顶峰,然而虽是得到了难度上很大的简化,但是其固有的语言特点还是让其成为了世界最难学习语言的第三名(第一名:汉语;第二名:希腊语;第三名:阿拉伯语。中国人很自豪有木有!)。 阿拉伯文字是一种音位文字,自右而左横写。共有28个辅音字母,除其中有3个可兼起元音作用外,无专作元音用的字母,可在字母上方、下方加符号表示,但这些符号通常是省略,只在初级启蒙书中和《古兰经》版本中出现。阿语28个字母发音部位,很有动感,声音响亮。语音的特点是 :(1)喉音、顶音和咝字音多。(2)有长音和短音的区别。(3)有叠音。(4)冠词的不同读法。特别是六个喉音字母另外有带“哨”音和“嘶”音的字母,另有“舌颤音”或称“舌弹音”,发音时由于舌头在口腔多次快速弹动,将音发出,形成欢快悦耳的节奏。这个发音至今仍是阿拉伯妇女表达心中喜悦的一种特有方式。其它字母也各有特色,发音都具有鲜明的表达特征。 阿拉伯语的构词法有独特的规则,每一词汇大都有其内部词根和派生关系上的曲折变化,通常一个词根可派生出若干含有不同时态的动词和不同含义的名词。构词时先由几个辅音搭成词根框架,然后填进不同的元音,或附加词缀,便形成表示各种不同概念的派生词(正是因为这个原因,阿拉伯语的书写体系可以不表示元音,而由读者自己去填入正确的元音。因在世界语种中独具dad(达德)这一顶音而有“达德语”之称。 这段来自百度百科,看了半天还是不知道写的是什么,那我就拿古兰经其中的一句话来具象地分析一下阿拉伯语的语言特点。 بِسْمِ اللَّهِ الرَّحْمَٰنِ الرَّحِيمِ 意为بِسْمِ“以…之名” 意为اللَّهِ“安拉”,此为穆斯林的神,万能的神。 意为الرَّحْمَٰنِ“慈善的” 意为الرَّحِيمِ“仁慈的” 其实我发现,用中文解释阿拉伯语的语言现象有点别扭,因为各自语言系统演进的方式不一样,造成其在互译的时候带来诸多不便。而用英语解释就能看出一些名堂。 بِسْمِ means in the name of… اللَّهِ means Allah الرَّحْمَٰنِ means the beneficent الرَّحِيمِ means the merciful 从英文注释中看出,下面两个对安拉神的形容的词汇置于名词之后,而同时前面有الرَّ这个不定冠词修饰该形容词。形容词的表达上也有一定固定的规则,由于安拉神是位男神,所以形容词的附加词缀为“i”音。(敏锐的看客们到这里可以发现,这个语法和法语的形容词变化有相似之处。)名词不同的性别会带来形容词不同的词缀变化,也就是填上不同的动符。这就是上文所提到的语法现象。同时阿拉伯语中“太阳字母”和“月亮字母”之间的区别也会造成前面冠词上面的不同。可以看出,阿拉伯语的语言结构相当复杂,不过其中包含的有趣的古老文化现象也是相当迷人的。 - 希伯来语 作为犹太人的语言,希伯来语是世界上最古老的语言之一。然后,在希伯来语的形成历史中还出现了古希伯来语的身影。也许有人会将希伯来语和古希伯来语的关系和汉语和古汉语的关系做一个类比,但是由于汉语和古汉语的演进过程较为封闭,并没有太多的外来文化进行干预,所以其演化基本是跟随着国内社会环境的不同而变化的,总而言之,现代汉语和古汉语终究是直系的关系。但是现代希伯来语和古希伯来语之间的关系却了然不同。古希伯来语是腓尼基文字的间接传承者,与希腊文字出现的时代几乎一样,虽然身处不同的语系,但是两者使用的字母体系都是传自更为古老的西方闪米特字母体系。虽然从现在看来,除了一些借用词上有所重叠,其他的并无相像之处,但是同根同源的事实却无法磨灭。 希伯来语虽有古用和现代之分,但是其在总体语言特点上变化不多。和阿拉伯语一样,希伯来语起初并无元音字母,字母表上的22个字母起初都是辅音字母。而因为发音的需要,聪慧的闪米特先祖通过在字母的周围加上不同形态的符点来帮助发音,从而形成希伯来语正字法中的5个元音音位。举个栗子: 意为“这条大的、好的鱼是我的。” 大家可以看到在希伯来字母下面有很多符点,其中不同的元音和字母组合可以形成不同的发音。跟阿拉伯语一样,更多时候,这些元音符点是不会出现的,所以需要语言习得者自行填入元音使其成为有意义的单词和词组。就像下图一样(下图是以色列当地报道习近平访以)。 其实这种表音和指意分开的语言现象在众多古老语言中都有多体现。早在五千五百年前差不多与埃及人同时,生活在幼发拉底河与底格里斯河(希腊人称为美索不达米亚,意即“两河之间的地方”)的苏美尔人也有了自己的文字。他们最早的文字也是图形符号,一符一义。以后发展为表音符号和指意符号,一起组成词组。自从有了表音和指义符号,字符孳乳增繁的倾向减少,到了约四千三百年前,字符减少到了六百以下,其中约有一百个是表示音节的符号,但是没有单独表示辅音的符号。发展至腓尼基之后才开始有了辅音符号。而在远东的中华地区,文字的演进也同样形成了两套语言系统——表音和指意,即汉字和拼音。 作为现存世界上最古老的拼音文字,希伯来语不仅在语言体系上独树一帜并开辟了一种全新的文字表达方式,同时其历史演进过程也同样绝无仅有。 学界将希伯来语的发展划分为了四个阶段: 第一阶段是公元前3世纪之前的古希伯来语的时代,史书又称圣经希伯来语时期。由于该时期历史久远,所留下的文献少之又少。主要的留存文献都与《圣经》有关。从统计学角度来看,圣经及相关文献中使用的文字有99.9%是由古希伯来语写成,其余的由亚兰文写成。古希伯来语在这个时代的重要缺席,使得其他古老的西部闪族语成为了研究古希伯来语的重要工具。史料记载“创世记的族长故事显示亚伯拉罕的家人是用亚兰语的,族长及其后代定居迦南时似乎学会了一种迦南方言。雅各用希伯来文及一支石柱命名(创三十一47),而拉班用亚兰文谈话。”在希伯来独立王朝期间(主前十到六世纪),有很多腓尼基的碑文、摩押石版,以及在北叙利亚沿岸Ras Shamra找到的乌加列泥版,都对了解希伯来语言,有很大的帮助。其中的摩押石版更说明了希伯来文与摩押文的“亲密关系”。在文字发展方面,乌加列文的楔形文字虽尤较腓尼基及摩押文远离希伯来文;不过,由于乌加列文的文学,无论量与质都胜过其他古文,所以更能帮助我们了解希伯来文和旧约时代的日常生活。(上文所提的迦南文、摩押文、腓尼基文、乌加列文和希伯来文都属于西部闪族语系。) 第二阶段是公元前后的拉比希伯来文。在这个阶段,犹太教的发展已经超出了古希伯来语能驾控的范围了。于是亚兰语逐渐替代古希伯来语成为了现金巴勒斯坦地区主流的官方语言。公元70年,罗马提多将军,带领10万军兵围攻耶路撒冷,进行大规模的屠杀,超过100万人惨死。犹太人从此再无立足之地,纷纷往外逃亡,漂流异邦。 第三阶段是公元6世纪到13世纪的中古希伯来语。这时候的希伯来民族已经亡国400多年。犹太人散居在三个大洲上,依然坚定不移地信仰着“心中的神殿”。那时候的希伯来实际上已经成为了死去的语言,和拉丁语一样落得同一下场,但是不同的是,拉丁语的死亡是因为语言系统的演进成为更为现代、平民化的语言,而古希伯来的覆灭则是人为的外族侵略所造成的。不过,由于希伯来语仍然以宗教语言的形式存在,所以其和拉丁语殊途同归,成为了一门独立学科受到研究,即希伯来学。 第四阶段是19世纪末以来的现代希伯来语。现代希语的产生与犹太复国有着直接的联系。圣经有言“我在怒气、忿怒、和大恼恨中,将以色列人赶到各国,日后我必从那里将他们召聚出来;领他们回到此地。”(耶利米书32章37节)“我要将以色列人从他们所到的各国收取,又从四围聚集他们,引导他们归回本地,我要使他们在那地,在以色列山上,成为一国,…他们不再为二国。”(以西结37章21-22节)谁都不会把2000多年之前的语言当真,(就像玛雅预言世界末日那天,我和前女友手挽手在逛街。。。)但是没想到还真被耶和华老人家言中了。从概率论上分析,该事件属于极小概率事件,但是拉长事件的时间轴,事件定会发生。但是由于该事件非独立事件,众多因素会使得事件发生的概率进一步发生改变,而在人种学的理论中,无论什么民族,一旦亡国失去聚居地超过五百年,必定会被其他的民族所同化,这个理论进一步使这个概率降低到了近乎不可能的地步。但是它还是发生了。 以色列复国的过程只能用神迹来形容。推开犹太资本家在这个过程中的斡旋作用,其建国的政治和军事过程只能说是世界国家史上最大的奇迹。1948年5月14日,以色列国正式建立,并立即成为联合国成员。在建国之后短短的几个小时后,便爆发了第一次阿以战争,本是悬殊的兵力差距,但是等到阿军攻进圣城之后,各番号突然各自为政,变成一盘散沙。然后以军以守转攻,让第一次战争以阿军的惨败而结束。而之后的三次战争都是以极其奇幻的转折宣告了圣城的胜利。而在神助复国之后,以色列国在文化上进行大一统,启用了由立陶宛犹太人本-耶胡达所创造的现代希伯来语系统,此系统建立在古希伯来语之上,所以有一定的重叠之处。我没有学习过现代希伯来语,所以其之间的区别我只部分了解:在发音上面,现代希伯来语合并了很多擦音,同时元音上也取消了长短对立的规则,总体使得现代希伯来语成为一种更加容易学习的语言,更有助于语言的传承和传播。 马来亚-玻利尼西亚语系 写完了上述最为主流的三种语系之后,我要将各位的思维拧回亚欧大陆的东南亚地区。东南亚已经成为较多国人的度假之地,旅游区的大多数当地人操持着英语或者中文的其中一种,但是远离旅游区的更大部分的东南亚地区的语言种类繁多,一国一语。因为大部分的地区都是有丛林覆盖的,所以我更喜欢将这地区的语言统称为“丛林语系”。 虽然这个语系对世界语言的贡献相对较小,但是在地域上,它基本涵盖了所有赤道附近、南北回归线之间的地区。该语系和孟-高棉语系(主要是柬埔寨的高棉语)和印度南部的蒙达语系合称“南亚语系”。它包括四种国语:马来西亚语、印度尼西亚语、他加禄语(菲律宾语)和马拉加斯语。 古马来语从公元7世纪就开始成形。那时的马来语实际上是由大量的梵语词构成,并没有很强的独立性。公元14世纪,由于马来语已经成为了南洋群岛的公认商用语言,所以马来语渐渐演化出现了标准格式,从而成为当地的官方语言。其实还是不难看出,马来语中有很多梵语和阿拉伯语的概念。在文字系统上,马来语起初使用的是印度的帕拉瓦文字,但是到了14世纪出现简化标准马来语之后,文字又改用了爪宜文字,其是阿拉伯字母的变体,而在殖民时代,英国人又将其改为以拉丁字母为系统的语言。一波三折。 而马来语和印度尼西亚语从根源上来说是同一种语言,印尼语源自于苏门答腊岛东北部的马来语,是该语言的一个地区性变种,同标准马来语有超过80%的同源性。不过在拼写系统上,两者却有较大的差异,因为印尼文的系统是由荷兰人发明的,而马来文的系统是由英国人发明的。但是出于政治因素的考量,语言学界还是将其划分成为两种不同的语言。而源自菲律宾的他加禄语的身世却没有足够的研究支撑。我们可以粗略认为他加禄语可能源自于民答那峨岛的东北部或维萨亚群岛的东部,再加上该地多达几百种的部族语言使得他加禄语的身世更加扑朔迷离。 由于我接触该语系的机会不多,唯一的了解也只是其旁支语系中的高棉语。但是从高棉语中,我发现该地区的语言特点在发音上相当明显,开口音较多然后鼻音较重。 因为东南亚地区长期受到西方的殖民政策的统治,其语法结构受到了很强的西方语言结构的影响,所以大多为分析式的语法结构,即主—谓—宾结构。而且本土文化对于语言的控制渐渐流失,掺杂了太多外来的借语,从而使得该地区的语言在我的眼中有种“不伦不类”的感觉。于是我将这种现象称为“语言沦陷”。 尼日尔-刚果 最后将话题引到非洲大陆。提到非洲,停留在大家心中的印象一定是沙漠。而恰恰是这个环境问题,使得非洲人民的生活条件较为严苛。同时,该地区没有迁徙的概念,多数人口依绿洲而居数百年,造成该地区的语言有一定的封闭性。据统计,非洲有1000多种语言,各种语言之间的相关性并不大。语言问题可能是限制非洲发展的挚踵,也是众多学家致力于梳理的一个问题。 其实非洲语言史和南亚语系一样都是一部屈辱的殖民史,下面的图表可以帮助大家理清非洲语言的分布情况。 从上图可以看出,非洲的语言情况和南亚地区的情况相似,有着非常明显的殖民现象。但是由于民用和官方系统存在双轨制现象,所以又和南亚地区的情况又有所不同。因为当地土著语言依然还在当地沟通中扮演着较为重要的作用,所以说非洲地区的文化还原度较为高。回到上左图,我们看到非洲北部地区基本是阿拉伯世界国家,所以文化上更加倾向于中东地区,从语言地缘学角度来说,该地属于闪含语系影响地区,所以不属于这部分讨论范围。而非洲地区影响力最大的语言要数尼日尔—刚果语系了。 当然,因为非洲地区“一村一语”的现象,所以该语系涵盖了众多语言,或大或小,而其最重要的分支是图班语,操持图班语的人口占到了语系人口的一半。学界研究发现,“持班图语言的民族最开始是发源于二千多年前的喀麦隆,也就是班图语言区的最西北角。可能是因为他们从近东地区学会了种植某种农作物后,由于这种作物的适应性,他们随之逐渐朝东、南迁移,最终布满了由此往南的整个非洲大陆。” 而图班语中最重要的语言就数斯瓦西里语。作为一块旧世界的“殖民”大陆,斯瓦西里语在众多西方“高富帅”语言中强得一席之地,并成为众多非洲国家官方语言也算是非洲本土文化的一种骄傲。 而斯瓦西里语的较高地位是有其历史原因的。斯瓦希里语传统上被认为是阿拉伯治下桑给巴尔的语言,由于阿拉伯奴隶和其他商品贸易沿海岸传播。最初是因为来自桑给巴尔以外的大陆当地人被作为奴隶贩卖而随之传到桑给巴尔的,还是桑给巴尔本地就有本地黑人居民,尚不知晓。无论如何,阿拉伯商人从至少6世纪就开始和沿海居民有密切的联系,伊斯兰教也在至少9世纪开始在东非海岸传播。作为传播语言,其在演进发展的过程中就得到了与其他民族语言相融的机会,从而使其语言结构更加易于传播。 所以斯瓦西里语中出现很多阿拉伯语的借词,甚至其语言名字本身也来自于阿拉伯语سواح,意思为沿海之地。而在语法规则中,斯瓦西里语把名词化为几种类型,不同类型加上不同的前缀。举个栗子,单数带有m-前缀/复数带有wa-前缀的类别中的名词都表示人类。例如:m-toto“孩子”,复数wa-toto“孩子们”名词的单数ki-前缀在复数中变成vi-前缀。 在现代非洲,民族语言更像是一种方言,熟友之间使用较多。更多时候,西方殖民所引进的官方语言成为了现代非洲主流语言,如科特迪瓦(Cote d’ivoire,法语意为象牙海滩)。这样的让位是一种趋势,但是却不利于非洲地区各民族文化的传承。 结语 本文谈及的语系、语族和语言几乎涵盖了世界上最主要的语言。虽然洋洋洒洒,但是提到的依旧仍是语言总数中极少的一部分。由于语言的特殊多样性,其他无力或无法提及的语言更多属于没有大规模传播的小众语言。有价值,但是无寿命。我惊叹于语言世界的广博,虽有心但仍无力进一步完善我脑中的语言版图,写下这寥寥万字,也算作为一个结束。 后记 起初提笔写这篇文章的时候,更想带着戏谑的语气用一两千个字来粗略写写语言对于我大学生活的重要意义,但是没想到越写越认真,也没想到能完整得书写下这几年用业余时间学习得来的语言学知识。在写完的那个瞬间,更多的不是自豪,而是感动。(这里略有些矫情。。。) 从高中开始锻炼翻译,慢慢从中级口译学起,到大学的CATTI二级翻译证书,到之后毁灭性的翻译职业葬送,再到之前的重新拾起翻译这份事业,也许我并不能成为一名优秀的译者,毕竟我没有时间终日细磨我的翻译表达和水准,但是我认为我是合格的。合格并不只在于我拥有译者的能力,而更是在于译者所怀有的奉献的心,为身边的人付出,为这份事业付出。很遗憾,我人生第一本由我独立翻译、独立校对、独立制作的王小波译本没有成功送达它的主人手中,但是我相信这只是一个开始。 最后我想用法兰西前总统萨科齐先生卸任演讲中一句话结束我的啰嗦。 Je veux vous dire les choses du fond de mon cœur, je veux vous puissiez réfléchir et comprendre que quand on défend des valeurs, la seule façon d’être crédible, c’est de les vivre. (我想要你们思考,想让你们明白,一个人若想捍卫自己提倡的价值,唯一令人信服的方式,就是必须去亲身实践这些价值。) 我和大家一样都怀有最为深刻的梦想,也拥有独一无二的价值。四年时光,我发现我的梦想时常水土不服,在这个并非绝佳的追梦环境中,我极其疲惫,有时也遍体鳞伤,但是从不停顿实践我心中梦想的价值也让我的梦想成为了伸手可以触及的事业。我相信每个人心中都有一个冠军,不管是DotA冠军还是ACM冠军,本质来说都是野心最终的寄托。好好奉养这份关于梦想的野心,该鞭挞时候鞭挞,该呵护时候呵护。野心的茁壮成长会帮助你实现人生最华丽的逆袭。还有记住,暗透了才见星光。Viva la vida ! 上海交通大学材料科学与工程学院2013届毕业生 黄远杰 2013年4月19日于新图
2691 次阅读|1 个评论
学车杂记(二)交通标志的语言学
qianlivan 2013-4-16 19:51
交通标志是交通系统不可缺失的一个部分。仔细想想,交通标志其实是一种语言。事实上交通标志中还有相当的部分是由通常的语言组成的。 原则上可以使用写有语句的牌子作为交通指示之用,但是这样的指示牌缺乏可读性。在快速行驶时从这样的指示牌难以获得有效的信息。交通标志所做的事情就是将通常语句中重要的部分图形化,将这些内容进行突出,让人能很快获取。这和语言是等价的。 不过,交通标志不是完备的语言,它们只能表示部分的意思。即使是和交通非常相关的意思有时候也不能完整表述,而需要由通常词语、语句组成的辅助标志。有些交通标志是基于词语的,比如禁止某种车辆或行人通行的标志,一个带斜杠的红圈表示“禁止……通行”,而圈内的符号就表示某种车辆或行人。但有些标志是基于短语的,比如限速标志,红圈内写50,意思是速度不得超过50千米每小时,在这里,红圈本身并没有“不得超过”的意思,因为禁止通行标志也有红圈(当然,很多表示不得超过的标志都有红圈,所以可以认为红圈在和数字组合时表示“不得超过”)。 对于交通标志来说,不完备不是问题,只要在辅助标志的帮助下对于要传达的交通信息是足够的就可以了。而真正重要的是自洽。交通标志是一个系统,很多标志是配合使用的,如果改动了一个,其它的有可能就需要作相应的更改。比如,在路口设置一个禁止左转的标志,地面上就不能有左转标志;地面上有左转标志,就不应该设置禁止调头标志,如此等等。 正如语言在不断演化,随着时间的推移,交通标志也将会发生变化。但无论如何变化,简洁和自洽都是必须满足的要求。
个人分类: 生活点滴|13530 次阅读|0 个评论
《中国语学文库》征稿启事 (总主编:邢福义先生)
xscb 2013-3-30 13:36
“珍爱中华语言文字,建设中国特色语学” 中国出版集团 世界图书出版公司 《中国语学文库》征稿启事 (总主编:邢福义先生) 语言学是一门现代领先科学,我国语言学的发展会促进世界语言学的进步。 中国出版集团 世界图书出版公司 ,秉承“ 把世界介绍给中国,把中国介绍给世界 ”的办社宗旨,历来重视语言学类图书的出版,目前已出版《西方语言学经典书系》、《西方语言学前沿书系·语料库与计算语言学研究丛书》、《西方语言学与应用语言学视野》、《外国语言学名著译丛》等语言学丛书。 “ 中国语言学要有一颗中国心 ”,世界图书出版公司学术出版中心,精心策划 《中国语学文库》 图书系列 , 特邀我国著名语言学家、华中师范大学资深教授 邢福义先生 担任总主编,以 “珍爱中华语言文字,建设中国特色语学” 为宗旨,力求推出具有中国语言学特色的最新研究成果,促进我国的学术发展和文化繁荣。 《中国语学文库》 征稿范围 包括汉语研究、民族语研究、外语研究、理论与应用语言学研究等。书稿要求“齐、清、定”,注释、参考文献等格式规范、统一。 《中国语学文库》第一批拟出50部作品,经学术专家匿名评审,遴选出5—10部最优秀作品,由“中图学术出版基金”提供全额资助出版,其他通过作品参考专家评审意见给予数额不等的资助。 《中国语学文库》系列图书,经出版方与作者签订出版合同后出版,采取一书一号,分期出版,有统一的装帧设计,出版社为:中国出版集团世界图书出版公司。 地 址:湖北省武汉市洪山区雄楚大道459号A—2001 邮 编:430079 电 话:027-86642699;13995657179 网 址: http://www.sjxscb.com 联系人:孔编辑 投稿邮箱: zhongke001@qq.com;313165943@qq.com 世界图书出版公司学术出版中心 《中国语学文库》编辑部 2013年3月27日 (本文信息表述以官方网站的相关表述为准,网址: http://www.sjxscb.com/article.asp?id=2271 )
3726 次阅读|0 个评论
2012年SSCI和A&HCI收录语言学学科期刊
willtongji 2013-3-16 10:06
2012 年 SSCI 收录语言学学科期 刊 167 种 、 AHCI 收录语言学学科期刊 186 种 。 (1)SCI、 SSCI 、 AHCI 共同收录期刊 3 种 Computational Linguistics 《计算语言学》 Natural Language Engineering 《自然语言工程》 Phonetica 《语音学》 (2)SCI 、 SSCI 共同收录期刊 9 种 American Journal of Speech - Language Pathology 《美国言语病理学杂志:临床实践》 Brain Language 《大脑与语言》 Clinical Linguistics Phonetics 《临床语言学与语音学》 International Journal of Language Communication Disorders 《国际语言及交流障碍》 Journal of Communication Disorders 《语言交流障碍杂志》 Journal of Fluency Disorders 《口吃病杂志》 Journal of Neurolinguistics 《神经语言学杂志》 Journal of Speech Language and Hearing Research 《言语、语言与听觉研究杂志》 Language and Speech 《语言与口语》 (3)SSCI 、 AHCI 共同收录期刊 127 种 Across Languages and Cultures 《语言与文化的跨越》 Acta Linguistica Hungarica 《匈牙利科学院语言学学报》 Child Language Teaching and Therapy 《儿童语言教学与疗法》 Cognitive Linguistics 《认知语言学》 Dialectologia et Geolinguistica 《方言学与地方语言学》 Functions of Language 《语言的功能》 International Journal of Lexicography 《国际词汇学杂志》 Journal of African Languages and Linguistics 《非洲语言和语言学杂志》 Journal of East Asian Linguistics 《东亚语言学杂志》 Journal of English Linguistics 《英语语言学杂志》 Journal of Pidgin and Creole Languages 《混杂语言和克里奥尔语杂志》 Journal of Germanic Linguistics 《日尔曼语言学杂志》 Journal of Language Politics 《语言与政治杂志》 Language and Intercultural Communication 《语言与不同文化间的交流》 Language Problems and Language Planning 《语言问题与语言计划》 Language Sciences 《语言科学》 Language Variation and Change 《语言的演变》 Metaphor and Symbol 《隐喻与象征》 Natural Language Linguistic Theory 《自然语言与语言理论》 Natural Language Semantics 《自然语言语义学》 Phonology 《语音学》 Theoretical Linguistics 《理论语言学》 Zeitschrift fuer Dialektologie und Linguistik 《方言学与语言学杂志》 …… (4) AHCI 收录语言与语言学期刊 56 种 AAA- Arbeiten aus Anglistik und Amerikanistik 《美国与英国语言/历史/文化研究》 Anglia; Zeitschrift fuer englische Philologie 《英语语言学》 Beitraege zur Geschichte der deutschen Sprache und Literatur 《德国语言文学史》 German Quarterly 《德语季刊》 Historiographia Linguistica 《编史语言学》 Journal of English and Germanic Philology 《英语与德语语文学杂志》 Lingua e Stile 《语言与文体》 Modern Language Review 《现代语言评论》 Meta 《译者杂志》 Neophilologus 《新语言学》 Papers on Language and Literature 《语言与文学文集》 Philological Quarterly 《语文学季刊》 Revue de Linguistique Romane 《罗曼语语言学杂志》 Russian Linguistics 《俄罗斯语言学》 Sprachwissenschaft 《语言学》 Studia Neophilologica 《新语文学研究》 Transactions of the Philological Society 《语义学学会汇刊》 Zeitschrift fuer Germanistische Linguistik 《德语语言学杂志》 Zeitschrift fuer Romanische Philologie 《罗马语系语言学杂志》 Zeitschrift fuer Slawistik 《斯拉夫语杂志》 …… 2012年SSCI收录语言学学科期刊167种.doc 2012年AHCI收录语言与语言学学科期刊186种目录.doc
6431 次阅读|0 个评论
笔记:五类动词的脑部成像
gothere 2013-2-24 21:11
Neuroanatomical distribution of five semantic components of verbs: Evidence from fMRI 五个语义成分ACTION, MOTION, CONTACT, CHANGE OF STATE, and TOOL USE 五类动词Running, Speaking,Hitting, Cutting, Change of State 例词 walk cry hit clip crack 结论:主要由左脑的皮层结构组成的网络来完成,这些结构的功能主要是执行、观察、动作成像。五类动词在脑区分布上既有重叠又有一些特性。与语言学上的理论认识基本一致。
3451 次阅读|0 个评论
语言学问题,卫生间和卫生所的根本不同。拜年篇
热度 2 yue 2013-2-8 19:26
在美国,认为哲学问题、政治问题,很大程度上是语言问题。因此,在语言的运用上非常谨慎。而中国好像对此还非常麻木。 大陆和台湾的问题上,就纯粹是语言问题,由于在过去的博文中讨论过,现在就不讨论了。当然,钓鱼岛是不是语言问题,恐怕也是。即根据文献来作为证据,双方提出各自的主张。当然,钓鱼岛应该不是语义问题,而本文要讨论语义问题。 现在只举一个例子,说明语言问题的重要性。例如“卫生所” 是医院 ,但是“卫生间” 却 是厕所 。虽然卫生所和医院的含义也有差别,但广义的医院完全包括卫生所。 卫生间和卫生所的含义差别这么大,二者在实质上却又有的非常相同的含义。即二者都是为了卫生。只不过卫生间是正常人的卫生事业,而卫生所是生病的人的卫生事业。二者都是为了健康。 但再从纯粹语言问题看,二者完全没有区别,首先都包含“卫生”这个词语。其次,卫生间的“间”和“卫生所”的所,二者有何区别呢?显然,种类上完全没有区别,都是房子。而大小上二者有无区别,恐怕也不见得。 从以人为本的角度看,则说明二者都是人的本质。 再从哲学流派看,这个问题是当代哲学的全部,即语言学问题。也就是哲学家维特根斯坦的观点,他认为一个词语,它的各种用法在语言中完全没有共同的含义。 因此语言的最小单位,不是词语,而是用法。即最小单位是语句,大部分时候,最小单位是短语。 再比如,什么是时差,字面意思和实际含义也是有差别的。科学上的含义是各地太阳最高时的差别。而实际却有日出时间的差异。
个人分类: 法学|3250 次阅读|3 个评论
[转载]应用语言学研究生为何说好经典 我喜欢您的 三类双语互译及其结果
geneculture 2013-1-14 10:10
[转载]应用语言学研究生为何说好经典 我喜欢您的 三类双语互译及其结果
应用语言学研究生为何说“好经典 我喜欢您的 三类双语互译及其结果:......”? 你能猜到其中真正的原因或理由吗?试试吧!你会有意想不到的启示或收获的——对你未来的教师职业发展方向和道路而言。 日期:2013/1/12 Joan 22:41:39 好经典 我喜欢您的 三类双语互译及其结果: 1,英汉或汉英(狭义双语)同义并列对应转换有利于中西对话; 2,语文和算术(广义双语)同义并列对应转换有利于人机对话; 3,术语和俗语(另类双语)同义并列对应转换有利于雅俗共赏(即相当于完成专家与大众的对话)。 from: http://blog.sina.com.cn/s/blog_65197d9301015ozy.html
个人分类: 双语信息处理|1929 次阅读|0 个评论
爱要坦荡荡 丁丁翻唱更出彩--来自语言学的分析
gothere 2012-12-23 19:59
丁丁的《爱要坦荡荡》,百听不厌,此曲只应天上有,我等哪得几回闻? 百度一番,才晓得此曲真乃佛教之度泰国出品,原名《想要大声唱》,在泰国蝉联46周销售冠军,破140万张销售记录。后来被萧潇翻唱中文版,没红,丁丁则一曲红遍天下.原因为何呢? 听了三个版本后,才发现,丁丁反复唱的dala dala 在泰语里面原来是dalam dalam,多了一个m韵尾。而萧潇翻唱时保留了dalam的唱法,mv也做得有点异域色彩。可是她不晓得,这一个m,侵占了汉语的韵律结构,因为普通话并没有m收尾的情况,反而显得不自然,又缺乏其他韵律补偿,加之唱得没活力,所以红不起来. 丁丁的翻唱版不仅在这两点上完成了超越,而且在整体上达到了对原唱的神似,那种快乐活泼,融入本土气息.良好的本地化才有强劲的生命力. 再回到天上曲的感觉,dala dala的主旋律,真是有点唱经的感觉.想想国内寺庙的唱经,没有印度泰国的语言发音做依托,难怪唱起来总得不到俗人的赞许.节律的本地化太重要了!
个人分类: Linguistics|4125 次阅读|0 个评论
[转载]英语起源有新说
zhpd55 2012-12-11 09:55
本人不是搞语言学的,对于英语的起源问题也是刚刚看到一些新材料,也许对于行家里手来说根本就算不上新,既然有不同的观点和看法,就值得关注,将一些来自不同学者的观点转摘如下,供行家进行分析参考。 来自挪威首都奥斯陆大学的( University of Oslo )语言学教授 Jan Terje Faarlund 和来自捷克帕拉茨基大学( Palacky University )的语言学教授 Joseph Emmonds 联合,对于英语起源于盎格鲁 - 撒克逊( Anglo-Saxon )的观点提出质疑 , 宣称他们已经证明了英语起源来自斯堪的纳维亚( Scandinavia )。他们认为英语来自北日耳曼语系 , 就像挪威语。这种观点与其他语言研究者以及世界其他地方的语言研究者的观点截然不同,因为普遍认为英语直接源自古英语。 Faarlund 教授说 , 现代英语语言是斯堪的纳维亚语的直接分支,斯堪的纳维亚人迁入不列颠群岛的过程中经过了许多世纪 , 是在讲法语的诺曼人 1066 年之前就征服了不列颠群岛。他指出 , 古英语或盎格鲁 - 撒克逊都是一种西日耳曼语言 , 盎格鲁人和撒克逊人带着他们从德国北部和日德兰半岛南部而来,当他们定居在不列颠群岛时是在第五世纪。 Faarlund 教授指出 , 古英语和现代英语是两种截然不同的语言。为什么呢 ? 就是因为古英语很简单地消失了,而斯堪的纳维亚语保存了下来 , 自然会受到古英语的强烈影响。在许多英语母语人士努力学习挪威语的同时 , 并非巧合的是斯堪的纳维亚人 , 尤其是挪威人 , 学习英语相对比较容易,其原因就在于此。 More Information: Linguist Makes Sensational Claim: English Is a Scandinavian Languag e 英语在长期发展过程中受到不少语言的影响,吸收了众多语言的大量词汇,其中影响最大的几种当属拉丁语、德语、法语和斯堪的纳维亚语。 据考证,英语形成于公元五世纪中叶。公元 449 年,来自北欧沿海地区的朱特人( Jutes )、盎格鲁人( Angles )和撒克逊人( Saxons )等三个部落。乘罗马帝国衰落之际,入侵不列颠岛,并战胜了当地的凯尔特人( Celts )。这三个部落的人说着三种不同的,但是能够互相听懂的方言,稍后这三种方言汇合成古英语。 England 这个名字来自古英语 Engla-land (意思为 land of the Angels ,盎格鲁人的国土),而 English 这个词(古英语拼为 Englisc )则指的是 “ 盎格鲁人的语言 ” 。 斯堪的纳维亚地区现广义上指欧洲北部五个国家(丹麦、瑞典、挪威、芬兰、冰岛),当时仅指丹麦、挪威和瑞典。历史上他们是海盗( Vikings )国家,英国人把他们统称为丹麦人( Danes )。公元八世纪开始,他们日渐强大起来,历史上名为 “ 北欧海盗勃发( Viking Outburst ) ” 。在他们中间,丹麦曾一度最为强大。他们曾和朱特人(原先居住在今天丹麦的日德兰半岛 Jylland/Jutland )、盎格鲁人、撒克逊人是近邻,有密切的亲属关系,所以他们的入侵在语言上不存在太大的问题。斯堪的纳维亚语称为古诺斯语( Old Norse ),又称北日耳曼语( North Germanic )。斯堪的纳维亚在北日耳曼语中就是黑暗之国的意思(因其冬季有漫漫长夜)。 公元八至九世纪,英国遭到来自斯堪的纳维亚海盗的侵袭( Scandinavian Invasion ),其中尤以丹麦人为甚。他们给英国人带来了劫难。继而斯堪的纳维亚人大规模入侵英国北部。九世纪末,入侵者占了整个英国的东半部。他们还越过大西洋到达美洲。这次入侵分为三个阶段,到十一世纪初,丹麦国王卡纽特( Cnut 或作 Canute )宣布兼任英国国王( King of All England ),英国成为丹麦帝国的一部分。卡纽特从英国首都统治着斯堪的纳维亚大部分地区,其势力达到了顶峰,现今爱尔兰的首都都柏林就是他们建立起来的。丹麦和英国的这种关系在莎士比亚戏剧《哈姆雷特》中有反映。卡纽特国王统治英国近二十年,于公元 1035 年去世,这之后,丹麦人对英国的入侵和占领才慢慢结束。余下的斯堪的纳维亚人与当地人和平共处,大约在 1050 - 1150 年间,受到当地人完全同化( amalgamation ),与当地居民一起构成了英吉利人。 这次入侵对英国和英语是一个不可忽视的因素,对英吉利民族的性格产生了深远的影响。斯堪的纳维亚人富有自由色彩,重视权利观念,特别是丹麦人,他们是富有活力的个人主义者,其勇于获胜的高傲武士血统和不列颠岛上英格兰土著民族结合起来,给这个民族增加了一种活泼强悍、追求自由的特征。他们长期的海上生活,善于适应各种不同的环境,形成了一种四海为家的秉性。这些以及他们强烈的个人主义性格为英国人自由放任的品性和日后民族特性的形成添上了有力的一笔。 这次入侵还影响了英国的计数法,后来在英国出现的十二进位制就是斯堪的纳维亚人传授的,所以有了一英尺等于十二英寸,一先令等于十二便士,连法庭的陪审团也是由十二人组成。 英国是个岛国 , 主要位于大不列颠岛 the British Isles 上。南面隔英吉利海峡( the English Channel )、多佛尔海峡( the Straits of Dover )与法国相望,东面和东南方面隔北海 (the North Sea) 与荷兰、比利时、丹麦、挪威遥对。距欧洲大陆最窄处的多佛尔海峡仅 30km 宽。英国的领土主要包括大不列颠岛和爱尔兰岛东北部。大不列颠岛包括 3 个地区:英格兰占南部和中部,威尔士占西部山地半岛,苏格兰占北部;其中以英格兰最为重要。大不列颠岛是欧洲第一大岛,海岸非常曲折,长达 1.1450 万 km 。英语就是在这样的地理环境中形成的。为了说明英语的起源,我们有必要回顾一下英语形之前的英国史前史。文物考查已经证明,古代印欧游牧部落西移之前,今天的不列颠诸岛上已居住着旧石器人 (Paleolithic Man) 。那时,不列颠诸岛和欧洲大陆是连成一片的,英国和法国之间还没有今天的英吉利海峡和多佛尔海峡,莱茵河 (the Rhine) 与泰晤士河 (the Thames) 之间尚由其支流相接、今天的英国仍属欧洲大陆的一部分。大约在距今 9 千年的时候;由于地壳的变迁,大不列颠诸岛从欧洲大陆分离出来。所以史前的旧石器人能够在不列颠定居下来并不足为怪。曾任过英国首相的温斯顿·邱召尔( Sir Winston Churchill , 1874-1965) 在其《说英语的民族史》( History of the English Speaking Peoples )一书中,曾这样描写居住在不列颠的旧石器人:很明显,那些赤身裸体或只披着兽皮的男人和女人或觅食于原始密林之中,或涉猎于沼泽、草滩至于他们所说的语言,尚无史料可查。大约在公元前 3000 年,伊比利亚人( Iberians )从地中海地区来到不列颠岛定居。他们给不列颠带来了新石器( Neolithic )文化,同时征服了先前在那儿居住的旧石器人。大约从公元前 500 年开始,凯尔特人( Celts )从欧洲大陆进犯并占领了不列颠诸岛。凯尔特人最初居住在今天德国南部地区,他们是欧洲最早学会制造和使用铁器和金制装饰品的民族;在征服不列颠之前,他们曾征服了今天的法国、西班牙、葡萄牙、意大利等地区;来到不列颠后,一部分凯尔特人在今天的爱尔兰和苏格兰定居下来,其余的一部分占领了今天的英格兰的南部和东部。每到一处,他们都对伊比利亚人进行残酷的杀戮。凯尔特人讲凯尔特语。今天居住在苏格兰北部和西部山地的盖尔人( Gaels )仍使用这种语言。在英语形成之前凯尔特语是在不列颠岛上所能发现的唯一具有史料依据的最早的语言。 公元前 55 年的夏天,罗马帝国的恺撒大帝( Julius Caesar )在征服高卢( Gaul )之后来到不列颠。那时,他的目的未必是想征服不列颠,而是想警告凯尔特人不要支持那些居住在高占的、正受罗马人奴役的凯尔特同族人。恺撒大帝的这次‘不列颠之行’并没有给罗马帝国带来什么好处,相反却在一定程度上降低了他的威信。第二年,即公元前 54 年的夏天,恺撒大帝第二次亲临不列颠。这次,他在不列颠岛东南部站稳了脚跟,并与当地的凯尔特人发生了一些冲突。恺撒大帝虽然取胜,但并没有能使凯尔特人屈服。不久,他又回到了高卢;在以后的大约一百年间,罗马帝国并没有对不列颠构成很大的威胁。 英国历史上的真正的“罗马人的征服” (Roman Conquest) 是在公元后 43 年开始的。当时罗马皇帝克罗迪斯 (Claudius) 率领 4 万人马,用了 3 年时间终于征服了不列颠岛的中部和中南部随后,整个的英格兰被罗马牢牢控制了。随着军事占领,罗马文化与风格习惯渗入不列颠。罗马人的服装、装饰品、陶器和玻璃器皿很快在不列颠得到推广;社会生活开始“罗马化”,这必然导致拉丁语在不列颠的传播。在以胜利者自居的罗马人看来,凯尔特人无疑是“低贱的”,凯尔特语自然不能登“大雅之堂”。那时,在不列颠,官方用语、法律用语、商业用语等均是拉丁语;拉丁语成了上层凯尔特人的第二语言。这就是凯尔特语词汇为什么很少能幸存下来的历史原因。在今日英语中,只是在一些地名和河流名称方面还保留着凯尔特的词汇成分。例如 the Thames ,the Cam, the Dee ,the Avon , the Esk , the Exe , the Stour , the Aire , the Derwent , the Ouse , the Severn , the Tees , the Trent , the Wye 等,均是凯尔特人命名的河流。在 Duncombe, Winchcombe, Holcome, Cumberland, Coombe 等地名中,也可看到凯尔特语 cumb (=deep valley: 深谷)一词的成分,在 Torcross , Torquay, Torrington 等地名中,尚保留着凯尔特语 torr (=high rock or peak; 高岩或山顶)一词的成分。英国著名城市多尔佛( Dover )、约克 (York) 的名称也源于凯尔特语。罗马人占领不列颠长达 400 年,直到公元 407 年,罗马人才因罗马帝国内外交困不得不开始撤离不列颠。 大约在公元 449 年,居住在西北欧的 3 个日耳曼部族侵犯不列颠。他们是盎格鲁( Angles )、撒克逊人( Saxons )和朱特人( Jutes )他们乘船横渡北海,借罗马帝国衰落、自顾不暇之机,一举侵入大不列颠诸岛。他们遭到凯尔特人的顽强抵抗,征服过程拖延了一个半世纪之久:到了公元六世纪末,大不列颠诸岛上原先的居民凯尔特人几乎灭绝,幸存者或逃入山林.或沦为奴隶。这就是英国历史上发生的“日耳曼人征服”,亦称“条顿人征服”( Teutonic Conquest )。这次外来入侵.对英语的形成起了十分关键的作用。 盎格鲁人、撒克逊人和朱特人属古代日耳曼人。分布在北欧日德兰半岛、丹麦诸岛、德国西北沿海一带。在罗马帝国时期,他们往往统称为“蛮族部落”。他们从事畜牧和狩猎,过着半游牧的生活,且很早就知道农耕。他们的土地是氏族的公有财产,农业经营带有原始的流动性质。随着社会的发展,氏族公社逐渐解体,出现了氏族贵族和军事首领。他们的财富和权势在频繁的掠夺中剧增。军事首领名义上是由民众大会推选产生的,实际上都出于同一家族。恩格斯曾把这种氏族部落的管理制度称作军事民主制;他这样写道:“其所以称为军事民主制,是因为战争以及进行战争的组织现在已成为民族生活的正常职能。邻人的财富刺激了各民族的贪欲。这些民族把获得财富看成是最重要的生活目的之一。他们是野蛮人。进行掠夺在他们看来是比进行创造性劳动更容易,甚至更荣誉的事情。以前进行战争,只是为了对侵犯进行报复,或者是为了扩大已经感到不够的领土;现在进行战争,则纯粹是为了掠夺,战争成为经常的职业了。”这些所谓的“蛮族”,在摧毁当时罗马帝国的奴隶制,以及推动西欧封建制度的诞生过程中,起过十分重要的作用。 征服不列颠后,盎格鲁人主要占领了洪伯河( the Humber )以北地区;撒克逊人主要占领了泰晤士河以南地区;朱特人主要盘踞在英格兰东南端的肯特( Kent )和南汉普郡( Southern Hampshire );以及位于英格兰之南、靠近今天的朴次茅斯 (Portsmouth) 的怀特岛( the Isle of Wight ),形成许多小国。公元七世纪初,这些小国合并为 7 个王国:即南部有撒克逊人的威塞克斯( Wessex )、萨塞克斯 (Sussex) 和埃塞克斯 (Essex) ;东北部和中部有盎格鲁人的梅尔西亚 (Mercia) 、诺森伯里亚( Northumbria )和东盎格里亚 (East Anglia) ;东南部有朱特人的肯特 (Kent) 王国。各国竞相争雄,达两百年之久;在英国历史上称为“七国时代” (the Anglo-Saxon Heptarchy) 。这 3 个日耳曼部族虽然有各自的方言,但这些方言均属低级西日耳曼语 (Low West Germanic) 。有许多共同之处.因此 3 个部落在语言方面基本上是相通的。他们都使用一种叫做茹尼克( Runic )的文字。这种文字是古代日耳曼各民族通用的文字.它的字母主要由直线组成,以便于刻在木头或石块上,是一种由古希腊语和拉丁语发展起来的北欧碑文字。随着人类社会的发展,盎格鲁人、撒克逊人和朱特人逐渐形成统一的英吉利民族.他们各自使用的方言也逐渐溶合,出现了一种新的语言即盎格鲁撒克逊语 (Anglo-Saxon) ,这就是古英语。它是在特定的地理和历史环境中,经过一系列民族迁移与征服的过程所形成的。 那末 English 和 England 的名称是如何而来的呢?原来,凯尔特人将征服他们的盎格鲁人、撒克逊人和朱特人习惯地统称为 Saxons( 撒克逊人 ) 。早期拉丁语学者仿照凯尔特人的习惯.也将这 3 个日耳曼部族称作 Saxones .并将他们征服的不列颠称作 Saxonia 。到了公元七世纪. 由于用森伯利亚王国和梅尔西亚王国在政治上和文化上的影响剧增,而在这 Angli 和 Anglia 指所有的 3 个部族和他们在不列颠所占有的地盘。随后 ,Angli 和 Anglia 在拉丁语著作中分别代替了 Saxones 和 Saxonia 。到了公元 700 年所有的人都把当时通行在不列颠岛上的语言称作 Englisc (盎格鲁人一直就是这样称呼其使用的语言的 ) , 3 个入侵的日耳曼部族则统称为 Angelcynn(=kin of the Angles 即“盎格鲁人的家族” ) 。到了公元 1000 年整个国家则被称作 Englaland (=land of the Angles 盎格鲁人的土地 ) 。由于语言内部在发音和拼写方面发生了演变 Englisc 和 Englaland 才变成了今天的 English 和 England 。 在追溯英语的历史发展时,通常将它分为 3 个时期: ( 一)古英语 (Old English) ,从公元 450 年至 1150 年; ( 二 ) 中古英语 (Middle English) ,从公元 1150 年至 1500 年;, ( 三)现代英语 (Modern English) ,从 1500 年至今。为便于研究,我们常把 1500~1700 年的英语称作“早期现代英语” (Early Modern English) , 1700 年至今的英语称作“后期现代英语” (Later Modern English) 。这样的分期当然不是绝对的,但它有助于我们对英语历史发展全过程的了解和研究。
个人分类: 新观察|2256 次阅读|0 个评论
BigData:语言工程视野下的语言学理论
gothere 2012-11-20 00:16
BigData很时髦,语言学的理论也在BigData中接受了挑战和更新。由于机器翻译、搜索引擎的强大推动,语言学早早地迈入了BigData时代,但是其理论发展却远远滞后。(1)为了描写语言现象,1980-1990年代,欧洲建立了相当大规模的标注语料库,据此编写Collins等著名词典,以及英语语法大全。(2)为了搞清楚世界语言的面貌,http://wals.info/这个令人振奋的全球语言特点数据库,汇集了一两百年语言学家的各种研究论著,借助google地图,展示了不同语言特性的全球分布。50多种语言的词汇语义库WordNets,全部对应到英文WordNet上。Google Translate更是可以完成20多种语言的互译。(3)为了搞清楚语言和环境的互动,多模态语料库不仅包含文本信息,也有语音和视频。这还不算什么,看看Roy的TED演讲《单词的诞生》。把3D技术、自动标注、数据可视化等最前沿的技术用在了儿童语言习得的研究上。(4)机器学习超级大牛Mitchell利用核磁共振技术测试人脑对60个名词的分类实验,让我们看到未来读取人类思想的机器雏形。(5)回首乾嘉学派,有清一代的语言文字学已经对古籍文献做了大量的索引、计数、统计工作,是近代中国最贴近科学的研究,若有计算机,他们不知道会研究出什么来。 大数据时代,我们对语言的认识已经发生了改变:(1)大规模标注语料库的加工,让人们在逐词标注和分析的过程中,遇到了前所未有的诸多挑战,对于什么是词、词性都有了新的见解。(2)乔姆斯基的句法理论在大数据时代遇到了很大的问题,因其句法理论不停地变,使得用其理论来建立树库遇到不少问题,简化版的标注体系又漏掉了不少句法信息。依存句法和语义角色标注方法的兴起不得不说是对该理论的反拨。(3)人类的语言和脑活动的关系逐步揭示出来。(4)互联网上多语言、海量词汇、文本,迫使语言工程专家去考虑全新的语言底层表示方式。 大数据来了,面向工程的语言理论还很稚嫩,抄起处理大数据的种种牛刀,去建立新的体系吧... Towards a formal distributional semantics (IWCS 2013 Workshop)已经在昭示未来了:)
个人分类: Computational Linguistics|4064 次阅读|0 个评论
融智视角下的广义文法是应该有其特定含义的(对话有益)
geneculture 2012-11-18 22:41
(理论和工程)融智学主要是在语言学与信息学的基础上发展起来的。 后来发现,还要加上,跨:教育学和管理学“迭交”的(应用)融智学。 对话: 煌罗德修 21:33:13 《融智观下的广义文法》 煌罗德修 21:34:38 散步的时候 想到,广义文法是融智视角下的 ZouXiaohui 21:35:01 是的 煌罗德修 21:35:34 融智的意思是 融多种学科 跨领域的意思吧 ZouXiaohui 21:35:40 融智视角下的广义文法是有其特定含义的 煌罗德修 21:36:57 就是跨信息学和语言学 ZouXiaohui 21:39:02 开始大体是那样,但是,后来发现,还要加上,跨:教育学和管理之“迭交”的学问 ZouXiaohui 21:39:50 http://baike.baidu.com/view/1213127.htm ZouXiaohui 21:54:14 你看后,有何想法? 煌罗德修 22:00:49 不太清楚,读起来有些费劲 ZouXiaohui 22:01:02 O(∩_∩)O哈!O(∩_∩)O哈! 煌罗德修 22:01:48 狭义的融智学,广义的呢 ZouXiaohui 22:02:18 暂时不谈广义的融智学 煌罗德修 22:03:07 如果需要的话,我帮您整理一下? 煌罗德修 22:04:20 有时候我觉得上帝真是公平呵呵 ZouXiaohui 22:11:27 嘿嘿 煌罗德修 22:11:55 或许不会有广义融智学了吧?因为融智的概念已经够广的了 ZouXiaohui 22:18:43 我给你找一篇谈过这个问题的文章吧 煌罗德修 22:19:31 好 ZouXiaohui 22:22:22 “融智学的观点和方法” 煌罗德修 22:22:50 既然“ 融智学主要是在语言学与信息学的基础上发展起来的 。”(刚看到) 那么说《融智视角下的广义文法》不是很合适吗? 煌罗德修 22:23:29 这样比较容易接受从信息学角度说文字 ZouXiaohui 22:23:18 【DOC】融智学的观点和方法 文件格式:DOC/Microsoft Word - HTML版 融智学的观点和方法邹晓辉(融智研究所),邹顺鹏(外国语学院),王萍(中铁五局)519125 广东珠海井岸桥东恒美花园15-2栋201号0756-5505041 qhkjy@yahoo.com.cn摘要:... survivor99.com/pscience/mysite 1-20/... 2009-11-22 煌罗德修 22:23:57 不过也无所谓啦 我就是临时想到了 说说而已 煌罗德修 22:25:00 因为广义文法 无法定义 附录1: 融智学 融智学是专门研究“协同智能”或“协同之智”的学问体系。   由于作为融智学研究对象的“协同智能”或“协同之智”可分为狭义和广义两种基本类型,因此,融智学也分为狭义和广义两种理论。融智学主要是在语言学与信息学的基础上发展起来的。    融智或智融 是融通智慧或智慧融合的缩写。其中“融”字的含义取“融合和融通”两个词条;“智”字的含义取“智力、智能和智慧”三个词条。“ 融智 ” 术语 是在1992年13省市自治区经济法学术会议上邹晓辉的论文中正式提出的。2006年底Google网页搜索引用“融智”83100项;Google学术搜索引用“融智”508项。    狭义的融智学 是一门研究 人际、机际、人机 之间 合理分工、优势互补,高度协作、优化互动 的学问。它作为专门研究(狭义)协同智能的 概念、原理和实例 的学问在2000年提出,其代表作(可作为 融智学导论 的《字本位与中文信息处理的基础》)获广东省优秀科技专著2006出版基金资助,其主要的内容涉及理论融智学、工程融智学与应用融智学三个层次。   如:    理论融智学 主要解决信息科学和信息哲学的几个基础性难题:   1、( 系统理论 的) 信息 定义,即:信息,在形式类型上可数字化、在概念内容上可属性化、在本质关系上可序位化的。   2、(自然与人工) 本体 三要件,即:符号或术语、概念或思想、关系或机理。   3、( 基本范畴 )“ 信息 ( 意、文、义 )与 物 (质能)”等价于“ 本体 与 载体 ”。    工程融智学 发现并发明人脑与电脑 协同处理 信息的新方法: 间接形式化 计算模型,可突破机器翻译(模式识别、语言处理和知识表达)技术瓶颈。    应用融智学 断言 金融的实质是智融 ,并找到“产学研、教学用、人用机算” 一体化管理 和创造性合作性 生产式教学 的具体 融智途径 ,为 融智与融资的结合 铺平了道路。 http://baike.baidu.com/view/1213127.htm 附录2: 【DOC】 融智学的观点和方法 文件格式: DOC/Microsoft Word - HTML版 融智学的观点和方法 邹晓辉(融智研究所),邹顺鹏(外国语学院),王萍(中铁五局)519125 广东珠海井岸桥东恒美花园15-2栋201号0756-5505041 qhkjy@yahoo.com.cn摘要:... survivor99.com/pscience/mysite 1-20/... 2009-11-22 融智学的观点和方法 - docin.com豆丁网 融智学的观点和方法 ——所有资料文档均为本人悉心收集,全部是文档中的精品,绝对值得下载收藏! www.docin.com/p-2652665...html 2012-8-3 - 百度快照 融智学 原创文集 - docin.com豆丁网 融智学的观点和方法 (CAAI-11录用论文) 173 后语 (致谢) 179 3 融智学是一...融智学纲要”和 “融智 学术语表”的内容。而作为精品课程的《融智学简明教程》则... www.docin.com/p-187747...html 2012-6-28 - 百度快照 广义文本与本真信息POTENTIAL SCIENCE 第43期(概述) - 人工智能 -... 1 融智学的观点和方法 邹晓辉 融智研究所 、邹顺鹏 外国语学院 、王萍 中铁五局...“OnCooperatingWithComputers”inEnglish.Rong-Zhi-Xueismadeupofthreeparts.Partone... www.doc88.com/p-2106596782...html 2012-10-14 - 百度快照 .starScore,.starMask{display:inline-block;height:12px;overflow:hidden;font-size:0;background:url(http://s1.bdstatic.com/r/www/cache/global/img/score-1.0.png) repeat-x}.starScore{width:75px;background-position:0 -12px}.wenkuType{display:inline-block;margin-right:5px;vertical-align:top;width:16px;height:16px;background:url(http://s1.bdstatic.com/r/www/cache/global/img/bg-1.0.10.png) no-repeat 0 -544px}.DOCType{background-position:0 -544px}.PDFType{background-position:-32px -544px}.PPTType{background-position:-64px -544px}.XLSType{background-position:-96px -544px}.TXTType{background-position:-128px -544px} 广义文本与本真信息 Potential Science 第43期(概述)_百度文库 评分:0/5 6页 融智学的观点和方法 邹晓辉(融智研究所) 、邹顺鹏(外国语学院) 、王萍(中铁五局) 519125 广东珠海井岸桥东恒美花园 15-2 栋 201 号 0756-5505041 q... wenku.baidu.com/view/b8d63da7b0717fd... 2012-5-2 - 百度快照 2007-2008于北京大学访学期间修订 - docin.com豆丁网 融智学的观点和方法 (CAAI-11录用论文) 173 后语 (致谢) 179 前 言 融智学是一门研究自然人与计算机“合理分工、优势互补,高度协作、优化互动”的原理、方法及... www.docin.com/p-689977...html 2012-7-27 - 百度快照 改变科学研究思路的十个知识创新点 它们体现的协同智能 的观点 、原理 和方法 至少可在“强人工智能”与“弱人工智能”... 融智学 导论(字本位与中文信息处理的基础)正是从“第三智能”的角度来提出这个... survivor99.com/entropy/is/2007_4/zxh... 2008-9-15 - 百度快照 【DOC】 2007-2008于北京大学访学期间修订 文件格式: DOC/Microsoft Word - HTML版 20, 融智学的观点和方法 (CAAI-11录用论文) 173后语(致谢) 179前言 融智学是一门研究自然人与计算机合理分工,优势互补,高度协作,优化互动的原理,方法及实例的... survivor99.com/entropy/2000-2008_rzx... 2008-9-14 ten_points - 计算机教材 - 道客巴巴 基于语言学与信息学的融智学研究对象的主题架构”示意图 由图2两个大箭头内嵌的...邹晓辉 融智学的观点和方法 ACAAI-11录用 前沿科学J第47期2005 7、邹晓辉信息学... www.doc88.com/p-7058795327...html 2012-3-25 - 百度快照 邹晓辉 - 融智学 原创文集 - 行政公文 - 道客巴巴 融智学的观点和方法 CAAI-11录用论文 173 后语 致谢 179 前言 融智学是一门研究自然人与计算机“合理分工、优势互补高度协作、优化互动”的原理、方法及实例的学问... www.doc88.com/p-317791041...html 2012-2-16 - 百度快照 2007-2008于北京大学访学期间修订【精品推荐-doc】 - docin.com豆... 融智学的观点和方法 (CAAI-11录用论文) 1732007- 2008于北京大学访学期间修订2007...融智学是一门研究自然人与计算机“合理分工、优势互补,高度协作、优化互动”的... www.docin.com/p-4678073...html 2012-10-19 - 百度快照 融智学 原创文集 - 2007-2008于北京大学访学期间修订 - docin.com... 融智学的观点和方法 (CAAI-11录用论文) 173 后语 (致谢) 179 前 言 融智学是一门研究自然人与计算机“合理分工、优势互补,高度协作、优化互动”的原理、方法及... www.docin.com/p-2413183...html 2012-9-7 - 百度快照 广义文本与本真信息POTENTIAL SCIENCE 第43期(概述) - docin.com... 融智学的观点和方法 邹晓辉(融智研究所)、邹顺鹏(外国语学院)、王萍(中铁五局...融智学高级普及,与“交叉 - 综合 - 公共 - 基础、专业委员会和工作委员会”... www.docin.com/p-3370793...html 2012-8-31 - 百度快照 【DOC】 改变科学研究思路的十个知识创新点 文件格式: DOC/Microsoft Word - HTML版 语言和知识的通用计算方法和量具,生产式教学及协同智能训练体系,(产,学,研,教,...6,邹晓辉, 融智学的观点和方法 CAAI-11录用, 前沿科学 第47期,2005... survivor99.com/pscience/2007-11/ten_... 2008-9-14 融智学 论文集——以 字组划分的方法——试论字本位理论的功用(汉语“字本位”理论学术研讨会论文)9、... 融智学的观点和方法 (中国人工智能学会第十一届全国学术大会2005年8月25日录用)后... survivor99.com/pscience/mysite 1-20/... 2009-11-22 - 百度快照
个人分类: 融智学前期探索|1514 次阅读|0 个评论
学术创新的语言困境与“发展语言学”的构建设想
热度 1 pww1380 2012-11-18 14:50
信息文明之光( 59 ): 学术创新的语言困境与“发展语言学”的构建设想 (人文社科版) ——学术思想与文学艺术的创新 语言演化与动态发展的动力 杨文祥 提示: 本博的理念坚守: 理论原创,版权所有,促进信息 - 知识 - 思想资源共享,共建信息文明。 本博的行为准则: 诚恳交流,欢迎转载,剽窃必究,合理转载办法详见本博公告栏内容。 ————博客: 信息文明之光 语言,无论是现代汉语还是现代英语,也无论是当今世界人们所正在使用的哪一种语言,都 是对人类过往经验的记录与表达的思维形式,是对既有世界——已知世界和现实生活的描述工具和交流手段 。 于是,语言不但是历史的,也是现实的,是使用语言的人们“约定俗成”的历史产物,语言的功能是对历史的记录和对现实的表达、描述与把握。因此, 语言的本色是历史的和现实的,同时也是守成的和保守的 。 创新则是一种对未知的新境界的探索,同时也是对一个未知的新世界的构建。 于是,创新是超越历史和现实的,是“前无古人的”,因此, 创新的本质是开创的,超前的 。 在人类进行各方面具有创新意义的智力活动中,学术思想创新和文学艺术创新无论是对其创新过程的描述与记录还是对其创新成果的总结与表达,都别无选择地要借助语言这一思维形式与表达工具。 这样,就先天地决定了学术思想和文学艺术这两个领域的创新必然泾渭分明地划分为两个层次——特定 语言现有表达功能限度之内的创新和超越该语言现有表达功能限度的创新 。 鉴于语言先天具有的守成性和保守性,在语言现有表达功能限度之内的创新是一种相对意义上的“创新”,而超越现有语言表达功能限度的创新则是一种绝对意义上的创新 。 这就是说,在学术思想创新和文学艺术创作过程中,如果创新者遭遇到“难以言说”甚至是“词不达意”的语言困境,我们就有必要对自己所进行的创新做一创新层次分析,看其究竟 是一种“在语言现有表达功能限度之内的相对意义上的创新”,还是一种“超越现有语言表达功能限度的绝对意义上的创新” 。 如果 是一种“在语言现有表达功能限度之内的相对意义上的创新”,便说明阻滞于语言困境之中的创新者的语言表达和表现能力有待进一步提升以适应这一创新的实际需要 。而如果 是一种“超越现有语言表达功能限度的绝对意义上的创新”,则说明我们所使用的语言本身需要创新和发展,以适应语言实践,首先是与学术思想创新和文学艺术创作具有紧密内在联系的语言实践的现实需要 。 这就是说,创新,即创造性的工作,无论是科学研究领域的学术思想创新还是文学艺术领域的文艺创作创新,当这一创新达到一个具有一定高度的境界时,就必然面临一个超越学术思想和文学艺术创新之外的新问题和新障碍,这一新问题和新障碍就是 学术思想 - 文学艺术创新与表达这一创新的语言形式的矛盾 。 譬如上文中出现的“学术思想创新和文学艺术创新”这一现代汉语短语,为了表达这一短语所无法表达的“学术思想创新与文学艺术创新对思维形式和语言表达功能所具有的共同的现实需要”以及由于这一现实需要所形成的理论上的内在联系时,是否可借用英文的构词方法,表达为“ 学术思想 - 文学艺术创新 ”这种目前并不符合现代汉语语法规范的表达形式? 与此相类似的还有本人在专业研究中经常需要使用的“信息时代”、“信息社会”、“知识时代”、“知识社会”等概念和相应的名词与术语。可是在表达 既含有信息社会和信息时代因素,又具有某些知识时代和知识社会特征的由信息社会初级阶段被称之为“信息社会”的社会形态向作为信息社会中级阶段的知识社会过渡的社会形态,却没有相应的名词和术语来准确地表达这一理论概念 。为了能够准确表达这一理论内涵,我经常借用上述这种英文造词法,将其分别表达为“信息 - 知识时代”和“信息 - 知识社会”。当然,这种对英文造词法的借用,目前还有待于现代汉语和相应语言规范的发展实践的认可。 当代中国是一个历史内涵无限丰富的社会形态——既包含大量的农业文明和农业社会的历史遗存,又在逐渐衍生工业文明和工业社会的历史要素,与此同时,在全球化、信息化日益严峻的挑战面前,信息时代信息社会乃至知识时代和知识社会的时代要素也在迅速生长,这样,人类历史上最新型的文明历史形态——信息文明业已在事实上,即在社会实践上启动了信息文明建设的历史实践。 如何运用一个众所公认的简洁明晰的概念和相应术语来表述和概括当代中国这种高度复杂的社会形态显然是目前的现代汉语所难以承受的历史之重 。 另如原始文明、农业文明、工业文明这些建立在物质资源基础之上的人类文明形态,究竟应统称为“物质文明”还是“物质型文明”?若统称为“物质型文明”,是否有文字过于冗繁之嫌?而若统称为“物质文明”,显然又有与目前在传统思维定势之下的语言实践,尤其是日常口语实践中的“物质文明”相混淆之忧。 再如本文提示中所出现的组合名词“信息 - 知识 - 思想资源”,就是本人为了具体地展示信息资源作为人类的智慧资源和人类社会的精神资源的不同层次的信息资源内涵而借用英文的造词法所生成的术语——专业学术名词。为了能够在学术创新实践中充分而准确地表达和揭示本人的学术思想,目前我别无选择。至于这种借用外文造词法所生成的现代汉语组合名词和专业术语究竟能否为当下的专业同行和现代汉语研究界所认可与接受就不在本人的考虑之中了。 一个清醒的学者,决不会因噎废食,削足适履,囿于语言学的某些已经落后于语言实践的所谓规范而停下自己学术探索的脚步。至于这些探索的成功与否,学术价值几何,则只能将其交付当下的语言实践和现代汉语的未来发展实践去做历史的和实践的检验,而决不可囿于现有语言的局限而畏首畏尾,患得患失 。 类似的情况还有, 建立在信息资源这一具有精神属性的资源基础之上的人类文明,究竟应称之为信息文明,精神文明还是精神型文明 ? 学术思想 - 文学艺术创新与表达这一创新的语言形式的矛盾以及这一矛盾所造成的诸如此类的语言困境曾令我困扰不已。在这种语言困境的长期困扰之下,我不得不进行语言学理论上的反思。 语言不但是人类思维的形式和表达思想实现思想情感交流的工具,在人们创新性的思维深度超越了现有语言承载和表达能力的情况下,这一思维的形式和思想感情的表达与交流工具又会走向自己的反面,成为限制和束缚人们进行有效思维和表达的精神桎梏 。 于是,这一反思就得出了一个学术结论,一个这样的学术结论: 为保持语言的生命活力,使其能够有效地发挥其作为思维形式和表达与交流工具的现实功能,语言必须在保持相对稳定的同时,伴随语言实践和学术创新的现实需要而不断发展,以便与时俱进地不断深化与强化其功能。与此同时,还有必要建立一门新的语言学分支学科对语言的发展实践进行具有当今时代历史高度的理论总结和理性指导 。 这一语言学新的分支学科就是“发展语言学” 。 发展语言学应该是以 人类语言的发展 为研究对象,系统研究分析人类语言 形成、发展、演化与嬗变 的各种影响因素,总结和描述人类语言的形成、发展、演化与嬗变模式与规律,预测语言未来发展与变化趋向、模式、相关影响及应对措施的一门集基础研究与应用研究为一体的专门学科。 在此,有必要对 发展语言学 与 普通语言学 的关系做一简要辨析。 普通语言学是综合各种语言的研究成果而建立起来的一门以人类一般语言为研究对象,研究人类语言的性质、结构特征、 发展规律 的语言学分支学科 。 这样,“人类语言的发展规律”便构成了这两个语言学分支学科共同的研究内容,形成了这两个语言学分支学科在研究内容上的交叉。 如何对待“人类语言的发展规律”这一共同的研究内容,这两门学科 无论是在学术视角上还是学术地位上都是不同的 。 从学术视角而言, 普通语言学 是用一种 宏观的视角 对“人类语言的发展规律”进行 全景式的整体把握与静态描述 。而 发展语言学 则是用一种 相对微观的视角 对“人类语言的发展规律”进行 渐进的和累积式的动态分析和具体描述 。 从学术地位上看,对于 普通语言学 来说,“人类语言的发展规律”仅仅作为该学科 多方面研究内容中的一个地位并不突出的组成部分 而存在,而对于 发展语言学 来说,则是这一专门学科的 主体内容 。 为全面落实发展语言学的基础研究和应用研究功能, 发展语言学 不但应该有进行 人类语言形成、发展与演化一般规律的总论性的研究 ,还应有自己的 分论性的研究和相应的分支学科 ,如(现代)汉语发展语言学、(现代)英语发展语言学等。 这样,作为发展语言学的重要学术功能和社会任务的“系统研究分析人类语言 形成、发展、演化与嬗变 的 各种影响因素 ,总结和描述人类语言的 形成、发展、演化与嬗变模式与规律 , 预测语言未来发展与变化趋向、模式、影响因素及应对措施 ”,对于人们语言实践的现实需要,尤其是上文所述的那种为突破现有语言功能的局限,实现绝对意义层次的学术思想创新和文学艺术创新具有重要的理论学术意义和社会现实意义。 如果用反证法和逆向思维的方法作深化一步的思辨,我们更能够得出以下这一理论认识: 人类语言实践不断发展和深化的现实需要, 尤其是与语言应用实践紧密相关的学术思想创新和文学艺术创新对突破现有语言局限的现实需要,是语言发展、演化与嬗变的最重要的现实推动力 。 参见:杨文祥《谈汉语“同词异体”现象及处理》,刊载于香港《语文建设通讯》, 1999 , 10 , 61 期
个人分类: 信息文明之光:晓星熹微 (Twilight Star )|4134 次阅读|3 个评论
三类双语协同处理系统工程解决方案
geneculture 2012-11-10 09:37
三类双语协同处理系统工程解决方案
三类双语协同处理系统工程解决方案 设计者:邹晓辉Geneculture 1.汉字棋盘原理(棋盘模型) 2.汉英转换机理(蝴蝶模型) 3.间接计量知识(本体模型) 五个关键词 :语言;信息;知识;智慧(能力);软件 附录 : 普通语言学和形式语言学以及计算语言学乃至编程语言学甚至机器语言学之间一直缺乏一个统一的理论架构。因为,仅仅停留在“语言”和“言语”的层面是无法解决这个基本问题的。邹晓辉分析并抽象出“言”和“语”就可很好地在“言”和“语”的层面来解决这个基本问题,即:可以形成统一上述五大语言学的很好的理论架构——“言”和“语”的形式化区分模型以及“言”和“语”的序位关系唯一守恒原理及其实际应用的汉字棋盘原理(棋盘模型)、汉英转换机理(蝴蝶模型)。进而也为知识计量的本体模型提供了三类双语协同处理系统工程解决方案。 ZouXiaohui 9:14:56 提示: 从“语言”和“言语”中进一步分解并抽象出“言”和“语”是为了找出“语言”和“言语”的形式化共性。这样,也就必然会把“语言”和“言语”包含或蕴含的概念化个性给抽象掉——实际上就是让它们仍然停留在“语言”和“言语”的层面而不必进入“言”和“语”的层面来讨论。 ZouXiaohui 8:57:11 我在确定“语言=语+言”和“言语=言+语”的时候 都是依据的形式化字符串而推演的。 这在计算机处理字符串的情形来看的确就是顺理成章的事情。因此这样做是不证自明的。 ZouXiaohui 9:02:33 序位关系唯一守恒是说: 1.言类的诸例按照拼音排序必然是异义排列序趣简美的。 2.由言到语的派生组合序列也必然是异义排列序趣简美。
个人分类: 双语信息处理|1949 次阅读|0 个评论
Corpus Linguistics 2013 语料库语言学2013国际会议
carldy 2012-10-17 20:25
Corpus Linguistics 2013 语料库语言学2013国际会议 Lancaster University, UK – 22nd to 26th July 2013 The seventh international Corpus Linguistics conference ( CL2013 ) will be held at Lancaster University from Tuesday 23rd July 2013 to Friday 26th July 2013. The main conference will be preceded by a workshop day on Monday 22nd July. The conference is hosted by the UCREL research centre , which brings together the Department of Linguistics and English Language with the School of Computing and Communications at Lancaster. About the conference The goals of the conference are as follows. To gather together current and developing research in the study and application of corpus linguistics; To push the field forwards by promoting dialogue among the many different users of corpora across interconnected sub-disciplines of linguistics – be they descriptive, theoretical, applied or computational; To explore new challenges both within corpus linguistics, and in the extension of corpus approaches to new fields of study. With these goals in mind, we invite contributions on as broad and inclusive a basis as possible. The areas in which we particularly welcome submissions include but are not limited to: Critical explorations of existing measures and methods in corpus linguistics; New methods and techniques in corpus development, annotation and analysis; Corpus approaches to the study of new media; New tools and techniques developed in corpus-based computational linguistics; The application of corpus approaches in the social sciences and humanities; The extension of corpus linguistics to an ever-wider range of (non-English) languages; The interface between corpus and theory; The use of corpora in discourse analysis; The use of corpora in second language acquisition studies and language pedagogy. Plenary speakers We are delighted to announce that the following speakers have accepted our invitation to give plenary lectures at CL2013: Karin Aijmer Guy Cook Michael Hoey Ute Rmer Key dates 31st October 2012 – abstract submission opens via conference website 31st October 2012 – deadline for proposals for workshops 8th January 2013 – deadline for abstract submission 15th February 2013 – notification of the outcome of peer review; early bird registration opens 1st April 2013 – early bird registration closes 30th June 2013 – final deadline for registration 22nd / 23rd July 2013 – workshop day / main conference begins 会议网站: http://ucrel.lancs.ac.uk/cl2013/
个人分类: 翻译/语料库语言学等会议 Symposiums|4121 次阅读|0 个评论
【立委随笔:文傻和理呆的世纪悲剧(romance tragedy)】
热度 4 liwei999 2012-10-15 20:45
不是冤家不碰头 St atisticians vs. Linguists: Deep-seated Antagonists? (Or Protagonists in NLP?) Chemistry? No! 【一辈子只做一件事,幸也不幸?】 不知道多少次电脑输入 NLP(自然语言处理),出来的都是“你老婆”。难怪 NLP 跟了我一辈子,or 我跟了 NLP 一辈子。不离不弃。 在当今的社会,有多少人学了一个专业,喜欢上一个专业,就一条路走到黑?尤其是信息产业和技术,瞬息万变,不是被时代淘汰,就是被市场淘汰。前者譬如知识来不及更新,长江后浪推前浪,前浪死在沙滩上。不是说么,搞软件的,中年做不了经理,走技术路线的基本没戏:小年轻头脑多灵光,知识多新鲜,Facebook 和 Google 的创始人不都是娃娃嘛,后生可畏,此之谓也。后者呢,譬如入行的专业太超前,“太科学”,技术不成熟,不能实用,市场无法消化,那也只好转行。这样的例子在身边朋友中常见。 事实上,跟我同辈的学我这行的,除了在大学研究院的象牙塔做教授研究员的以外,几乎全部转行了。师兄中很精明能干的几位也都转行了,不是因为不喜欢 NLP,而是市场还不能消化。当然,转行的师兄们也都做得很好,事业很发展,生活很安逸。 我背负着语言学的沉重包袱,居然survived到今天,简直是奇迹。当然,95%靠运气,上苍的眷顾,譬如博士刚完就天上掉馅饼, 不早不晚一头撞上了美国的科技大跃进 ,泡沫起处有黄金,躲都躲不过。一路下来,直到今天,NLP 的工业曙光已然显现。 说到语言学的沉重包袱,业内人士都理解这是什么含义。Google 的吴军写过一本非常深入浅出的NLP和机器学习的入门书《 数学之美 》(他把晦涩干巴的统计公式和算法及其背后的人和事,能写到如此少妇能解,引人入胜,值得向后学强力推荐)。他转述了这么一个令语言学家心惊肉跳的业内掌故,一个理呆和文傻的浪漫悲剧。说是我们这行的一位机器学习的大牛,出道时与水性杨花的语言学家眉来眼去要搞合作,结果是语言学家觅得他欢,兴趣转移去写歌剧了。郎有情,妾无意,把他dump吊在那里了。大牛也是人,带着初恋失败似的恼怒,从此怨恨上了语言学家。在后来的系统中,几乎全部倚靠数据和自动学习算法,不断排挤语言学家。他的名言是:每当我开除一个语言学家,我的系统的正确率就提高数个百分点。在他眼中,语言学家就是一帮腐儒,只见树木不见森林,成事不足败事有余,不如炒丫鱿鱼,一了百了。 这位大牛当然有偏见。可他说的也是事实,这年头语言学和语言学家都不好做。数据爆炸的时代,语言学家无法垄断语言材料,代 social or 圣人言,稍不留神,即弄巧成拙。(传统)语言学不硬(据传属文科),语言学家当然也硬不起来。不见语言学家们爱吵架,为个小小的 self(反身代词),正室偏房的身份定位问题就闹了个鸡犬不宁,各种妻妾理论(Binding theories)和规则满天飞,互不服气,发论(战)文无数,跟三十年代文人为两个口号(国防文学vs大众文学)争辩到天昏地暗有一比。不怪让统计理呆们瞧不起。大事做不来,小事常 overdone,徒为系统增加 overhead,根本不讲 cost-effectiveness,依靠语言学家,还不如依靠数据。事实证明,这帮理呆不仅仅是会数数的精算师,他们也确实搞出了名堂,譬如统计型机器翻译(最漂亮的可算是 Google Translate ),譬如语音识别(最性感的要数 苹果爱疯的Siri小蜜) ,这些传统的NLP应用,到统计学家手中都做到了大规模实用,不服不行。统计学家不可一世,登门入室做掌门人是大势所趋。成为主流的统计学家和沦落为二等公民的语言学家这种尴尬还会存续很长一段时间。此乃箴言:永远不要与主流正面冲突。主流即合理。顺昌逆亡。 可是他们也有软肋。一是他们语言学实在太差,没有sense,离不开数据。结果呢,凡是缺乏数据的地方,丫就抓瞎了。二来呢,他们一根筋,凡是复杂的问题一律需要简化才可施行,说到底,再牛的算法也经不起组合爆炸。简化不了呢,或者简化以后成了一笔绕晕丫的糊涂账,他们也抓瞎。背后说人坏话不宜多,点到为止。 认真说起来,还是要二者精诚合作,方可取得真经。不是冤家不碰头,看造化了。 【后记】 白老师评说: “不要小看冲冠一怒引发的执着,它会让人把自己钟爱的思路压榨到极致,让不具备同样执着的对手奉陪不起。” 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|9317 次阅读|6 个评论
低调的FORTRAN为何不愿横行?—数组结构中为何竖排FORTRAN横排C
热度 1 hillside 2012-10-11 21:04
有一种说法:中国线装书是信任文化,现代胶装书是怀疑文化。从肢体语言看:手捧线装书,从上读到下、从右读到左,不住地点头;现代胶装书,从左读到右、从上读到下,不住地摇头。 横行应该是西方语言文字的传统,比如拉丁语。此处“横行”的一个含义是FORTRAN为IBM704量身定做的语言,扩张不是它的本义,另一个含义是指西方文字编排与阅读是先从左到右、横扫文字世界。 低调是指FORTRAN的数组存放与处理次序是取低头姿态,一路走低(列),偶一抬头(建立新列),又低眉顺沿(成语谐用)了。 我最近喜欢做些计算机比较语言学的粗浅思考。数组据说是最重要的数据结构,然而,在招牌语言中,却是竖排的FORTRAN横排的C。这是为何?FORTRAN二维数据、三维数组、多维数组的读取顺序为什么与人类的自然语言背道而驰?比如多语言混合编程,数据结构上的方凿圆枘、鸡同鸭讲构成了一道先天的屏障。为何FORTRAN不遵从西方传统的先左后右逻辑,却与古中国文化结构结下不解之缘?莱布尼茨的二进制据说可能受中国文化的启发,巴库斯也有中国情结吗? 文明源头之一的阿拉伯文字从右到左、从上到下的编排结构别具一格。中国线装书的从上到下、从左到右也不同凡响。然而,巴库斯为什么另辟蹊径、别出心裁,先从上至下、再从左到右呢? 下面转述一段网上关于FORTRAN与ALGOL的文字: “FORTRAN是人类所拥有的第一种高级语言。它把语言用那些特定机器所能接受的字符序列(亦就是IBM公司用来向计算机输入程序的卡片穿孔设备的48个字符)来定义.而它的那种卡片输入方式决定了很多的程序书写格式。例如通常把语言中的一个语句写在一个记录上,也就对应着穿孔的一张卡片;各个语句按顺序读入,对应着卡片的顺序读入;卡片的格式是固定的,构成后来所谓的固定源码形式。 不久降生的另外一种高级语言是ALGOL,这个名称就是算法语言的简称,因此可以预料到这种语言具有与FORTRAN非常不同的面貌,因为这种语言在设计初始,就不是计算机制造公司为某种特定机器设计的,而是纯粹面向描述计算过程的,也就是所谓面向算法描述的。 ALGOL最早是在1958年由德意志联邦共和国应用数学与力学协会提出的。ALGOL的设计目标显然比FORTRAN要来得高远,它希望不仅能够用于人对机器转述计算过程,也希望能够直接用于人与人之间的对于算法的描述。 为了实现这个通用的目的,ALGOL的字符不是针对任一具体机器定义的,因此它不反映任何一台特定机器的特性。实际上ALGOL所使用的字符与词汇完全是独立定义的。除此之外ALGOL还具有许多更加独特的性质。 不过语言终久摆脱不了它的市场属性,由于FORTRAN更加具有市场侵占能力,最终FORTRAN至今还是主流的科学计算编程语言,而ALGOL语言则不幸成为了任人凭吊的古董。” 我推测,FORTRAN对于数组结构的竖排不是出于巴库斯个人的喜好,而是机器的制约,后来由于市场与技术惯性,只能直来直去了(指垂直意)。 当然,以上是我从西方自然语言顺序天然优先角度的考虑,横排具有阅读优势。 不过从数据库结构来看,竖排的价值也是可以想见的,因为普通纸张的宽度以及早期打印机的迷你宽度(80列当时已是豪华配置,PC1500的打印纸其实只能称作打印竖条纸)都是极其有限的。因此,数据库的字段名与记录名只有一种选择,横为字段竖为记录。此时,如以行优先进行录入,那么,只能一个记录一个记录地手工敲击。我们知道,同一字段的数据是同质的、近似的,而不同字段可能是迥然有异的。以三字段为例:姓名、部门、性别、销售金额。在部门、性别等方面,先进行纵向录入的合理性、便利性一望即知。以数据处理而论,比如销售金额,往往是人们关心的,放在一列进行处理非常方便,也便于数据质量控制。Excel的数据处理也是列优先。 综上所述,数组处理的行优先反映了自然语言的特点,列优先反映了数据库处理的优势。至于两者运行效率差异的考量在计算机语言发明中可能并不是最重要的。
个人分类: 数学与统计园地|6795 次阅读|2 个评论
语言学和机器翻译的两个基本问题及其求解途径探新
geneculture 2012-10-8 01:05
语言学和机器翻译的两个基本问题及其求解途径探新
ZouXiaohui0:56:32 语言学的最大问题是研究对象不明确即不确定。索绪尔 指出这个问题至今其他人均未推进一步。因此,我的研究和发现推进了关键性的一步,即: 在形式上明确区分了基本研究对象“言”和派生研究对象“语”。 从而,就 比“语言”和“言语”这种内容与形式交织在一起的情形有显著改观。 为语言学发展成为语言科学扫清了道路,至少推开了一扇大门 。此事引起了语言学界徐通锵和潘文国的重视。 图1 言和语的关系及其典型示例 图2 言和语的关系数据库及其三类双语协同处理技术应用 机器翻译最大的问题是机译策略——金字塔模型。韦弗(Weaver)和瓦奎斯(Vauquois) 基于“中介语”假设而设定的单语转换策略 ,其问题至今其他人也均未逾越。为此,我发现并提出了 基于“双语”分而治之,进而联动协变的“蝴蝶模型”。 此事引起了机器翻译学界冯志伟研究员重视。 图3 基于“中介语”而设立的单语转换机器翻译策略——金字塔模型 图4基于“双语”分而治之进而联动协变的先解释后翻译策略——“蝴蝶模型” ZouXiaohui0:57:05 语言学的最大问题是研究对象不明确即不确定。 (2012-10-0800:04:59) http://blog.sina.com.cn/s/blog_65197d9301013gui.html ZouXiaohui0:55:13 机器翻译最大的问题是机译的单语连续转换策略——金字塔模型 (2012-10-0800:42:35) http://blog.sina.com.cn/s/blog_65197d9301013gvx.html
个人分类: 双语信息处理|2093 次阅读|0 个评论
形式主义与实体主义的语言学
热度 1 sjiong 2012-9-12 13:47
形式主义与实体主义的语言学
  索绪尔的语言学理论描绘了人类语言的形式主义轮廓。这里补充它的物质形态描述,也就有了实体主义语言学。它们二者组成广义语言学。语言文字都使用实体材料——声音和图像。语言文字都依赖人去操作和使用。语言文字都在社会中运行。因此语言文字的实体性不能被忽视。声音使用声波。图像使用光波。它们本身都是特殊的物质形态,具有实体性。作为知识,形式主义语言学很重要。与此同时,实体主义语言学是不应该被偏废的重要知识。   汉语语调知识无法从既有的形式标记中获得。我们必须从实体系统去寻找形式系统的缺失,然后去丰富形式主义理论,建设新的形式主义范畴。说一句大白话,汉语语调知识无法从已知知识概念作逻辑推理去获得。我们往往不得不避开引证制度去做弯弯绕的游戏!真理是在发展中前进的,无法一律用先人的高见垫底!
4641 次阅读|1 个评论
[转载]互联网时代的社会语言学:基于SNS的文本数据挖掘
热度 2 yangfanman 2012-8-12 17:41
互联网时代的社会语言学:基于SNS的文本数据挖掘 Brain Storm | 2012-08-10 18:03| 43 Comments | 本文内容遵从 CC版权协议 转载请注明出自matrix67.com 今年上半年,我在人人网实习了一段时间,期间得到了很多宝贵的数据,并做了一些还算有意义的事情,在这里和大家一块儿分享。感谢人人网提供的数据与工作环境,感谢赵继承博士、詹卫东老师的支持和建议。在这项工作中,我得到了很多与众人交流的机会,特别感谢 OpenParty 、 TEDxBeijing 提供的平台。本文已发表在了《程序员》杂志,分上下两部分刊于 2012 年 7 月刊和 8 月刊,在此感谢卢鸫翔编辑的辛勤工作。由于众所周知的原因,《程序员》刊出的文章被和谐过(看到后面大家就自动地知道被和谐的内容是什么了),因而我决定把完整版发在 Blog 上,同时与更多的人一同分享。对此感兴趣的朋友可以给我发邮件继续交流。好了,开始说正文吧。 作为中文系应用语言学专业的学生以及一名数学 Geek ,我非常热衷于用计算的方法去分析汉语资料。汉语是一种独特而神奇的语言。对汉语资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,比如分词——汉语的词与词之间没有空格,那计算机怎么才知道,“已结婚的和尚未结婚的青年都要实行计划生育”究竟说的是“已/结婚/的/和/尚未/结婚/的/青年”,还是“已/结婚/的/和尚/未/结婚/的/青年”呢?这就是所谓的分词歧义难题。不过,现在很多语言模型已经能比较漂亮地解决这一问题了。但在中文分词领域里,还有一个比分词歧义更令人头疼的东西——未登录词。中文没有首字母大写,专名号也被取消了,这叫计算机如何辨认人名地名之类的东西?更惨的则是机构名、品牌名、专业名词、缩略语、网络新词等等,它们的产生机制似乎完全无规律可寻。最近十年来,中文分词领域都在集中攻克这一难关。自动发现新词成为了关键的环节。 挖掘新词的传统方法是,先对文本进行分词,然后猜测未能成功匹配的剩余片段就是新词。这似乎陷入了一个怪圈:分词的准确性本身就依赖于词库的完整性,如果词库中根本没有新词,我们又怎么能信任分词结果呢?此时,一种大胆的想法是,首先不依赖于任何已有的词库,仅仅根据词的共同特征,将一段大规模语料中可能成词的文本片段全部提取出来,不管它是新词还是旧词。然后,再把所有抽出来的词和已有词库进行比较,不就能找出新词了吗?有了抽词算法后,我们还能以词为单位做更多有趣的数据挖掘工作。这里,我所选用的语料是人人网 2011 年 12 月前半个月部分用户的状态。非常感谢人人网提供这份极具价值的网络语料。 要想从一段文本中抽出词来,我们的第一个问题就是,怎样的文本片段才算一个词?大家想到的第一个标准或许是,看这个文本片段出现的次数是否足够多。我们可以把所有出现频数超过某个阈值的片段提取出来,作为该语料中的词汇输出。不过,光是出现频数高还不够,一个经常出现的文本片段有可能不是一个词,而是多个词构成的词组。在人人网用户状态中,“的电影”出现了 389 次,“电影院”只出现了 175 次,然而我们却更倾向于把“电影院”当作一个词,因为直觉上看,“电影”和“院”凝固得更紧一些。 为了证明“电影院”一词的内部凝固程度确实很高,我们可以计算一下,如果“电影”和“院”真的是各自独立地在文本中随机出现,它俩正好拼到一起的概率会有多小。在整个 2400 万字的数据中,“电影”一共出现了 2774 次,出现的概率约为 0.000113 。“院”字则出现了 4797 次,出现的概率约为 0.0001969 。如果两者之间真的毫无关系,它们恰好拼在了一起的概率就应该是 0.000113 × 0.0001969 ,约为 2.223 × 10 -8 次方。但事实上,“电影院”在语料中一共出现了 175 次,出现概率约为 7.183 × 10 -6 次方,是预测值的 300 多倍。类似地,统计可得“的”字的出现概率约为 0.0166 ,因而“的”和“电影”随机组合到了一起的理论概率值为 0.0166 × 0.000113 ,约为 1.875 × 10 -6 ,这与“的电影”出现的真实概率很接近——真实概率约为 1.6 × 10 -5 次方,是预测值的 8.5 倍。计算结果表明,“电影院”更可能是一个有意义的搭配,而“的电影”则更像是“的”和“电影”这两个成分偶然拼到一起的。 当然,作为一个无知识库的抽词程序,我们并不知道“电影院”是“电影”加“院”得来的,也并不知道“的电影”是“的”加上“电影”得来的。错误的切分方法会过高地估计该片段的凝合程度。如果我们把“电影院”看作是“电”加“影院”所得,由此得到的凝合程度会更高一些。因此,为了算出一个文本片段的凝合程度,我们需要枚举它的凝合方式——这个文本片段是由哪两部分组合而来的。令 p(x) 为文本片段 x 在整个语料中出现的概率,那么我们定义“电影院”的凝合程度就是 p(电影院) 与 p(电) · p(影院) 比值和 p(电影院) 与 p(电影) · p(院) 的比值中的较小值,“的电影”的凝合程度则是 p(的电影) 分别除以 p(的) · p(电影) 和 p(的电) · p(影) 所得的商的较小值。 可以想到,凝合程度最高的文本片段就是诸如“蝙蝠”、“蜘蛛”、“彷徨”、“忐忑”、“玫瑰”之类的词了,这些词里的每一个字几乎总是会和另一个字同时出现,从不在其他场合中使用。 光看文本片段内部的凝合程度还不够,我们还需要从整体来看它在外部的表现。考虑“被子”和“辈子”这两个片段。我们可以说“买被子”、“盖被子”、“进被子”、“好被子”、“这被子”等等,在“被子”前面加各种字;但“辈子”的用法却非常固定,除了“一辈子”、“这辈子”、“上辈子”、“下辈子”,基本上“辈子”前面不能加别的字了。“辈子”这个文本片段左边可以出现的字太有限,以至于直觉上我们可能会认为,“辈子”并不单独成词,真正成词的其实是“一辈子”、“这辈子”之类的整体。可见,文本片段的自由运用程度也是判断它是否成词的重要标准。如果一个文本片段能够算作一个词的话,它应该能够灵活地出现在各种不同的环境中,具有非常丰富的左邻字集合和右邻字集合。 “信息熵”是一个非常神奇的概念,它能够反映知道一个事件的结果后平均会给你带来多大的信息量。如果某个结果的发生概率为 p ,当你知道它确实发生了,你得到的信息量就被定义为 - log(p) 。 p 越小,你得到的信息量就越大。如果一颗骰子的六个面分别是 1 、 1 、 1 、 2 、 2 、 3 ,那么你知道了投掷的结果是 1 时可能并不会那么吃惊,它给你带来的信息量是 - log(1/2) ,约为 0.693 。知道投掷结果是 2 ,给你带来的信息量则是 - log(1/3) ≈ 1.0986 。知道投掷结果是 3 ,给你带来的信息量则有 - log(1/6) ≈ 1.79 。但是,你只有 1/2 的机会得到 0.693 的信息量,只有 1/3 的机会得到 1.0986 的信息量,只有 1/6 的机会得到 1.79 的信息量,因而平均情况下你会得到 0.693/2 + 1.0986/3 + 1.79/6 ≈ 1.0114 的信息量。这个 1.0114 就是那颗骰子的信息熵。现在,假如某颗骰子有 100 个面,其中 99 个面都是 1 ,只有一个面上写的 2 。知道骰子的抛掷结果是 2 会给你带来一个巨大无比的信息量,它等于 - log(1/100) ,约为 4.605 ;但你只有百分之一的概率获取到这么大的信息量,其他情况下你只能得到 - log(99/100) ≈ 0.01005 的信息量。平均情况下,你只能获得 0.056 的信息量,这就是这颗骰子的信息熵。再考虑一个最极端的情况:如果一颗骰子的六个面都是 1 ,投掷它不会给你带来任何信息,它的信息熵为 - log(1) = 0 。什么时候信息熵会更大呢?换句话说,发生了怎样的事件之后,你最想问一下它的结果如何?直觉上看,当然就是那些结果最不确定的事件。没错,信息熵直观地反映了一个事件的结果有多么的随机。 我们用信息熵来衡量一个文本片段的左邻字集合和右邻字集合有多随机。考虑这么一句话“吃葡萄不吐葡萄皮不吃葡萄倒吐葡萄皮”,“葡萄”一词出现了四次,其中左邻字分别为 {吃, 吐, 吃, 吐} ,右邻字分别为 {不, 皮, 倒, 皮} 。根据公式,“葡萄”一词的左邻字的信息熵为 - (1/2) · log(1/2)- (1/2) · log(1/2) ≈ 0.693 ,它的右邻字的信息熵则为 - (1/2) · log(1/2) - (1/4) · log(1/4) - (1/4) · log(1/4) ≈ 1.04 。可见,在这个句子中,“葡萄”一词的右邻字更加丰富一些。 在人人网用户状态中,“被子”一词一共出现了 956 次,“辈子”一词一共出现了 2330 次,两者的右邻字集合的信息熵分别为 3.87404 和 4.11644 ,数值上非常接近。但“被子”的左邻字用例非常丰富:用得最多的是“晒被子”,它一共出现了 162 次;其次是“的被子”,出现了 85 次;接下来分别是“条被子”、“在被子”、“床被子”,分别出现了 69 次、 64 次和 52 次;当然,还有“叠被子”、“盖被子”、“加被子”、“新被子”、“掀被子”、“收被子”、“薄被子”、“踢被子”、“抢被子”等 100 多种不同的用法构成的长尾……所有左邻字的信息熵为 3.67453 。但“辈子”的左邻字就很可怜了, 2330 个“辈子”中有 1276 个是“一辈子”,有 596 个“这辈子”,有 235 个“下辈子”,有 149 个“上辈子”,有 32 个“半辈子”,有 10 个“八辈子”,有 7 个“几辈子”,有 6 个“哪辈子”,以及“n 辈子”、“两辈子”等 13 种更罕见的用法。所有左邻字的信息熵仅为 1.25963 。因而,“辈子”能否成词,明显就有争议了。“下子”则是更典型的例子, 310 个“下子”的用例中有 294 个出自“一下子”, 5 个出自“两下子”, 5 个出自“这下子”,其余的都是只出现过一次的罕见用法。事实上,“下子”的左邻字信息熵仅为 0.294421 ,我们不应该把它看作一个能灵活运用的词。当然,一些文本片段的左邻字没啥问题,右邻字用例却非常贫乏,例如“交响”、“后遗”、“鹅卵”等,把它们看作单独的词似乎也不太合适。我们不妨就把一个文本片段的自由运用程度定义为它的左邻字信息熵和右邻字信息熵中的较小值。 在实际运用中你会发现,文本片段的凝固程度和自由程度,两种判断标准缺一不可。只看凝固程度的话,程序会找出“巧克”、“俄罗”、“颜六色”、“柴可夫”等实际上是“半个词”的片段;只看自由程度的话,程序则会把“吃了一顿”、“看了一遍”、“睡了一晚”、“去了一趟”中的“了一”提取出来,因为它的左右邻字都太丰富了。 我们把文本中出现过的所有长度不超过 d 的子串都当作潜在的词(即候选词,其中 d 为自己设定的候选词长度上限,我设定的值为 5 ),再为出现频数、凝固程度和自由程度各设定一个阈值,然后只需要提取出所有满足阈值要求的候选词即可。为了提高效率,我们可以把语料全文视作一整个字符串,并对该字符串的所有后缀按字典序排序。下表就是对“四是四十是十十四是十四四十是四十”的所有后缀进行排序后的结果。实际上我们只需要在内存中存储这些后缀的前 d + 1 个字,或者更好地,只储存它们在语料中的起始位置。 十 十十四是十四四十是四十 十是十十四是十四四十是四十 十是四十 十四是十四四十是四十 十四四十是四十 是十十四是十四四十是四十 是十四四十是四十 是四十 是四十是十十四是十四四十是四十 四十 四十是十十四是十四四十是四十 四十是四十 四是十四四十是四十 四是四十是十十四是十四四十是四十 四四十是四十 这样的话,相同的候选词便都集中在了一起,从头到尾扫描一遍便能算出各个候选词的频数和右邻字信息熵。将整个语料逆序后重新排列所有的后缀,再扫描一遍后便能统计出每个候选词的左邻字信息熵。另外,有了频数信息后,凝固程度也都很好计算了。这样,我们便得到了一个无需任何知识库的抽词算法,输入一段充分长的文本,这个算法能以大致 O(n · logn) 的效率提取出可能的词来。 对不同的语料进行抽词,并且按这些词的频数从高到低排序。你会发现,不同文本的用词特征是非常明显的。下面是对《西游记》上册的抽词结果: 行者、师父、三藏、八戒、大圣、菩萨、悟空、怎么、和尚、唐僧、老孙、溃骸、什么、沙僧、太宗、徒弟、袈裟、妖精、玉帝、今日、兄弟、公主、玄奘、陛下、宝贝、性命、晓得、门外、妖魔、光蕊、观音、花果山、土地、木叉、东土、变化、变做、伯钦、判官、多少、真君、齐天大圣、蟠桃、丞相、魏征、扯住、溃骸澳、抬头、揭谛、言语、猪八戒、兵器、吩咐、安排、叩头、清风、哪吒、左右、美猴王、钉钯、孩儿、女婿、金箍棒、二郎、东西、许多、奈何、人参果、收拾、近前、太保、明月、南海、水帘洞、门首、弼马温、李天王…… 《资本论》全文: 商品、形式、货币、我们、过程、自己、机器、社会、部分、表现、没有、流通、需要、增加、已经、交换、关系、先令、积累、必须、英国、条件、发展、麻布、儿童、进行、提高、消费、减少、任何、手段、职能、土地、特殊、实际、完全、平均、直接、随着、简单、规律、市场、增长、上衣、决定、什么、制度、最后、支付、许多、虽然、棉纱、形态、棉花、法律、绝对、提供、扩大、独立、世纪、性质、假定、每天、包含、物质、家庭、规模、考察、剥削、经济学、甚至、延长、财富、纺纱、购买、开始、代替、便士、怎样、降低、能够、原料、等价物…… 《圣经》全文: 以色列、没有、自己、一切、面前、大卫、知道、什么、犹大、祭司、摩西、看见、百姓、吩咐、埃及、听见、弟兄、告诉、基督、已经、先知、扫罗、父亲、雅各、永远、攻击、智慧、荣耀、临到、洁净、离开、怎样、平安、律法、支派、许多、门徒、打发、好像、仇敌、原文作、名叫、巴比伦、今日、首领、旷野、所罗门、约瑟、两个、燔祭、法老、衣服、脱离、二十、公义、审判、十二、亚伯拉罕、石头、聚集、按着、祷告、罪孽、约书亚、事奉、指着、城邑、进入、彼此、建造、保罗、应当、摩押、圣灵、惧怕、应许、如今、帮助、牲畜…… 《时间简史》全文: 黑洞、必须、非常、任何、膨胀、科学、预言、太阳、观察、定律、运动、事件、奇点、坍缩、问题、模型、方向、区域、知道、开始、辐射、部分、牛顿、产生、夸克、无限、轨道、解释、边界、甚至、自己、类似、描述、最终、旋转、爱因斯坦、绕着、什么、效应、表明、温度、研究、收缩、吸引、按照、完全、增加、开端、基本、计算、结构、上帝、进行、已经、发展、几乎、仍然、足够、影响、初始、科学家、事件视界、第二、改变、历史、世界、包含、准确、证明、导致、需要、应该、至少、刚好、提供、通过、似乎、继续、实验、复杂、伽利略…… 哦,对了,还有我最喜欢的,《人民日报》 2000 年 4 月新闻版的抽词结果: 发展、我们、经济、主席、江泽民、领导、建设、关系、教育、干部、企业、问题、主义、政治、群众、改革、政府、思想、加强、台湾、地区、北京、总统、世界、记者、代表、民族、组织、历史、访问、原则、努力、管理、今天、技术、市场、世纪、坚持、社会主义、财政、江泽民主席、增长、积极、精神、同志、双方、自己、友好、领导干部、进一步、基础、提高、必须、不断、制度、政策、解决、取得、表示、活动、支持、通过、研究、没有、学习、稳定、举行、欢迎、农村、生活、促进、科技、投资、科学、环境、领域、公司、情况、充分…… 当然,我也没有忘记对人人网用户状态进行分析——人人网用户状态中最常出现的词是: 哈哈、什么、今天、怎么、现在、可以、知道、喜欢、终于、这样、觉得、因为、如果、感觉、开始、回家、考试、老师、幸福、朋友、时间、发现、东西、快乐、为什么、睡觉、生活、已经、希望、最后、各种、状态、世界、突然、手机、其实、那些、同学、孩子、尼玛、木有、然后、以后、学校、所以、青年、晚安、原来、电话、加油、果然、学习、中国、最近、应该、需要、居然、事情、永远、特别、北京、他妈、伤不起、必须、呵呵、月亮、毕业、问题、谢谢、英语、生日快乐、工作、虽然、讨厌、给力、容易、上课、作业、今晚、继续、努力、有木有、记得…… 事实上,程序从人人网的状态数据中一共抽出了大约 1200 个词,里面大多数词也确实都是标准的现代汉语词汇。不过别忘了,我们的目标是新词抽取。将所有抽出来的词与已有词库作对比,于是得到了人人网特有的词汇(同样按频数从高到低排序): 尼玛、伤不起、给力、有木有、挂科、坑爹、神马、淡定、老爸、卧槽、牛逼、肿么、苦逼、无语、微博、六级、高数、选课、悲催、基友、蛋疼、很久、人人网、情何以堪、童鞋、哇咔咔、脑残、吐槽、猥琐、奶茶、我勒个去、刷屏、妹纸、胃疼、飘过、考研、弱爆了、太准了、搞基、忽悠、羡慕嫉妒恨、手贱、柯南、狗血、秒杀、装逼、真特么、碎觉、奥特曼、内牛满面、斗地主、腾讯、灰常、偶遇、拉拉、屌丝、九把刀、高富帅、阿内尔卡、魔兽世界、线代、三国杀、林俊杰、速速、臭美、花痴…… 我还想到了更有意思的玩法。为什么不拿每一天状态里的词去和前一天的状态作对比,从而提取出这一天里特有的词呢?这样一来,我们就能从人人网的用户状态中提取出每日热点了!从手里的数据规模看,这是完全有可能的。我选了 12 个比较具有代表性的词,并列出了它们在 2011 年 12 月 13 日的用户状态中出现的频数(左列的数),以及 2011 年 12 月 14 日的用户状态中出现的频数(右列的数): 下雪 33 92 那些年 139 146 李宇春 1 4 看见 145 695 魔兽 23 20 高数 82 83 生日快乐 235 210 今天 1416 1562 北半球 2 18 脖子 23 69 悲伤 61 33 电磁炉 0 3 大家可以从直觉上迅速判断出,哪些词可以算作是 12 月 14 日的热词。比方说,“下雪”一词在 12 月 13 日只出现了 33 次,在 12 月 14 日却出现了 92 次,后者是前者的 2.8 倍,这不大可能是巧合,初步判断一定是 12 月 14 日真的有什么地方下雪了。“那些年”在 12 月 14 日的频数确实比 12 月 13 日更多,但相差并不大,我们没有理由认为它是当日的一个热词。 一个问题摆在了我们面前:我们如何去量化一个词的“当日热度”?第一想法当然是简单地看一看每个词的当日频数和昨日频数之间的倍数关系,不过细想一下你就发现问题了:它不能解决样本过少带来的偶然性。 12 月 14 日“李宇春”一词的出现频数是 12 月 13 日的 4 倍,这超过了“下雪”一词的 2.8 倍,但我们却更愿意相信“李宇春”的现象只是一个偶然。更麻烦的则是“电磁炉”一行, 12 月 14 日的频数是 12 月 13 日的无穷多倍,但显然我们也不能因此就认为“电磁炉”是 12 月 14 日最热的词。 忽略所有样本过少的词?这似乎也不太好,样本少的词也有可能真的是热词。比如“北半球”一词,虽然它在两天里的频数都很少,但这个 9 倍的关系确实不容忽视。事实上,人眼很容易看出哪些词真的是 12 月 14 日的热词:除了“下雪”以外,“看见”、“北半球”和“脖子”也应该是热词。你或许坚信后三个词异峰突起的背后一定有什么原因(并且迫切地想知道这个原因究竟是什么),但却会果断地把“李宇春”和“电磁炉”这两个“异常”归结为偶然原因。你的直觉是对的—— 2011 年 12 月 14 日发生了极其壮观的双子座流星雨,此乃北半球三大流星雨之一。白天网友们不断转发新闻,因而“北半球”一词热了起来;晚上网友们不断发消息说“看见了”、“又看见了”,“看见”一词的出现频数猛增;最后呢,仰望天空一晚上,脖子终于出毛病了,于是回家路上一个劲儿地发“脖子难受”。 让计算机也能聪明地排除偶然因素,这是我们在数据挖掘过程中经常遇到的问题。我们经常需要对样本过少的项目进行“平滑”操作,以避免分母过小带来的奇点。这里,我采用的是一个非常容易理解的方法:一个词的样本太少,就给这个词的热度打折扣。为了便于说明,我们选出四个词为例来分析。 下表截取了前四个词,右边四列分别表示各词在 12 月 13 日出现的频数,在 12 月 14 日出现的频数,在两天里一共出现的总频数,以及后一天的频数所占的比重。第三列数字是前两列数字之和,第四列数字则是第二列数字除以第三列数字的结果。最后一列应该是一个 0 到 1 之间的数,它表明对应的词有多大概率出现在了 12 月 14 日这一天。最后一列可以看作是各词的得分。可以看到,此时“下雪”的得分低于“李宇春”,这是我们不希望看到的结果。“李宇春”的样本太少,我们想以此为缘由把它的得分拖下去。 下雪 33 92 125 0.736 那些年 139 146 285 0.512 李宇春 1 4 5 0.8 看见 145 695 840 0.827 (平均) 313.75 0.719 怎么做呢?我们把每个词的得分都和全局平均分取一个加权平均!首先计算出这四个词的平均总频数,为 313.75 ;再计算出这四个词的平均得分,为 0.719 。接下来,我们假设已经有 313.75 个人预先给每个词都打了 0.719 分,换句话说每个词都已经收到了 313.75 次评分,并且所有这 313.75 个评分都是 0.719 分。“下雪”这个词则还有额外的 125 个人评分,其中每个人都给了 0.736 分。因此,“下雪”一词的最终得分就是: 下雪 (0.736 × 125 + 0.719 × 313.75) / (125 + 313.75) ≈ 0.724 类似地,其他几个词的得分依次为: 那些年 (0.512 × 285 + 0.719 × 313.75) / (285 + 313.75) ≈ 0.62 李宇春 (0.8 × 5 + 0.719 × 313.75) / (5 + 313.75) ≈ 0.7202 看见 (0.827 × 840 + 0.719 × 313.75) / (840 + 313.75) ≈ 0.798 容易看出,此时样本越大的词,就越有能力把最终得分拉向自己本来的得分,样本太小的词,最终得分将会与全局平均分非常接近。经过这么一番调整,“下雪”一词的得分便高于了“李宇春”。实际运用中, 313.75 这个数也可以由你自己来定,定得越高就表明你越在意样本过少带来的负面影响。这种与全局平均取加权平均的思想叫做 Bayesian average ,从上面的若干式子里很容易看出,它实际上是最常见的平滑处理方法之一——分子分母都加上一个常数——的一种特殊形式。 利用之前的抽词程序抽取出人人网每一天内用户状态所含的词,把它们的频数都与前一天的作对比,再利用刚才的方法加以平滑,便能得出每一天的热词了。我手上的数据是人人网 2011 年 12 月上半月的数据,因此我可以得出从 12 月 2 日到 12 月 15 日的热词(选取每日前 5 名,按得分从高到低)。 2011-12-02:第一场雪、北京、金隅、周末、新疆 2011-12-03:荷兰、葡萄牙、死亡之组、欧洲杯、德国 2011-12-04:那些年、宣传、期末、男朋友、升旗 2011-12-05:教室、老师、视帝、体育课、质量 2011-12-06:乔尔、星期二、摄影、经济、音乐 2011-12-07:陈超、星巴克、优秀、童鞋、投票 2011-12-08:曼联、曼城、欧联杯、皇马、冻死 2011-12-09:保罗、月全食、交易、火箭、黄蜂 2011-12-10:变身、罗伊、穿越、皇马、巴萨 2011-12-11:皇马、巴萨、卡卡、梅西、下半场 2011-12-12:淘宝、阿内尔卡、双十二、申花、老师 2011-12-13:南京、南京大屠杀、勿忘国耻、默哀、警报 2011-12-14:流星雨、许愿、愿望、情人节、几颗 2011-12-15:快船、保罗、巴萨、昨晚、龙门飞甲 看来, 12 月 14 日果然有流星雨发生。 注意,由于我们仅仅对比了相邻两天的状态,因而产生了个别实际上是由工作日/休息日的区别造成的“热词”,比如“教室”、“老师”、“星期二”等。把这样的词当作热词可能并不太妥。结合上周同日的数据,或者干脆直接与之前整个一周的数据来对比,或许可以部分地解决这一问题。 事实上,有了上述工具,我们可以任意比较两段不同文本中的用词特点。更有趣的是,人人网状态的大多数发布者都填写了性别和年龄的个人信息,我们为何不把状态重新分成男性和女性两组,或者 80 后和 90 后两组,挖掘出不同属性的人都爱说什么?要知道,在过去,这样的问题需要进行大规模语言统计调查才能回答!然而,在互联网海量用户生成内容的支持下,我们可以轻而易举地挖掘出答案来。 我真的做了这个工作(基于另一段日期内的数据)。男性爱说的词有: 兄弟、篮球、男篮、米兰、曼联、足球、蛋疼、皇马、比赛、国足、超级杯、球迷、中国、老婆、政府、航母、踢球、赛季、股市、砸蛋、牛逼、铁道部、媳妇、国际、美国、连败、魔兽、斯内德、红十字、经济、腐败、程序、郭美美、英雄、民主、鸟巢、米兰德比、官员、内涵、历史、训练、评级、金融、体育、记者、事故、程序员、媒体、投资、事件、社会、项目、伊布、主义、决赛、操蛋、纳尼、领导、喝酒、民族、新闻、言论、和谐、农民、体制、城管…… 下面则是女性爱说的词: 一起玩、蛋糕、加好友、老公、呜呜、姐姐、嘻嘻、老虎、讨厌、妈妈、呜呜呜、啦啦啦、便宜、减肥、男朋友、老娘、逛街、无限、帅哥、礼物、互相、奶茶、委屈、各种、高跟鞋、指甲、城市猎人、闺蜜、巧克力、第二、爸爸、宠物、箱子、吼吼、大黄蜂、狮子、胃疼、玫瑰、包包、裙子、游戏、遇见、嘿嘿、灰常、眼睛、各位、妈咪、化妆、玫瑰花、蓝精灵、幸福、陪我玩、任务、怨念、舍不得、害怕、狗狗、眼泪、温暖、面膜、收藏、李民浩、神经、土豆、零食、痘痘、戒指、巨蟹、晒黑…… 下面是 90 后用户爱用的词: 加好友、作业、各种、乖乖、蛋糕、来访、卧槽、通知书、麻将、聚会、补课、欢乐、刷屏、录取、无限、互相、速度、一起玩、啦啦啦、晚安、求陪同、基友、美女、矮油、巨蟹、五月天、第二、唱歌、老虎、扣扣、啧啧、帅哥、哈哈哈、尼玛、便宜、苦逼、斯内普、写作业、劳资、孩纸、哎哟、炎亚纶、箱子、无聊、求来访、查分、上课、果断、处女、首映、屏蔽、混蛋、暑假、吓死、新东方、组队、下学期、陪我玩、打雷、妹纸、水瓶、射手、搞基、吐槽、同学聚会、出去玩、呜呜、白羊、表白、做作业、签名、姐姐、停机、伏地魔、对象、哈哈、主页、情侣、无压力、共同、摩羯、碎觉、肿么办…… 下面则是 80 后用户爱用的词: 加班、培训、周末、工作、公司、各位、值班、砸蛋、上班、任务、公务员、工资、领导、包包、办公室、校内、郭美美、时尚、企业、股市、新号码、英国、常联系、实验室、论文、忙碌、项目、部门、祈福、邀请、招聘、顺利、朋友、红十字、男朋友、媒体、产品、标准、号码、存钱、牛仔裤、曼联、政府、简单、立秋、事故、伯明翰、博士、辞职、健康、销售、深圳、奶茶、搬家、实验、投资、节日快乐、坚持、规则、考验、生活、体制、客户、发工资、忽悠、提供、教育、处理、惠存、沟通、团购、缺乏、腐败、启程、红十字会、结婚、管理、环境、暴跌、服务、变形金刚、祝福、银行…… 不仅如此,不少状态还带有地理位置信息,因而我们可以站在空间的维度对信息进行观察。这个地方的人都爱说些什么?爱说这个词的人都分布在哪里?借助这些包含地理位置的签到信息,我们也能挖掘出很多有意思的结果来。例如,对北京用户的签到信息进行抽词,然后对于每一个抽出来的词,筛选出所有包含该词的签到信息并按地理坐标的位置聚类,这样我们便能找出那些地理分布最集中的词。结果非常有趣:“考试”一词集中分布在海淀众高校区,“天津”一词集中出现在北京南站,“逛街”一词则全都在西单附近扎堆。北京首都国际机场也是一个非常特别的地点,“北京”、“登机”、“终于”、“再见”等词在这里出现的密度极高。 从全国范围来看,不同区域的人也有明显的用词区别。我们可以将全国地图划分成网格,统计出所有签到信息在各个小格内出现的频数,作为标准分布;然后对于每一个抽出来的词,统计出包含该词的签到信息在各个小格内出现的频数,并与标准分布进行对比(可以采用余弦距离等公式),从而找出那些分布最反常的词。程序运行后发现,这样的词还真不少。一些明显具有南北差异的词,分布就会与整个背景相差甚远。例如,在节假日的时候,“滑雪”一词主要在北方出现,“登山”一词则主要在南方出现。地方特色也是造成词语分布差异的一大原因,例如“三里屯”一词几乎只在北京出现,“热干面”一词集中出现在武汉地区,“地铁”一词明显只有个别城市有所涉及。这种由当地人的用词特征反映出来的真实的地方特色,很可能是许多旅游爱好者梦寐以求的信息。另外,方言也会导致用词分布差异,例如“咋这么”主要分布在北方地区,“搞不懂”主要分布在南方城市,“伐”则非常集中地出现在上海地区。当数据规模足够大时,或许我们能通过计算的方法,自动对中国的方言区进行划分。 其实,不仅仅是发布时间、用户年龄、用户性别、地理位置这四个维度,我们还可以对浏览器、用户职业、用户活跃度、用户行为偏好等各种各样的维度进行分析,甚至可以综合考虑以上维度,在某个特定范围内挖掘热点事件,或者根据语言习惯去寻找出某个特定的人群。或许这听上去太过理想化,不过我坚信,有了合适的算法,这些想法终究会被一一实现。
个人分类: 复杂网络|3818 次阅读|2 个评论
语言学专业推荐课外书单
热度 1 gothere 2012-8-11 13:43
一、语言学系列 1.《破解古埃及:一场激烈的智力战争》,是我读过的最精彩的一本关于语言学的传记作品,毫无疑问,它会极大地发掘你对语言学的兴趣。 内容简介:所讲述的故事背景可追溯到1796年拿破仑大举出兵动埃及这段历史。拿破仑的这次军事行动,旨在占领并控制埃及,继续向东扩展,结果以失败告终。而拿破仑所派遣的学者随军远征埃及,对当地的古迹进行探察,带回了埃及罗塞塔石碑与大量考古资料,却引发出一场争相破解古埃及象形文字的竞赛。这场竞赛最终演变为法国的商博良与英国的托马斯·杨的两强争霸。 《破解古埃及:一场激烈的智力战争》通过商博良的通信和日记,细致地重述了他破解古埃及文字的奋斗历程。书中描绘了他在短短十数年的学术生涯中所经历的各种困难和挫折,叙述了他与同时代学者的往来关系,与家人的关系,与政坛人物的关系,与其朋友和对手的关系。读者从中可以了解这是一场没有鸣枪起跑的正式竞赛,重要的是在这场没有游戏规则的激烈竞争中,作为英雄主义者的商博良是如何在挫败竞争者的攻击中成为第一位读懂古埃及文的人的;可以了解到古埃及象形文字的基本知识;从中还可以发现欧洲殖民扩张与早期东方学的密切关系;英法两国在地缘政治利益的驱动下所展开的权力斗争,是怎样冲击和影响学术发展的,埃及学这门学问又是如何随着学者们对古埃及象形文字的研究而应运产生的。 2.原始思维 列维-布留尔,是一本特别引人入胜的书,人类学、民族学、语言学都从中引出很多思考。 3.萨丕尔的《语言论》和洪堡特《论人类语言结构的差异及其对人类精神发展的影响》也很精彩。 4.现代语言学教程,霍凯特。美国结构主义语言学的语言分析的经典教材,内有很多种语言的材料,练习非常有趣,是1950年代以前,现代语言学的上乘之作。比布隆菲尔德的《语言论》更适合本科生。很多题目可以直接放在国际语言学奥林匹克竞赛。读完后还可重读一遍英文版的。 5.Lakoff的《Metaphors we live by》很棒,英文版,网络上有pdf的,可以好好读一读。 6.比较新的还有Google成员写的《数学之美》,是语言信息处理的一本不错的散文小书,问题是有些数学模型一时看不懂。 语言学家传记,可以看赵元任、索绪尔、维特根斯坦,都很有趣。读完这些书,才可以慢慢去读较为理论而枯燥的众多语言学专著。 二、史哲系列 1.房龙作品:人类的艺术、人类的故事、与字母一起漫游世界、圣经的故事。(散文化叙事) 2.杜兰特:西方哲学的故事(散文化叙事) 3.贾德:苏菲的世界 (哲学入门书,儿童对话体,深入浅出) 4.柏拉图:理想国(对话体,哲学的第一书) 5.圣经(包括新约和旧约) 6.剑桥系列世界史和中国史(和中学内容有较大差别,非一日之功,可以先找自己感兴趣的年代读起) 7.史记(通读一遍,收获巨大,而后方想25史) 三、文学系列 四大名著、金瓶梅、浮士德、哈姆雷特(最好看英文版)、道德经、庄子、论语、战争与和平、百年孤独 唐诗宋词(背300首以上) 梁启超文选、胡适文选、鲁迅文选、张爱玲文选、沈从文小说、高行健《灵山》、毛姆文选 近年来的诺贝尔奖作品 四、电影系列 (最综合的当代艺术) 霸王别姬(中国电影的代表作)、活者、the Wall 校园生活剧:春风化雨(死亡诗社)、3idiots、flame(名扬四海1980) 历届奥斯卡经典影片
个人分类: Linguistics|8847 次阅读|3 个评论
2012语言学奥林匹克闭幕-中国队首次出战成绩不佳
热度 1 gothere 2012-8-8 19:49
没错,语言学也有奥林匹克,是国际奥林匹克竞赛的12种大赛之一。 大赛介绍 第一届比赛于1965年举行,它是由爱菲尔德· 納瓯莫维奇·齐林斯基 (Alfred Naumovich Zhurinskiy) 最早发起的,他本人设计了第一届比赛的全部问题。 竞赛中的问题包罗万象,含语音知识、历史语言学、句法学,甚至还包括人造语言(因为科学家对此颇感兴趣)。所有的问题皆直接取材于语言学家的日常研究,只 不过是加以简化。有趣的地方是,参赛者不需具备任何的语言学知识或者懂得多种语言,所有的问题都能够在考题的范围内找得到答案。换句话来说,就是只要应用 一点逻辑的知识再加上细心,任何人都可以解决这些问题。比赛分为个人赛和小组赛。个人赛规定选手在6个小时以内解决5个问题,每个问题的分值等同,皆为20分。小组赛通常只需解决一个问题,小组成员要求在4个小时以内解决一个难度较大的问题。所有的参赛选手可以选择自己的比赛语言——所有的问题都会翻译成他们选定的语种。 本届比赛 2012年7月30日至8月3日,第10届国际奥林匹克竞赛在斯洛文尼亚共和国首都卢布尔雅那胜利举行。本届大赛共有来自26个国家的34个代表队。中国、希腊、匈牙利、以色列、日本均是第一次派队参加。大赛的题目涉及Dyirbal, Umbu-Ungu, Basque, Teop, Rotuman,Lao等多种稀有语言。比赛共决出37块奖牌(8金、13银、16铜)、24个突出奖、3个优胜队、一个团体奖杯、10个最佳解答奖。赛果见 http://www.ioling.org/results/2012/#2。 中国队共派出2队共8名队员参加了本次大赛,仅获得1个突出奖。俄罗斯的圣彼得堡队战绩最佳,获得多块个人和团体金牌,美国和波兰队战绩也相当不错。总的来说,缺乏足够语言学训练的中学生参加这样的大赛还是比较勉强的。毕竟语言学不像数理化一样,中学教师的实力已经相当了得。我国语言学的教学基本上还是在大学展开的。相信在未来,语言学奥赛会引起越来越多的关注。 北京备战 6月8日, 首届全国青少年语言学奥林匹克竞赛在京顺利举行。大赛由中国语言学奥林匹克竞赛组委会、中国教育国际交流协会青少年国际竞赛与交流办公室共同主办,北京康 福外国语学校承办。来自人大附中、十一学校、北京十二中、康福外国语学校、新东方外国语学校等多所中学的学生参加比赛。 本次大赛的优胜者将组成中国代表队,参加今年7月30日至8月3日在斯洛文尼亚举办的第十届国际语言学奥林匹克竞赛。
个人分类: Linguistics|7054 次阅读|2 个评论
认识形式的分类,感性、理性、符号
yue 2012-8-5 10:27
认识一般被分为感性认识、理性认识,或许还应该增加一类,就是符号认识。 因为理性认识的定义是混乱的,有时候被定义为对事物本质的认识,或者是上升到概念的认识。而对事物本质的认识不一定是感性的,还是符号的。因此有必要澄清。 感性认识和理性认识的区别是:是否是对规律和本质的认识。这种区别或许是按照事物本身的矛盾来区别,即按照现象和本质的区别。 符号则是对事物感性的认识,但是运用了符号。符号和事物的本质完全无关,只和特征或特点有关,符号的目的或制定符号的规则,只是要求把事物区别开来。而把事物区别开来,和事物的本质完全无关。 可见,三者是有交叉的,但是有完全不同的内涵。 或许概念不是符号(名称),或符号本身,而是对符号的定义,对符号的说明,对符号的规定。 符号本身几乎什么意义都不能包含。只有汉字作为符号,才包含少量的意义。 当然,如果改变理性认识的定义,或许可以更合理。即排除理性认识对本质和规律的包含。 即把感性认识包含对事物现象和本质的认识。因为在感性认识也可以认识事物的本质和规律,而且本质和规律主要是而且唯一可靠的方法就是感性认识。 如果把概念作为符号,它本身不包含任何意义,只有定义才包含意义。因此概念不是一个词语,而是一个定义。概念和判断的区别在于:概念是规定一个事物或一类事物,而判断是讲两个事物之间的关系。
个人分类: 普罗米修斯 哲学|5055 次阅读|0 个评论
[转载]2012语言学的长江学者
热度 1 gothere 2012-7-31 23:02
江苏师范大学 语言学及应用语言学 杨亦鸣 中国 江苏师范大学 南京大学 汉语言文字学 沈阳 中国 北京大学 中山大学 英语语言文学 黄国文 中国 中山大学
个人分类: Else|3720 次阅读|1 个评论
《我们赖以生存的隐喻》2003年作者后记之翻译
热度 2 gothere 2012-7-31 00:22
《我们赖以生存的隐喻》2003年作者后记之翻译 (译者按:这篇后记梳理了20多年隐喻理论的发展,评介了相关理论,读后很有收获。) 精简意译版by李斌 gothere@126.com,如需转载请与我联系,谢谢! 不曾想到,20多年前的这本小书对人类心智的研究有不少贡献。这本书的主旨是反思心智研究中的最基本问题:意义、真理、思维的本质、身体对心灵的塑造。这本书影响到了语言学、认知科学、哲学、文学研究、政治学、法学、种族、数学、科学哲学等领域。 我们如何思维确实与隐喻密切相关。隐喻性思维在有意识和无意识的心理生活中是平常的、无所不在的(Ubiquitous)。隐喻的中心是推理(inference),感觉运动域(sensory-motor)投射到其他域。 之前学者的错误(Fallacy)有四种。(1)隐喻是词语的问题(2)基于相似性(3)所有的概念都是字面义没有隐喻义(4)理性思维并不是由大脑和身体决定的。 本书的观点是(1)隐喻不是词语的问题,而是概念的问题(2)隐喻并非基于相似性,而是基于跨域(cross-domain)的认知相关,这种相关有时甚至是依靠隐喻来创造的。(3)我们最基本、稳定的概念——时间、事件、因果、道德、心智——的理解和推理都是依靠多种隐喻的。(4)概念隐喻的系统不是任意的或历史连续的,而是由我们的身体和在日常世界中作用的共同方式的自然属性来形成的一个显著的内容。 阻止我们达到这些的认识最大阻力在于,否认了隐喻的概念属性,不承认隐喻的概念化和推理。传统的四种错误仍然具有市场,其流毒难以消除。 概念隐喻的证据 一个认知域隐喻地投射到另一个认知域。这种投射是抽象的、任意的么?不!两个认知域之间是在经验上相关的。日常语言是隐喻的。隐喻是一个自然现象。概念隐喻是人类思维的一个自然部分,语言学隐喻是人类语言的一个自然部分。此外,我们所拥有的隐喻和意义都依靠着我们身体的自然性,与外在物理世界的交互和社会文化实践。 在1980年出版的这本书里面,我们在两个领域寻找概念隐喻的证据:(1)系统的多义词(systematic polysemy):比如up、down、fall、rise等词不仅仅是纵轴关系,还具有数量关系。所以在More Is Up中,我们用rise来说明数量的增加。(译者按:这样写太费劲,其实可以简明地指出,多义词的各个义项往往都是第一个基本义的隐喻扩展,是利用基本义的认知模式来隐喻更为复杂多样的情形,汉语的“上、下”也是这样的)。 (2)推理模式的规则化(generalization):我们有一个基本的发现,在抽象域上的推理会使用我们的感觉运动经验的逻辑。例如,东西涨价了。抽象的价格的涨,使用的是具体的水涨的隐喻。同时这可以作为“涨”的另外一个义项。(译者注:原文用的是rise,这里用中文意译了) 在20多年的后续研究中,数以百计的研究者提供了更多的证据。我们使用了最原始的证据源——多义词的规则化和推理的规则化。现在,我们至少有7种证据。(1)诗歌、小说研究(lakoff Turner1989)(2)心理研究(Gibbs1994)(3)体态(McNeill1992)(4)历时语义演变(Sweetser1990)(5)语篇分析(Narayanan1997)(6)手语(Taub1997)(7)语言习得(C.Johnson1999)。 隐喻理论的新发展 20多年来的研究,让我们对隐喻是如何构造思维这一问题看得更为清晰。最初,我们只知道概念隐喻根植于身体经验。1990年代,发展了“深入分析”,不只是时间概念系统,而是各个系统都深受概念隐喻系统的作用。即使是在物理和社会科学中的因果关系,也是由20多个不同的隐喻构成的系统,每个隐喻都有自身的因果逻辑(Causal logic)。如,被推动至新位置,给与获得对象,联系,路径运动等等。这个发现是惊人的,因为这挑战了一个普遍的观点,即,认为因果逻辑是一种自足的构造世界的逻辑。深入的分析还发现,对于道德也是如此。符合道德的事件往往是正向的,不道德的事件则相反。 隐喻的组合性分析 在More than cool reason(1989)一书中,Lakoff和Turner使用了深入分析来解读复杂的诗歌和文学作品。分析揭示了想象(imagination)的原理:新的隐喻的想法其实是组织和理解经验的新的方式,是将简单的概念隐喻组合为复杂的隐喻的过程。由此,我们看到,创新和新奇并不是神迹,并不是无中生有。它们是由日常隐喻思维的工具所构造的,其他的普通的概念机制也起了一些作用。 例如,莎士比亚的第73首诗,使用了3个隐喻来刻画人的一生:一天、一年、一束火。我们分析出,Life是光明,Death是黑暗,Life是热,Death是冷,人的一生就是一个(月亮)盈缺的循环,盈时光热,缺时黑冷。我们还进一步分析了概念隐喻和转喻可以共同合成复杂而新奇的组合体。 隐喻之隐喻 每个科学的理论都由科学家来构造,这些科学家必须使用人脑提供的工具。而工具之一就是概念隐喻。但是当科学的研究对象就是隐喻本身的时候,无疑这样的任务必须使用隐喻,因为它就在我们的大脑中,必须用隐喻来构造一个科学的对于隐喻的理解。(译者按:作者的意思实质就是,在研究隐喻的时候不可避免地要用隐喻来研究隐喻) (1)数学映射(Mathematical Mapping),借用数学中的映射方法,来描写源域(source domain,可通俗理解为本体,但不完全等同)到目标域(target domain,可通俗理解为喻体)的映射。但是这种方法是不足的,因为隐喻中存在一些源域和目标域都没有的隐喻意义。(译者按,这是Lakoff的说法,其实隐喻的另外一派就此提出了概念整合理论Blending Thoery,个人感觉可能比Lakoff的概念隐喻更好一些)。 (2)投射隐喻(Projection Metaphor),是两个域的投影的叠加,叠加以后允许产生新的意义。(译者按,这里与概念整合理论有相似之处。)意象图式(Image Schema),在此书之前就已经发现意象存在着内部结构。例如,一个人走进房间。可以把房间想象为容器,人在某个路径上运动,进入容器。容器和路径都是基本的意象图式。我们发现,源域的意象图式的结构往往被用于目标域的推理。众多的研究后,我们还发现,意象图式的结构和意象图式的推理都是隐喻所拥有的。意象图式的结构都会得到映射。如,路径会有出发点、终点、路径。但不幸的是,投射隐喻带有大问题。因为按照投射的原则,源域的全部要素都需投射到目标域,而这一点是很难做到的。例如,理论是建筑的隐喻,建筑的若干要素并没有体现到理论之上。投射只能是部分的。源域和目标域的要素如果有冲突的部分是不行的。所以,我们无奈地加入了目标域强制原则(override)。1997年,投射隐喻的说法被废弃了。取而代之的是Feldman和Lakoff在伯克利的国际计算科学院提出的神经理论(Neural Theory)。 基本隐喻(Primary Metaphor)和神经理论 术语映射map和mapping均来自神经科学。在大脑的神经系统中,神经元从视网膜到基本视觉投射皮层(V1)。V1中活跃的神经元据说可以在V1重构视网膜的图像。隐喻便是以这样的神经机制作为理论基础的。举例来说,情绪是温度(他火冒三丈),这个隐喻一个是情感域一个是温度域,在大脑中也对应着不同的区域,隐喻连接起来。 很多隐喻模式都是跨语言的,源于人类有着相同或相近的生活体验。而基于文化的那些体验会带来差异性的隐喻。 隐喻思维的神经基础:身体感知运动概念源于身体感知运动体验。神经活动可以更好地解释隐喻的机制,而非之前的投射隐喻模式的僵化和矛盾。(译者按:实际上,把隐喻模式扔给连接主义的神经机制是不妥的,因为神经机制本身还不清晰,有以乱治乱的嫌疑。) 隐喻和动态激活(enactment):激活是指在识解、活动和想象时,动态的大脑活动。结构推理(structural inferences)是静态的推理,激活推导(enactment inferences)则是动态的。在Narayanan1997的分析中举了这样一个例子,法国陷入衰退而德国将他拉出来。这句话里面有很多的转喻和隐喻在工作,如民族是人民,经济是实体可以运动,等等。 激活和合成(enactment and blending):Gilles Fauconnier和Mark Turner在2002提出了合成空间。与神经理论(Neural Theory)有着很多重要的相似之处。其最关心的问题是概念整合(conceptual integration)。概念结构是如何在特定情况下合并的,特别是在想象的时候。他们使用了Fauconnier的心理空间(Mental Space)理论。合成空间是由想象所合并的两个以上的心理空间。这些用于合并的基本的心理空间是由我们的日常长效的概念系统所构造的。 举例来说Jewish pizza是由匹萨和犹太做法的若干要素合成的,也就是两个输入空间的合成。(译者按,其实就是合成词的问题。汉语里面不少,比如“中国的科比”)。和我们的神经理论解释来比较的话,他们的理论是在认知层面上,而我们的是在神经层面上。而且他们的理论并不完美。举例来说,钢铁价格升高了。隐喻是More is up,价格的提升是一个隐喻。从合成理论来说,只有一个合成了的空间,并不存在一个具体物升高的输入空间和另外一个空间。(译者按:Lakoff说的有道理,个人以为,合成理论和Lakoff早年的数学映射或者投射隐喻基本相同,覆盖面和解释力有点问题,如输入空间的刻画,空间数量是否一定要两个以上,隐现的要素的机制等等。) 一些更正和说明 这本书是我们刻画隐喻思维的自然性及其和语言的关系的第一次尝试。不可避免地会有一些错误,下面是更正: (1)隐喻划分出的三个类别:方位隐喻、本体隐喻、结构隐喻。这种划分是人为的。所有的隐喻都是结构的、本体的,有些是方位的。 (2)我们当时没有意识到基本隐喻的晦涩,有些分析是成问题的。例如,辩论是战争。很多读者反馈说,人们了解辩论在前,了解战争在后,隐喻如此分析是不是有问题。是不是基于童年的认识,辩论是斗争(argument is struggle)。 (3)隐喻和转喻的区分:之前的区分是隐喻有源域和目标域,而转喻只有一个直接的域。这样的做法是不妥的。现在我们认为,必须看一看是否存在一个唯一的对象、一个唯一的投射。如果唯一则是转喻。如果存在多个投射,其中一个域又对另一个域具有重要作用,那么是隐喻。(译者按:举个汉语例子,“红领巾拾金不昧”,转喻;“灿烂的花朵拾金不昧”,隐喻。实在搞不懂Lakoff的这种区分。鄙人以为还是用特征相关来解释转喻,用联想来解释隐喻比较好。因为Lakoff用隐喻来分析合成词Jewish pizza,实际上都是两个域相关的。只是这两个域的关系不同。转喻是事物的概念范畴相关,而隐喻是相关范畴之外。当然,这个内外之分够主观的,也不好区分。) 总结 这本书的最主要观点如下:(1)隐喻天然地基础地是概念化的,隐喻的语言是第二位的。(2)概念隐喻根植于日常经验。(3)抽象思维大致是隐喻的,虽然不是全部是。(4)隐喻思维是不可避免的、无处不在的、往往是无意识的。(4)抽象概念有一个字面核心,不同的隐喻往往将其扩展出更多的意义。(5)抽象概念离开隐喻会变得不完整。例如爱情,如果缺乏了魔幻、诱惑、疯狂等隐喻,是难以把握其内涵的。(6)概念系统并不是高度一致的,因为用于推理的隐喻往往是不一致的。(7)我们生存在隐喻的推理之上。 和20多年前一样,这本书仍然是备受争议的、激进的。需要更多的工作和质疑。如果您有兴趣,不妨从本书提供的参考文献开始。 Lakoff Johnson 2003
个人分类: Linguistics|7106 次阅读|4 个评论
ACL2012正传
热度 1 gothere 2012-7-14 15:01
完整图文版见附件 ACL.pdf ACL 是一个传说,记得 2003 年黄昌宁先生到南师大讲学一周,说起微软亚洲研究院开创中国人在国际顶级计算语言学大会 ACL 上发表论文的贡献,我们无不佩服、向往,也开始了我们查阅 ACL 网站论文资料的习惯。 9 年过去了,缺粮少炮的我们,凭着一腔兴趣,勉强参加了每年的国内会议,从没有过出国的念想,只因为家贫、文科贫。终有机会在南大计算机系博士后,导师的支持加上申请到了足够的经费,可以去看一看了。冬季是 ACL 的 deadline ,而秋季学期教学特别繁重,每每想投稿,每每不成。于是乎,没有论文的我,在女儿诞生的第五天,就乘上了飞往济州岛的班机。 大会开幕式开宗明义:今年是 ACL 的 50 周年,借用孔子的名言“五十而知天命”。此番 ACL 的主旨比起平常,就多了一个要义:回顾与展望。回顾者乃一老休,饶有兴味地谈起他最初的研究兴趣、方法和教学心得。这么多年过去了,他仍然喜欢教学生用最原初的模型,以加强对问题的理解。 介绍了 1950s 末,他们开发的世界第一款句法分析器—— Uniparse ,基于有限状态机,可以分析出句子的名词短语、动词类别等基本信息。最后谈及了语言学和计算语言学的关系,虽然 20 多年来计算语言学家在很大程度上抛弃了语言学,但当处理的问题涉及语篇的时候,语言学该上场了。我们所要做的只是踮起脚尖,努力向上,摘下那颗属于自己的苹果。 走在大厅里,会议信息很丰富,百度作为本届大会最大的赞助商,获取了最醒目的位置和最大的展台。但不得不说,侧重单语的百度,在展台上空空如也,没有像样的 demo 或者展示,只是为了招纳海外军团归国吧。老外对于百度也没多大兴趣,这样的公司到底算不算竞争对手呢? Poster 展示厅很大,中间是即将开始的自助晚餐,趁着人少,抓拍了一张。 最佳论文被 NTT 拿去了。 最佳学生论文虽然是中国人的,仍是出自微软亚洲研究院。 这两个最佳都给了亚洲,难道也是 ACL 特别照顾了亚洲?两篇论文并不是具有重大意义或标志性建筑,有点晕乎,其实欧美的 paper 也不错啊。还好,真正的大奖是欧美的。不过这颁奖也出人意外得狠! 在 Skyp 网络直播中,我们看到 Fillmore 接过了 ACL Lifetime Award 。由于身体原因,老菲没法亲临现场。接下来,播放了他早先录制好的 40 分钟获奖感言。在这 40 分钟里,他回顾了自己的学术历程,从一个小伙子,目睹乔姆斯基带来的语言学革命。历经 10 年,从阿拉伯语、日语中获得灵感,创制了跨语言的格语法。有趣的是,他老婆是日本人,也给了他不少灵感吧:)可是他并没有止步不前,在格 case 和事件关系的矛盾中,以及 1970s Shank 的脚本理论等带来的思索,进一步提出了 Frame Semantics ,终成一个较为自足的语法体系。这位语言学家更令人敬佩之处在于,不像 Chomsky 只谈理论,他在退休后依然四处找资助,建成了 FrameNet 的数据库,给计算语言学带来了理论框架下的真实数据。这个奖给他,确实是实至名归。在现场直播问答环节中,他还饶有兴味地对比了自己和 WordNet 的相似处。这两个资源的建设者都是 ACL Lifetime Award 的获得者,只是 FrameNet 目前单语数据还不够完备,跨语言做的还不够好。说起来也巧,我们的背景是语言学多些的,听起来觉得特别过瘾,难得有这样的机会听听他的研究思路。也倍感国际学术交流的重要性,如果有机会出去学习就更棒了。可现场大多是计算机背景的,不少人打起了哈欠,看来复合型人才还是稀缺的。 Mark Johnson 做了第二个特邀报告,展望了一下 ACL 的未来。他的报告出人意料地哲理化。从技术进步的角度,谈到了计算语言学貌似不错的未来,而真正的危机在于这门学科过于技术化、工业化的倾向,会变得越来越狭隘。计算语言学对“科学”的贡献在哪里?他引用了 Box 和 Vapnik 的话,也谈到了目前脑神经研究的进展。引入了地图的演变史,隐喻地说出了他的观点,在科学和技术中,寻求结合点和创新力。 大会还专门设立了一整天 50 周年纪念的分会,大都是用文献统计方法和 LDA 等模型,自动得出文献、话题、年代分布,乏善可陈。有趣的是 Stanford 做的作者性别分布,以及男女代表学者的研究主题。 在各个分会场的报告中,仍然是欧美正牌名校的报告最吸引眼球。 Stanford 、 Berkeley 为代表,无论是老师还是博士生的报告,都让人为之一振,选题、工作、陈述都很漂亮。相形之下,亚洲(中国)学者论文也算不少了,但让人听起来费劲,在陈述准备上也明显没下足功夫,即使是一流的工作,也被三流的报告陈述拉下马了。 Demo Session ,和 Poster 的地点一致。这里我遇到了一个不曾想到又非见不可的人物—— Veale Tony ,英语明喻的研究者。我引用了七八次他的论文,做了汉语明喻抽取和中英对比工作,这次遇到,着实请教了一番,他听了我的工作,也较有兴趣。希望他不嫌弃,后面可以有实质性的合作。 有小女在家等着,顾不上听 EMNLP 啦,赶紧回家咯!
个人分类: Computational Linguistics|4952 次阅读|2 个评论
谁说的
热度 1 vatang 2012-7-4 09:52
昨天,韩国专家李赞九说:中国古代刀币上两个没人认识的汉字其实是韩文。去年韩国语言学泰斗陈泰夏也说过:汉语是韩国祖先发明的。许多爱国愤青们对此表示谴责和愤慨。 其实我觉得,对于你得不到的东西适当意淫一下还是不错的。既然彩票都能让明天充满希望,意淫当然也会让人生更美好。每个人都有意淫的权力,韩国专家爱意淫,按照我国外交辞令,我们不能干涉他们意淫的自由。否则恐怕有干涉内政的嫌疑。 其实,我们真的没有必要在乎汉字究竟是神话中的仓颉所创还是韩国专家所创。毕竟两者都是没有证据的不靠谱。上古神话没有户籍制度,就算是仓颉造字,你也无法证明仓颉是中国人,过分探究事实是不利于和谐稳定的。 究竟是汉字还是韩字不重要,真的不重要。文字是表达思想的工具,设想对于一个没有思想的人来说,要这个工具不显的多余吗? 我知道有些爱国愤青们又要拍案愤起了。少安毋躁,孔子曰:君子动口不动手。 注意到我的表达方式了吗?……孔子曰…… 古人一开口,就是子曰诗云,后来封建社会被推翻了,开始了孙中山说、马克思说、列宁说、后来更变成了伟大领袖毛主席教导我们说。谁说历史是进步的?扪心自问,啥时候你自己说过? 不说也就罢了,这还不是最悲催的,最悲催的是,你习惯了听个别人说,再也听不见个别人之外的声音。 这是有例证的,我和任何人谈及某个观点,对方都是一脸的不屑。只有当我强调说,这是孔子说的,这是奥巴马说的,这是白岩松说的,他们才略睁双眼,微有质疑的嘟哝一句:真的吗? 我们已经习惯了失去话语权,更习惯了闭目塞听。或许在潜意识的某处,我们只认为唯有新闻联播能说,能听。当你和别人交流时,根本不听对方讲了什么内容,也不愿或者不能去判断分析这内容的对错好坏是非,于是你找了一个最省力的方式:管他内容是什么,只看它是谁说的不就完了。 就因为你放弃了自我判断,于是没有了是非,没有了对错,没有了好坏。 我经常看到,某个明星在微博上无病呻吟的哎呦了一声,后面就有粉丝跟帖无数。 我经常看到,某些学者微言大义,苦口婆心,却听者藐藐。 我经常看到,一些专家跳出自己的本行,指鹿为马,断章取义,大众却欣然表示相信和赞同。 我经常看到,是的,经常。 有这样的国民,何愁汉字不亡。 说什么有用吗?没用! 谁说的有用吗?有用! 谁说的?
3146 次阅读|2 个评论
回顾:计算语言学的萌芽期、发展期、繁荣期得益于基础研究
geneculture 2012-6-29 01:44
Markov, Turing, Shannon 和 Chomsky 这四位著名学者对于 语言和计算 关系的探讨,是 计 算语言学萌芽期 最重要的研究成果,为计算语言学的理论和技术奠定了坚实的基础。 有 四项基础性的研究 特别值得注意 : 一项是 Markov 关于 马尔可夫 模型的研究 ; 一项是 Turing 关于 算法计算模型 的研究 ; 一项是 Shannon 关于 概率和信息论 模型的研究 ; 一项是 Chomsky 关于 形式语言理论 的研究 。 根据这些史料,我们认为,远在 1962 年,就出现了“计算语言学”这个学科了,尽管它 在刚出现的时候还是偷偷摸摸的,显示出少女般的羞涩。但是,无论如何, 计算语言学这个 新兴的学科终于萌芽了,她破土而出,悄悄地登上了学术的殿堂。 1964 年,美国科学院成立了 语言自动处理 谘询委员会( Automatic Language Processing Advisory Committee ,简称 ALPAC 委员会),调查机器翻译的研究情况, 并于 1966 年 11 月 公布了一个题为《语言与机器》的报告,简称 ALPAC 报告 ①,这个报告对机器翻译采取了否定的态度,报告宣称:“在目前给机器翻译以大力支持还没有多少理由”;这个报告还指出, 机器翻译研究遇到了难以克服的“语义障碍”( semantic barrier ) 。在 ALPAC 报告的影响下, 许多国家的机器翻译研究低潮,许多已经建立起来的机器翻译研究单位 遇到了行政上和经费 上的困难,在世界范围内,机器翻译的热潮突然消失了,出现了空前萧条的局面 。 美国语言学家 David Hays 是 ALPAC 委员会的成员之一,他参与起草了 ALPAC 报告,在 ALPAC 报告中,他建议,在放弃机器翻译这个短期的工程项目的时候, 应当加强语言和自然语言计算机处理的基础研究 ,可把原来用于机器翻译研制的经费 使用到自然语言处理的基础研究方面 , David Hays 把这样的基础研究正式命名为 Computational Linguistics (计算语言学)。 所以,我们可说, “计算语言学”这个学科名称最早出现于 1962 年,而在 1966 年才在美国科学院的 ALPAC 报告中正式得到学术界的承认 。 ZouXiaohui 1:23:59 当前国内外计算语言学研究有四个显著的特点 ZouXiaohui 1:24:36 第一,随着语料库建设和语料库语言学的崛起,大规模真实文本的处理成为计算语言学的主要战略目标 ZouXiaohui 1:25:25 第二,计算语言学中越来越多地使用机器自动学习的方法来获取语言知识:传统语言学基本上是通过语言学家归纳总结语言现象的手工方法来获取语言知识的,由于人的记忆能力有限,任何语言学家,哪怕是语言学界的权威泰斗,都不可能记忆和处理浩如烟海的全部的语言数据,因此,使用传统的手工方法来获取语言知识,犹如以管窥豹,以蠡测海,这种获取语言知识的方法带有很大的主观性。 ZouXiaohui 1:25:52 第三,计算语言学中越来越多地使用统计数学方法来分析语言 ZouXiaohui 1:26:40 Och也模仿着Archimedes说:“只要给我充分的并行语言数据,那么,对于任何的两种语言,我就可以在几小时之内给你构造出一个机器翻译系统。”(“Give me enough parallel data, and you can have translation system for any two languages in a matter of hours.”) ZouXiaohui 1:27:19 看来,Och似乎已经找到了机器翻译的有效方法,至少按照他的路子走下去,也许有可能开创出机器翻译研究的一片新天地,使我们在探索真理的曲折道路上看到了耀眼的曙光。过去我们研制一个机器翻译系统往往需要几年的时间,而现在采用Och的方法构造机器翻译系统只要几个小时 ZouXiaohui 1:27:39 第四,计算语言学中越来越重视词汇的作用,出现了“词汇主义”(lexicalism)的倾向 ZouXiaohui 1:27:58 在统计方法中引入了 词汇信息,可以大大地提高统计分析的精确度,在句法分析中引入词汇信息,可以减少结构 上歧义,提高句法分析的效率。机器可读词典和词汇知识库成为了自然语言处理最关键、最重要的语言资源。 ZouXiaohui 1:28:39 当前计算语言学发展的特点 : 21世纪以来,由于互联网的普及,自然语言的计算机处理成为了从互联网上获取知识的重要手段,生活在信息网络时代的现代人,几乎都要与互联网打交道,都要或多或少地使用计算语言学的研究成果来帮助他们获取或挖掘在广阔无边的互联网上的各种知识和信息,因此,世界各国都非常重视计算语言学的研究,投入了大量的人力、物力和财力。 ZouXiaohui 1:30:54 在计算语言学中,算法取决于形式模型,形式模型是自然语言计算机处理的本质,而算法只不过是实现形式模型的手段而已。因此,这种建立语言形式模型的研究是非常重要的,它应当属于计算语言学的基础理论研究。 ZouXiaohui 1:32:05 互联网确实已经变成了多语言的网络世界,因此,网络上的不同自然语言之间的计算机自动处理也就变得越来越迫切了。网络上的机器翻译、信息获取和信息搜索正在迅猛地发展,计算语言学的各种应用技术事实上已经成为了互联网技术的重要支柱。 ZouXiaohui 1:33:10 自1989年以来,机器翻译的发展进入了一个新纪元。这个新纪元的重要标志是,在基于规则的技术中引入语料库方法,其中包括统计方法,基于实例的方法,通过语料加工手段使语料库转化为语言知识库的方法,等等。这种建立在大规模真实文本处理基础上的机器翻译,是机器翻译研究史上的一场革命,它将会把计算语言学推向一个崭新的阶段。随着机器翻译新纪元的开始,计算语言学进入了它的繁荣期。 从 20 世纪 90 年代开始,计算语言学进入了 繁荣期 。 1993 年 7 月在日本神户召开的第四届机器翻译高层会议( MT Summit IV )上,英国著名学者 J. Hutchins 在他的特约报告中指出, 自 1989 年以来,机器翻译的发展进入了一个新纪元 。 这个新纪元的重要标志是,在基于规则的技术中引入语料库方法,其中包括 统计方法,基于实例的方法,通过语料加工手段使 语料库 转化为语言 知识库 的方法,等等。 这种建立在大规模真实文本处理基础上的机器翻译,是机器翻译研究史上的一场革命,它将会把计算语言学推向一个崭新的阶段 。随着机器翻译新纪元的开始,计算语言学进入了它的繁荣期。
个人分类: 语言学基础研究|0 个评论
专家们是这样认可我在语言学和语言哲学两方面的研究成果
热度 2 geneculture 2012-6-12 01:34
其实,我在语言学和语言哲学两方面的研究成果,是与我在信息学和信息哲学两方面的研究成果密切相关的。从高等教育突出高深知识探讨的角度来看,它们其实都是在探讨同一个系列的基本问题,只是从不同的多个学科或专门的研究领域的视角来探讨罢了。因此,我的研究所涉及的关键词,就是: 语言,信息,知识,智慧 。相应的学科也就主要是语言学、信息学、高等教育学和哲学。 昨天下午及晚上,我在北京大学燕南园64马蔼乃教授驻地应邀再次介绍了自己关于本真信息和广义文本的深刻知识背景及其涉及的几个基本原理。佘教授在场。 1.从自然语言(如英语)经由计算语言、编程语言、形式语言到机器语言的一系列独木“桥”和从自然语言(如汉语)直接到算数语言的“秤”(其中也蕴含着各种各样的具体的“秤”),我介绍了自然语言形式化的双重转换路径。其中的“信息恒等式”涉及一对信息基本方程的各种分布解。进而也就自然涉及与本真信息和广义文本两个概念密切相关的两个信息基本定律。【注:这是以下 附件1 转载公开 专家评语 以及《软件》2011第5、6、7、8期“专家论坛”头条论文的缘故】 2.从“文(word)”如何在“物(thing)”与“意(mind)”之外发展成“第三范畴”进而凸显“理、义、法、道之本(fundamental relation)”这一涉及四类本真信息的“第四范畴”?以及前三个“基本范畴”如何可以归入“广义文本”的名下?这样两个基本问题的回答,可以实现虚与实的互换,在此,就是可以采用四元数“a+bi+cj+dk”分别从两个方向来描述或指代上述四个基本范畴。【注:这就是以下 附件2 公开专家评语的缘故】 注 : 3.值得庆幸的是,1所述的“形式化”途径,可以把2所述的语言哲学框架进一步由宏观粗分的框架逐步地细化为微观细分的语言科学体系及其相应的技艺实现系统。(这一条当时我并没有讲) 本真信息和广义文本是我(邹晓辉“ 信息学基础研究 ”一文的作者)在北京大学的马蔼乃和闫学杉,北京师范大学的姜璐等教授主编的《 信息科学交叉研究 》第三部分 一般信息理论 的第一篇文章,即“信息学基础研究”中正式公开提出的一对概念。由于其中的本真信息涉及第一信息基本定律,广义文本涉及第二信息基本定律,因此,该文在一般信息理论研究领域具有划时代的标志性意义。正如科学哲学家库恩在《 科学革命的结构 》一书中论述的一个观点所述的发展步骤:思想的革命、口头的革命、纸面的革命、科学的革命,我论述的本真信息和广义文本及其蕴含的基本信息定律要从前三个阶段的革命进一步转变为第四个阶段的革命,所需要的时间是有滞后性的。 附件1 .专家们是这样认可我在 语言学 两方面的研究成果 邹晓辉《字本位与中文信息处理的基础》(专家们是这样认可的) http://blog.sina.com.cn/s/blog_65197d9301010mgx.html 《软件》2011第5、6、7、8期“专家论坛”一组头条 论文 http://blog.sciencenet.cn/blog-94143-508331.html 附件2 .专家们是这样认可我在 语言哲学 方面的研究成果 邹晓辉提出的“语义三棱”和“本真信息”(专家们是这样认可的) http://blog.sina.com.cn/s/blog_65197d93010107kk.html
个人分类: 语言学基础研究|2214 次阅读|2 个评论
2012年SSCI收录语言学学科期刊167种目录
热度 1 wanyuehua 2012-6-5 06:39
SCI 、 SSCI 、 AHCI 均收录语言学期刊, 2012 年 SSCI 收录语言学学科期刊 167 种( 2008 年 SSCI 收录语言学学科期刊 71 种),其中被 SCI 、 SSCI 、 AHCI 共同收录期刊 3 种如 Computational Linguistics 《计算语言学》、 Natural Language Engineering 《自然语言工程》、 Phonetica 《语音学》。 SCI 、 SSCI 共同收录期刊 9 种如: American Journal of Speech - Language Pathology 《美国言语病理学杂志:临床实践》、 Brain Language 《大脑与语言》 、 Clinical Linguistics Phonetics 《临床语言学与语音学》、 International Journal of Language and Communication Disorders 《国际语言及交流障碍杂志》、 Journal of Communication Disorders 《语言交流障碍杂志》、 Journal of Fluency Disorders 《口吃病杂志》、 Journal of Neurolinguistics 《神经语言学杂志》、 Journal of Speech Language and Hearing Research 《言语、语言与听觉研究杂志》、 Language and Speech 《语言与口语》 。 SSCI 、 AHCI 共同收录期刊 127 种如: Across Languages and Cultures 《语言与文化的跨越》、 Acta Linguistica Hungarica 《匈牙利科学院语言学学报》、 Child Language Teaching and Therapy 《儿童语言教学与疗法》、 Cognitive Linguistics 《认知语言学》、 Dialectologia et Geolinguistica 《方言学与地方语言学》、 Functions of Language 《语言的功能》、 International Journal of Lexicography 《国际词汇学杂志》、 Journal of African Languages and Linguistics 《非洲语言和语言学杂志》、 Journal of East Asian Linguistics 《东亚语言学杂志》、 Journal of English Linguistics 《英语语言学杂志》、 Journal of Pidgin and Creole Languages 《混杂语言和克里奥尔语杂志》、 Journal of Germanic Linguistics 《日尔曼语言学杂志》 、 Journal of Language Politics 《语言与政治杂志》、 Language and Intercultural Communication 《语言与不同文化间的交流》、 Language Problems and Language Planning 《语言问题与语言计划》 、 Language Sciences 《语言科学》、 Language Variation and Change 《语言的演变》、 Metaphor and Symbol 《隐喻与象征》、 Natural Language Linguistic Theory 《自然语言与语言理论》 、 Natural Language Semantics 《自然语言语义学》 、 Phonology 《语音学》 、 Theoretical Linguistics 《理论语言学》、 Zeitschrift fuer Dialektologie und Linguistik 《方言学与语言学杂志》等。详细 2012 年 SSCI 收录语言学学科期刊 请见附件。 附件: 2012年SSCI收录语言学学科期刊167种目录.doc 相关阅读: 2012年AHCI收录语言与语言学学科期刊186种目录
个人分类: SSCI投稿|9874 次阅读|1 个评论
2012年A&HCI收录语言与语言学学科期刊186种目录
wanyuehua 2012-6-4 06:48
SCI 、 SSCI 、 AHCI 均收录语言与语言学期刊, 2012 年 AHCI 收录语言学学科期刊 186 种,其中被 SCI 、 SSCI 、 AHCI 共同收录语言与语言学期刊 3 种: Computational Linguistics 《计算语言学》、 Natural Language Engineering 《自然语言工程》、 Phonetica 《语音学》。 SSCI 、 AHCI 共同收录语言与语言学期刊 127 种,例如: Across Languages and Cultures 《语言与文化的跨越》、 Acta Linguistica Hungarica 《匈牙利科学院语言学学报》、 Child Language Teaching and Therapy 《儿童语言教学与疗法》、 Cognitive Linguistics 《认知语言学》、 Dialectologia et Geolinguistica 《方言学与地方语言学》、 Functions of Language 《语言的功能》、 International Journal of Lexicography 《国际词汇学杂志》、 Journal of African Languages and Linguistics 《非洲语言和语言学杂志》、 Journal of East Asian Linguistics 《东亚语言学杂志》、 Journal of English Linguistics 《英语语言学杂志》、 Journal of Pidgin and Creole Languages 《混杂语言和克里奥尔语杂志》、 Journal of Germanic Linguistics 《日尔曼语言学杂志》 、 Journal of Language Politics 《语言与政治杂志》、 Language and Intercultural Communication 《语言与不同文化间的交流》、 Language Problems and Language Planning 《语言问题与语言计划》 、 Language Sciences 《语言科学》、 Language Variation and Change 《语言的演变》、 Metaphor and Symbol 《隐喻与象征》、 Natural Language Linguistic Theory 《自然语言与语言理论》 、 Natural Language Semantics 《自然语言语义学》 、 Phonology 《语音学》 、 Theoretical Linguistics 《理论语言学》、 Zeitschrift fuer Dialektologie und Linguistik 《方言学与语言学杂志》等。 AHCI 收录语言与语言学期刊 56 种:例如: AAA- Arbeiten aus Anglistik und Amerikanistik 《美国与英国语言、历史、文化研究论文集》、 Anglia; Zeitschrift fuer englische Philologie 《英语语言学》、 Beitraege zur Geschichte der deutschen Sprache und Literatur 《德国语言文学史论文集》、 German Quarterly 《德语季刊》、 Historiographia Linguistica 《编史语言学》、 Journal of English and Germanic Philology 《英语与德语语文学杂志》、 Lingua e Stile 《语言与文体》、 Modern Language Review 《现代语言评论》、 Meta 《译者杂志》、 Neophilologus 《新语言学》、 Papers on Language and Literature 《语言与文学文集》 、 Philological Quarterly 《语文学季刊》、 Revue de Linguistique Romane 《罗曼语语言学杂志》、 Russian Linguistics 《俄罗斯语言学》、 Sprachwissenschaft 《语言学》、 Studia Neophilologica 《新语文学研究》、 Transactions of the Philological Society 《语义学学会汇刊》、 Zeitschrift fuer Germanistische Linguistik 《德语语言学杂志》、 Zeitschrift fuer Romanische Philologie 《罗马语系语言学杂志》、 Zeitschrift fuer Slawistik 《斯拉夫语杂志》等。详细 2012 年 AHCI 收录语言学学科期刊请看附件。 附件: 2012年AHCI收录语言与语言学学科期刊186种目录.doc 相关阅读: 2012年SSCI收录语言学学科期刊167种目录
个人分类: A&HCI投稿|5892 次阅读|0 个评论
2012年度国家社会科学基金资助项目名单 语言学(219项)
carldy 2012-5-23 17:37
2012年度国家社会科学基金资助项目名单 语言学(219项) 序号 项 目 名 称 负责人 工作单位 所在省市 项目类别 预期成果 1 现代汉语及方言中的否定问题研究 戴耀晶 复旦大学 上海 重点项目 专著 专题论文集 2 濒危语言有声语档建设的理论体系、实践规程和技术准则研究 范俊军 暨南大学 广东 重点项目 专著 工具书 3 中原出土商周铜器铭文的分域整理与研究 王蕴智 河南大学 河南 重点项目 专著 4 汉语普通话的语气语调的实验研究 石锋 南开大学 天津 重点项目 专著 研究报告 5 青海玉树地区藏语方言语音研究 王双成 上海师范大学 上海 重点项目 专著 6 汉语生成类型学研究 伍雅清 湖南大学 湖南 一般项目 专著 专题论文集 7 汉藏语系语言存在范畴研究 余成林 黔南民族师范学院 贵州 一般项目 专著 8 意义进化视角的英汉语法隐喻研究 杨忠 东北师范大学 吉林 一般项目 专著 专题论文集 9 汉英句法与语义界面的认知对比研究 郭纯洁 南京航空航天大学 江苏 一般项目 专著 10 汉语结构性话语标记句法—语义互动关系及其英语转换策略研究 张滟 上海海事大学 上海 一般项目 研究报告 专著 11 基于《说文解字》字(词)汇隐喻语料库的汉英语言隐喻模式比较 吴世雄 福建师范大学 福建 一般项目 专题论文集 研究报告 12 零形素句法研究——对汉英“意合—形合”类型性差异的句法学阐释 程杰 广东工业大学 广东 一般项目 专题论文集 13 系统功能语言学视角下英汉名词词组对比研究 李满亮 内蒙古大学 内蒙 一般项目 专著 专题论文集 14 英汉程式语心理表征模式对比研究 贾冠杰 苏州大学 江苏 一般项目 专题论文集 研究报告 15 英汉复合结构的语法语义互动研究 熊学亮 复旦大学 上海 一般项目 专著 16 英汉语句法语义接口词化的转喻研究 杨成虎 宁波大学 浙江 一般项目 专著 17 中动结构多语功能对比研究 何文忠 浙江大学 浙江 一般项目 专著 18 基于系统科学原理的翻译文化身份与文化作用研究 姜秋霞 兰州城市学院 甘肃 一般项目 专著 研究报告 19 20世纪中国翻译批评话语研究 廖七一 四川外语学院 重庆 一般项目 专著 20 翻译政策对国家文化战略的作用与影响研究 穆雷 广东外语外贸大学 广东 一般项目 专题论文集 21 语用翻译学:寓意言谈翻译研究 侯国金 四川外语学院 重庆 一般项目 专著 22 翻译语境论建构研究 彭利元 湖南工业大学 湖南 一般项目 专著 23 国家翻译实践中的“外来译家”研究 任东升 中国海洋大学 山东 一般项目 专著 24 基于语料库的军事外宣翻译研究 韩子满 解放军外国语学院 军队 一般项目 专著 电脑软件 25 以汉语为母语的口译学员概念框架构建障碍研究 谌莉文 宁波大学 浙江 一般项目 专著 26 中国翻译市场发展60年研究 田传茂 长江大学 湖北 一般项目 专著 研究报告 27 中医英语翻译理论与方法研究 李照国 上海师范大学 上海 一般项目 专著 28 基于文化视角的法律语言翻译研究 马莉 华东政法大学 上海 一般项目 专著 研究报告 29 同声传译能力发展研究 高彬 对外经贸大学 高校 一般项目 研究报告 30 建国后三十年小说英译研究 马士奎 中央民族大学 高校 一般项目 专著 31 基于平行语料库的文学自译现象研究 黎昌抱 浙江财经学院 浙江 一般项目 专著 32 江淮官话黄孝片方言语法比较研究 汪化云 浙江财经学院 浙江 一般项目 专著 33 赣方言浊音走廊语音研究 陈凌 江西师范大学 江西 一般项目 专著 34 广西疍家话调查研究及有声语料库建设 白云 广西师范大学 广西 一般项目 研究报告 电脑软件 35 皖赣交界处东至方言的特征研究 唐爱华 宿州学院 安徽 一般项目 专著 36 19世纪以来的徽州方音研究 陈瑶 福建师范大学 福建 一般项目 专著 研究报告 37 东北官话的历史演变研究 杨春宇 辽宁师范大学 辽宁 一般项目 专著 研究报告 38 河北方言中“X-儿”形式音变的动因、机制及类型学意义 李巧兰 石家庄学院 河北 一般项目 专著 39 方言接触带上的语言地理——以连城方言为例 严修鸿 广东外语外贸大学 广东 一般项目 专著 40 湖南省瑶族转用汉语方言情况调查研究 李星辉 中南大学 湖南 一般项目 专著 研究报告 41 四川凉山州彝语与汉语的接触研究 郑剑平 西南科技大学 四川 一般项目 专著 42 族群互动与语言接触——撒拉语的人类学研究 马伟 青海民族大学 青海 一般项目 专著 43 青海省少数民族宗教场所语言文字生态调查研究 李春玲 青海师范大学 青海 一般项目 专著 研究报告 44 推广蒙古语标准音方略研究 斯琴巴特尔 内蒙古大学 内蒙 一般项目 专著 研究报告 45 认知理论框架下的庭审叙事研究 余素青 华东政法大学 上海 一般项目 专著 46 中国大学生跨文化路径研究 彭仁忠 华中科技大学 湖北 一般项目 专著 研究报告 47 新媒体普法话语多模态研究 袁传有 广东外语外贸大学 广东 一般项目 专著 48 基于语料库的中西政治话语比较研究 钱毓芳 浙江传媒学院 浙江 一般项目 专题论文集 研究报告 49 网络话语“(不)礼貌性”的理论建构研究 谢朝群 福建师范大学 福建 一般项目 专著 50 中文微博情感分析及其应用研究 周咏梅 广东外语外贸大学 广东 一般项目 专题论文集 51 跨语言视角的汉英词汇推理加工机制发展研究 范琳 宁波大学 浙江 一般项目 专著 52 体验认知背景下汉语否定句理解的心理模拟研究 鲁忠义 河北师范大学 河北 一般项目 专著 研究报告 53 认知神经科学视角下的汉语成语结构与意义加工研究 白晨 北京第二外国语学院 北京 一般项目 专著 研究报告 54 中国大中小学生认知隐喻能力发展研究 刘振前 山东大学 山东 一般项目 专著 55 内容教学法理论指导下英语专业整体课程体系的改革与实践研究 常俊跃 大连外国语学院 辽宁 一般项目 专著 研究报告 56 我国外语专业大学生思辨能力发展差异的比较跟踪研究 文秋芳 北京外国语大学 高校 一般项目 研究报告 57 二语学术写作中的评价系统研究 徐昉 南京大学 江苏 一般项目 专著 58 基于认知诊断评估的个性化英语学习在线诊断指导模式构建及系统研发 马晓梅 西安交通大学 陕西 一般项目 研究报告 电脑软件 59 基于语音库的中国学生英语口语自动评测系统研究与开发 陈桦 南京大学 江苏 一般项目 研究报告 电脑软件 60 我国大学英语有效课堂环境构建研究 任庆梅 曲阜师范大学 山东 一般项目 专著 研究报告 61 中国大学生跨文化交际能力测评体系研究 高永晨 苏州大学 江苏 一般项目 研究报告 62 国际汉语教师专业发展模式研究 王添淼 北京大学 高校 一般项目 专著 研究报告 63 东南亚语言汉语借词研究 韦树关 广西民族大学 广西 一般项目 专著 64 欧美留学生汉语语块的认知加工实验研究 鹿士义 北京大学 高校 一般项目 研究报告 65 外国留学生语用能力测试研究 刘建达 广东外语外贸大学 广东 一般项目 专题论文集 66 语言知识资源的可视化技术研究 詹卫东 北京大学 高校 一般项目 专题论文集 67 中国口译学习者语料库的研制与应用 张威 北京语言大学 高校 一般项目 专题论文集 电脑软件 68 《经典释文》音切的音义匹配研究 岳利民 长沙理工大学 湖南 一般项目 专著 69 明清以来河西方音研究 徐朝东 南京师范大学 江苏 一般项目 专著 70 清及民国东北方言与北京官话语音关系研究 邹德文 长春师范学院 吉林 一般项目 专著 71 吴棫陈第古音古韵比较研究 陈鸿儒 华侨大学 福建 一般项目 专著 72 草书字体研究 李洪智 北京师范大学 高校 一般项目 专著 73 从郑樵到林义光:区域文字学研究案例考察 林志强 福建师范大学 福建 一般项目 专著 专题论文集 74 汉字形体发展史 陆锡兴 南昌大学 江西 一般项目 专著 75 汉字文化圈俗字比较研究 何华珍 浙江财经学院 浙江 一般项目 专著 76 春秋金文资料的整理研究与数据库建设 吴国升 贵州师范大学 贵州 一般项目 工具书 电脑软件 77 汉语中医词汇史研究 陈增岳 肇庆学院 广东 一般项目 专著 78 蒲松龄作品方言词汇研究 张树铮 山东大学 山东 一般项目 专著 79 秦汉简牍法律文献语言文化研究 赵久湘 长江师范学院 重庆 一般项目 专著 工具书 80 清末民初东北方言词汇系统研究 李光杰 佳木斯大学 黑龙江 一般项目 专题论文集 研究报告 81 唐宋禅录口语词研究 康健 西华师范大学 四川 一般项目 专著 82 五代墓志词汇研究 周阿根 阜阳师范学院 安徽 一般项目 专著 83 西北屯戌简牍词汇研究 魏德胜 北京语言大学 高校 一般项目 专著 84 周秦两汉楚方言词研究 邵则遂 中南民族大学 湖北 一般项目 专著 85 《道行般若经》训诂研究 张幼军 湖南师范大学 湖南 一般项目 专著 专题论文集 86 汉文佛典与历代字韵书疑难字研究 郑贤章 湖南师范大学 湖南 一般项目 专著 87 上博藏第一批楚竹书全编通释 俞绍宏 大连大学 辽宁 一般项目 专著 88 中国古代农业俗词语研究 化振红 南京师范大学 江苏 一般项目 专著 89 汉语平比句和比拟式的历史发展与演变机制研究 高育花 北京外国语大学 高校 一般项目 专著 90 汉语指示词系统的历时演变 梁银峰 复旦大学 上海 一般项目 专著 91 近代汉语句式糅合现象研究 叶建军 温州大学 浙江 一般项目 专著 92 类型学视野的汉语动量表示法历时演变研究 金桂桃 武汉理工大学 湖北 一般项目 专题论文集 研究报告 93 元代以来北方方言能性结构研究 王衍军 暨南大学 广东 一般项目 专题论文集 94 语法编码规律之研究 陆丙甫 南昌大学 江西 一般项目 专著 专题论文集 95 事件结构理论与跨语言类型比较参照下的汉语结果句式研究 周长银 北京第二外国语学院 北京 一般项目 专著 专题论文集 96 汉语句法与语义及语用的互动研究 吴义诚 浙江大学 浙江 一般项目 专著 专题论文集 97 基于句法语义互动关系的汉语形态句法研究 张伯江 中国社科院 社科院 一般项目 专著 98 现代汉语情态语气成分的关联机制研究 朱斌 华中师范大学 湖北 一般项目 专著 专题论文集 99 主内定语和宾内定语的语义信息不对称研究 张国宪 中国社科院 社科院 一般项目 专题论文集 100 汉语方位类词的语法研究 邱斌 井冈山大学 江西 一般项目 专著 101 认知语法框架中汉语N的V短语研究 陈庆汉 河南大学 河南 一般项目 专著 102 现代汉语语气成分的选择性研究 齐沪扬 上海师范大学 上海 一般项目 专著 103 现代汉语复合词语义透明度研究 宋宣 贵州师范大学 贵州 一般项目 专著 104 现代汉语典故词语构成理据及词义演变研究 唐子恒 山东大学 山东 一般项目 专著 105 汉语虚词词典编撰的方法论创新及其实践研究 邵敬敏 暨南大学 广东 一般项目 研究报告 工具书 106 汉语释义元词符集的研制与外向型学习词典的编纂 安华林 广东海洋大学 广东 一般项目 专题论文集 工具书 107 汉语修辞学方法论研究 高万云 山东大学 山东 一般项目 专著 108 新词语修辞造词的理据及其历史源流研究 周春林 云南师范大学 云南 一般项目 专著 109 上海手语音系研究 张吉生 华东师范大学 上海 一般项目 专著 110 朝鲜语与通古斯语同源性研究 尹铁超 黑龙江大学 黑龙江 一般项目 专著 111 基于数据库的东乡语语音声学研究 巴图格日勒 西北民族大学 甘肃 一般项目 研究报告 112 文化转向视野下的蒙古国文学汉译研究 文英 西北民族大学 甘肃 一般项目 专著 113 现代蒙古语新词语研究 莫巴特尔 内蒙古师范大学 内蒙 一般项目 专著 114 语言类型学视野下的蒙古语音变构词现象研究 图门吉日嘎拉 内蒙古大学 内蒙 一般项目 专著 115 中国蒙古语基础方言与蒙古国蒙古语中心方言对照词典 包满亮 中央民族大学 高校 一般项目 工具书 116 维吾尔语中介语语料库建设研究 杨文革 新疆农业大学 新疆 一般项目 电脑软件 117 回鹘文《阿含经》研究 阿依达尔 新疆大学 新疆 一般项目 专著 118 回鹘文摩尼教文献语文学研究 张铁山 中央民族大学 高校 一般项目 专著 119 维吾尔语情态的类型学研究 李遐 新疆师范大学 新疆 一般项目 专著 120 伊斯兰文献《古兰经注释》语言结构研究 赵明鸣 中国社科院 社科院 一般项目 专著 121 藏族翻译史研究 山夫旦 西北民族大学 甘肃 一般项目 专著 专题论文集 122 苗语领属结构的语用特性和领格类型研究 吴早生 贵州大学 贵州 一般项目 专著 123 二语特征组装模式下的英语导句功能语类习得研究 戴曼纯 北京外国语大学 高校 一般项目 专题论文集 124 分析哲学视域下感觉词汇的认知语义研究 梁瑞清 暨南大学 广东 一般项目 专著 专题论文集 125 负极词的空间映射研究 蒋勇 复旦大学 上海 一般项目 专著 126 复杂语义词智能排歧及语义与句法特征互动关系研究 于建平 燕山大学 河北 一般项目 专题论文集 研究报告 127 话语理解中他心语境与语义连贯的互动关系研究 杜世洪 西南大学 重庆 一般项目 专著 128 基于大规模标注语料库的语义角色句法实现的词汇语义制约研究 亢世勇 鲁东大学 山东 一般项目 专题论文集 电脑软件 129 基于汉英自然会话语料库的指称确立及指称接续机制研究 马文 山东大学 山东 一般项目 专著 130 基于语料库的时间概念化表征研究 肖燕 重庆师范大学 重庆 一般项目 专著 131 认知科学观照下的词—句—篇动态整合研究 刘国辉 上海海事大学 上海 一般项目 专著 132 中美政治隐喻实证对比研究 陈勇 湖南文理学院 湖南 一般项目 专著 133 当代西方文化核心术语研究 佟立 天津外国语大学 天津 一般项目 专著 134 隐喻认知视角下莎剧的修辞研究 谢世坚 广西师范大学 广西 一般项目 专著 135 应用体裁语篇翻译质量评估模式研究 司显柱 北京交通大学 高校 一般项目 专著 136 英汉科技语篇中语言评价系统对比研究 徐玉臣 长安大学 陕西 一般项目 专著 137 中国英语学习者心理时间架构在语篇中的映射研究 周保国 武汉大学 湖北 一般项目 专著 138 基于体裁的商务英语话语研究 严明 黑龙江大学 黑龙江 一般项目 专著 139 美国关于恐怖主义的话语策略研究(2001—2011) 高航 解放军外国语学院 军队 一般项目 专著 140 语用学视角下的戏剧文体研究 俞东明 上海外国语大学 上海 一般项目 专著 141 日语句尾话语标记的交互主观化研究 张兴 解放军外国语学院 军队 一般项目 专著 142 中国高级日语学习者言语行为话语研究 孙杨 扬州大学 江苏 一般项目 专著 143 中日两国现代语言生活中的同形词汇研究 施建军 北京外国语大学 高校 一般项目 研究报告 144 俄汉动词语义—句法集成对比研究 张红 河南大学 河南 一般项目 专题论文集 专著 145 俄汉语移动动词的词汇化及其语义认知研究 徐英平 哈尔滨师范大学 黑龙江 一般项目 专著 研究报告 146 中国学生与俄罗斯人俄语语言意识对比及模式化研究 赵秋野 哈尔滨师范大学 黑龙江 一般项目 专著 147 俄罗斯诗歌句法认知研究 周瑞敏 河南大学 河南 一般项目 专著 148 中俄两国汉俄词典编撰诸参数的比照研究 张金忠 哈尔滨师范大学 黑龙江 一般项目 专著 149 编码复制框架理论视角下翻译对现代汉语的影响——基于历时语料库(1900—1949)的研究 赵秋荣 中国地质大学(武汉) 湖北 青年项目 专著 研究报告 150 明清传教士对中国语言学的贡献研究 董方峰 华中师范大学 湖北 青年项目 专著 151 部分量编码方式的类型学研究 李思旭 安徽大学 安徽 青年项目 专著 152 翻译地理学视域中的浙籍译家研究 贺爱军 宁波大学 浙江 青年项目 专著 153 认知语言学视角下的情感传译研究 潘震 江苏师范大学 江苏 青年项目 专著 154 鄂西南过渡地带方言特征研究 阮桂君 武汉大学 湖北 青年项目 专著 155 粤西粤方言的多功能语法形式 林华勇 中山大学 广东 青年项目 专题论文集 156 汉语方言分区语音特征的层级和主次研究——以粤桂毗连地区汉语方言区片划分为例 侯兴泉 暨南大学 广东 青年项目 专题论文集 157 汉语方言声调演变类型研究 王莉宁 北京语言大学 高校 青年项目 专著 158 新湘语与老湘语特征比较研究 李康澄 湖南科技大学 湖南 青年项目 专著 159 语言接触视角下的宣州吴语地理语言学研究 栗华益 安徽大学 安徽 青年项目 专著 160 晋语吕梁片语音特征研究 白静茹 山西大学 山西 青年项目 专著 161 宁夏回民话研究 马晓玲 宁夏大学 宁夏 青年项目 专著 研究报告 162 宁夏回族经堂语调查研究及语料库建设 马辉芬 北方民族大学 宁夏 青年项目 专著 电脑软件 163 山西方言与普通话之间的话者识别研究 杨俊杰 山西大学 山西 青年项目 专著 164 非传统安全领域语言安全问题与语言规划研究 沈骑 上海外国语大学 上海 青年项目 专著 165 清代语言政策史研究 黄晓蕾 中国社科院 社科院 青年项目 专著 166 新疆多元语言文化中少数民族大学生语言认同研究 油小丽 石河子大学 兵团 青年项目 研究报告 167 长三角地区城市语言状况变化与城市语言规划研究 俞玮奇 华东师范大学 上海 青年项目 专著 研究报告 168 中国学生英语学习中的认知加工模态效应研究 顾琦一 江南大学 江苏 青年项目 专著 专题论文集 169 汉语复合词的认知神经机制研究 顾介鑫 江苏师范大学 江苏 青年项目 专著 170 数字语言符号的认知加工机制——以汉蒙维数字为例 张明亮 山东行政学院 山东 青年项目 研究报告 171 中国手语分类方法及释义分析研究 仰国维 河南财经政法大学 河南 青年项目 研究报告 工具书 172 外语教育与新疆维吾尔族多元文化认同调查研究 卢鸿进 塔里木大学 兵团 青年项目 研究报告 173 创建英语作为媒介语的环境对中国高校大学生英语学习动机的影响研究 丁鹏 西交利物浦大学 江苏 青年项目 专题论文集 研究报告 174 高校英语教师课堂评估能力发展研究 许悦婷 广东外语外贸大学 广东 青年项目 研究报告 175 中国大学生英语阅读困难的诊断和教学干预研究 薛锦 北京第二外国语学院 北京 青年项目 专题论文集 研究报告 176 基于网络的汉语水平自测系统研究 王佶旻 北京语言大学 高校 青年项目 专题论文集 177 中级汉语伴随性词汇习得的实证研究 干红梅 上海师范大学 上海 青年项目 专著 178 田野调查中的声调自动标注及校验方法研究 潘晓声 上海师范大学 上海 青年项目 研究报告 电脑软件 179 基于大规模标注语料库的自媒体语言计量研究 王宇波 武汉大学 湖北 青年项目 专著 研究报告 180 古汉语变读规律及不变读原因研究 王月婷 浙江工商大学 浙江 青年项目 专题论文集 研究报告 181 楚系金文研究史 程鹏万 东北师范大学 吉林 青年项目 专著 182 两周金文作器用途铭辞综合整理与研究 陈英杰 首都师范大学 北京 青年项目 专著 183 《上海博物馆藏战国楚竹书》佚书词语研究 曲冰 哈尔滨商业大学 黑龙江 青年项目 专著 专题论文集 184 直译体文献词汇研究 李慧贤 内蒙古大学 内蒙 青年项目 专著 185 《可洪音义》整理与研究 韩小荆 湖北大学 湖北 青年项目 专著 专题论文集 186 古天文历法气象词训诂研究 朱习文 江西师范大学 江西 青年项目 专著 187 唐代汉译佛经注疏语言研究 张春雷 南阳师范学院 河南 青年项目 专著 188 杨树达小学研究 康盛楠 遵义师范学院 贵州 青年项目 专著 189 上古汉语无标记指称化现象研究 孙洪伟 中山大学 广东 青年项目 专著 190 语义图视角下汉语不定代词、情态词和“工具—伴随”介词的多功能性研究 张定 中国社科院 社科院 青年项目 专著 191 蒙汉语言接触背景下的《元刊古今杂剧三十种》语法研究 任晓彤 内蒙古师范大学 内蒙 青年项目 专著 研究报告 192 四百多年来闽南方言词汇语法的历史演变研究 吕晓玲 泉州师范学院 福建 青年项目 专著 193 中古汉语连词研究 徐朝红 湖南师范大学 湖南 青年项目 专著 194 汉语韵律影响语法的机制、过程及方式研究 裴雨来 西安外国语大学 陕西 青年项目 专著 195 类型学背景下的汉语非核心论元实现及允准研究 孙天琦 中国人民大学 高校 青年项目 专著 196 现代汉语“数量”范畴研究 刘承峰 华东师范大学 上海 青年项目 专著 197 现代汉语复句联结模式的类型学研究 张建 东北师范大学 吉林 青年项目 专著 198 语用特征对句子生成机制的影响 司罗红 郑州大学 河南 青年项目 专题论文集 199 现代汉语语法研究文献语法要点整理及数据库研制 赫琳 武汉大学 湖北 青年项目 电脑软件 200 基于大规模语义知识库的“句法—语义”接口研究 孙道功 南京师范大学 江苏 青年项目 专著 201 篇章时间推进的模式和变异研究 饶宏泉 安徽师范大学 安徽 青年项目 专著 专题论文集 202 现代汉语否定标记系统及其表达的普方比较研究 王世凯 渤海大学 辽宁 青年项目 专著 专题论文集 203 语义网络视角下的汉语感官动词研究 武文杰 河北大学 河北 青年项目 专著 204 现代汉语动补式复合词研究 李丽云 河北师范大学 河北 青年项目 专著 205 基于句法——语义界面的现代汉语词义研究 邱庆山 湖北大学 湖北 青年项目 专著 206 现代通用汉字的历史读音研究 薛志霞 苏州科技学院 江苏 青年项目 专著 专题论文集 207 类型学视野下的汉语极端音系调查与研究 冉启斌 南开大学 天津 青年项目 专题论文集 研究报告 208 基于双语语料库的汉语复杂动词结构英译研究 许家金 北京外国语大学 高校 青年项目 研究报告 电脑软件 209 蒙古语标准音语调特征实验研究 乌吉斯古冷 内蒙古民族大学 内蒙 青年项目 专著 210 蒙古语熟语知识库的开发与研究 海银花 内蒙古大学 内蒙 青年项目 电脑软件 其他 211 面向信息处理的维吾尔语动词配价研究 吾买尔江 新疆大学 新疆 青年项目 专著 212 呈现语言真实面貌:嘉戎语参考语法 林幼菁 北京大学 高校 青年项目 专著 213 东巴文分域断代与历史层次研究 邓章应 西南大学 重庆 青年项目 专著 214 面向自然语言处理的藏语虚词研究 索南才让 青海师范大学 青海 青年项目 专著 215 侗台语声调再分化研究 韦名应 云南民族大学 云南 青年项目 专著 216 类型学视野的上林壮语情态研究 潘立慧 广西大学 广西 青年项目 专著 217 叙事文本的语用学研究 王晓阳 吉林大学 吉林 青年项目 专著 218 基于语料库的日语周边性语言现象多维度实证研究 朱鹏霄 天津外国语大学 天津 青年项目 专著 研究报告 219 现代日语时间副词的句法语义互动研究 孙佳音 北京语言大学 高校 青年项目 专著
个人分类: 语言学探讨 Linguistics|7464 次阅读|0 个评论
单音文言镇,词句组不定;混音白话惑,语类亦难分。
geneculture 2012-5-23 09:18
ZouXiaohui 8:46:57 《 言和语的关系及其应用 》 ——第三届全国语言教学研讨会余等两篇论文小结 单音文言镇,词句组不定;混音白话惑,语类亦难分。 注释 :汉语的单音节字类起于文言可视为对象语言,其各个义项的解释语言可以是词、句、短语或词组,它们都是言和语兼有的混音节故在白话中很难区分【语言学面临的第一大类基本问题】而令人迷惑,词类的区分也因兼类现象经常处于不确定状态而很难明确地加以划分【语言学面临的第二大类基本问题】。( 这两类问题在印欧语中也不例外 !。) ZouXiaohui 8:52:03 解决【语言学面临的第一大类基本问题】的 关键在于 形式化描述,涉及 “文”和“法”的关系 ; 解决【语言学面临的第二大类基本问题】的 要害在于 具体的用意,涉及 “意”和“义”的关系 。 两方面 均有“通用常识”和“专用知识”两个层次的一系列可细分 类型,涉及 “教”和“管”、“学”和“用”的关系 。 ZouXiaohui 8:55:54 我想用“单音文言镇,词句组不定;混音白话惑,语类亦难分”这首小诗把它们加以概括,作为修订后的通俗文章开头引子。 ZouXiaohui 8:56:52 为此,希望听听读者的意见——就算代表读者的一类想法吧。 ZouXiaohui 9:08:16 1. 言本为的 言,也是 文言的言 ,即 单音节字 。由于整个言 可视为 对象语言 类,故可说 一言以镇整个汉语的言即对象语言类 。 2.与言或字所不同的 词、句、短语或词组 三类外来语言类在形式上其实都是不确定的,即让人迷惑不解的,因为,解释语言的该三类形式均为 混音节的语 ,即:词语、语句、词组或短语,其中,仅就 词类的兼语 情形而论就可知其难以明确区分。 由此可见,语言学理论 最大的两类难题 在旧的语言学理论体系之中 是不可能解决的 。 新的 语言科学 基本框架及其 实践方略或基本技艺 因此有了进一步发展和普及乃至推广的大小前提——理论空缺和实际需要。
个人分类: 语言学基础研究|1 次阅读|0 个评论
回顾《“词本位”还是“字本位”有利于汉语语言学? 》
热度 1 geneculture 2012-5-15 16:31
附录 : “词本位”还是“字本位”有利于汉语语言学? ——第一届“汉语独特性理论与教学国际研讨会”学术观点综述 彭泽润 、潘文国等 汉语到底应该把“词”当做基本单位还是应该把“字”当做基本单位? 这是中国语言学现代化的一个重要理论问题 。 自从废除 文言文 的将近 100 年以来,学者们展开了拉锯式的思考 。虽然词本位在《现代汉语词典》等领域得到充份(分)的展示,但是 字本位仍然有相当的生存空间 。目前就“词本位”和“字本位”问题 专家们仍存在较大争议 。这里发表的 2009 年末 第一届汉语独特性理论与教学国际研讨会 专家们就该问题的讨论情况的 详细综述 ,是湖南师范大学 彭泽润 教授根据会务记录进行的加工整理。 ...... 四、陆 俭明、江 枫 等 学者 的 辩论 在双方的代表阐述完各自的观点后,各位专家展开了针锋相对的辩论: 1.摆脱 印欧 语言 的 束缚 是 对 的,但是 方向 要 准确 【江枫】我们非把字说成语素是不合适的,是迁就西方语言学的结果。我同意潘先生的观点, morpheme 原来就是形位的观点,硬是翻译成语素是过分迁就的结果。 彭泽润 先生引了许多现代汉语内容做论据,我认为这不足为凭。现汉把文字定义为语言的符号,把字母词当成汉语词,这些是不恰当的。 【陆俭明】语素的翻译的情况确如潘先生所说。但吕叔湘、朱德熙都明确地说过我们用的这个术语是有严格定义的:语言中最小的声音和意义的结合体,不能再分为更小的声音和意义的结合体。评论语素应当按照这个定义来进行。 【潘文国】如果汉语的语素和印欧语的语素解释是不一样的,两者的对话就不能进行。汉字与语素不一样,它不是不能再分割为更小的声音和意义的结合体。 【张朋朋】我不同意彭教授的观点。文字、文章应该是超时空的,不应局限于特定时空。语言能力和文字能力需要区分。这里就必须承认汉字自己就是一个系统。汉字是文章的书写单位。几千年来我们的重点是文字能力,语言能力不需要教。另外,西方的 Word 也是字, Word 本位就是字本位。字本位发源于索绪尔。 【陆俭明】提出一个新理论目的是为了解决问题。新理论能解决原来不能解决的问题,或者比起原来的理论解释得更好,这样才有提出的价值。字本位的好处在哪儿,这点没有真正说明。潘文国说的好处无非是说字本位注重汉语的特点,这个不能算真正好处,因为真正解决了什么问题还是不清楚。解脱印欧语的束缚是对的,但是方向要找准。语言是音义结合的系统,这个前提必须承认。在此基础上,必然能找出最小的音义结合体,那就是语素。而字如果把它说成 “ 声音、形体和意义三位一体的单位 ” 不能让人了解它在语言中的地位。所以这里有两个问题:一是为什么要否定语素?二是为什么要提出字? 教学提倡字本位,我赞成白乐桑做法,但我要强调的是理论和教学不应该混为一谈。 2.汉语的“字”不要证明,汉语的“词”需要证明 【汪平】首先, 字的存在如同数学中的公理是不需要论证 。字在老百姓的心中是一个语言的字,不仅仅是文字的字。 第二,词和短语的划界问题 至今无法解决 ,而词如果是一个基本结构单位,但是 现在却说不清楚 哪个才是词,这是很严重的问题。字本位可以解决这个问题。 我们不是要推翻原有的体系, 现在要改变的只是语言的基本结构单位。对句子成分的研究是不影响的。 第三,辞和词不同。一个辞是一个连读的单位,中间单位,位于字和句之间,不是一个基本结构单位。 【陆俭明】字本位没有解决 词和词组的切分 问题。使用辞 只是掩盖了 这个问题。我们 面临的问题 的实质是在句法分析上。束缚我们头脑的 是句法 的主、谓、宾, 语义 的施、动、受这套东西。字 解决不了 这个问题。 【潘文国】 语法的目标 是解决教学问题。从《马氏文通》以来的 语法并没有解决这个问题 。 对内对外的 汉语教学 都必须强调字的重要性,这是共识,这是字本位的实践意义。 实践的要求 促使语言理论的发展,这是提出字本位的目的 。 【陆俭明】理论系统和教学系统是两个东西。教学的问题是要跟着理论走的。所以这个理由是不充分的。 【江枫】字本位和词本位的 矛盾的焦点 在于对 Word 的翻译。 词本身也是 以字为基础的 。 【 彭泽润 】文学语言可以是多义的,但是 术语不应该是多义的 。 【邹晓辉】讲两点:一是陆先生讲的语法理论;二是文字和语言的关系。 汉语的理论 如果在普通语言学、形式语法中有学术地位,那就是一个好的理论 。 索绪尔说过语言的研究对象不明确,我们的 新理论实际上就是要把这个问题讲明确 。字和词 是叠交的。在古汉语和西方语言中是没有歧义的 ,歧义是发生在引进西方理论之后。汉语的词和西方语的词 不是一个问题 。语法是说话的规则系统。这个法是约定俗成的。 ...... 3.书面语教学可以用“字”本位,口语教学要“词”本位 ...... 【叶文曦】我就陆老师的两个问题进行回答:一个是 语素和字的区别 ,另一个是 字本位解决了什么问题 。第一,语素定义存在的问题, 字本位理论可以部分回答音义结合的问题,这比语素好很多 。第二, 历史比较研究离不开字。第三,字本位理论为一些老大难问题的解决提供了一些路子,目前主要是词法上,以后也会拓展到句法上。第四,字记录的不仅仅是语言,还包括了很多别的东西。第五,字的内部构造也是语素涵盖不了的 。第六,接轨不接轨是次要的,重要的是要坚持自己的理论道路。 ...... 4. “词”是小孩从小就有的,“字”是在学校学的 【吴文超】小孩心里只有词,字是在学校里学会的,这是有先后的。字和词的关系是元素和分子的关系。西方语言的词是分子,我们语言的字是元素, 20 万个词跟 3 千多个字是对不起来的。另外,人类的大脑信道只有七条,使用词比字对意义传达更有效。 【潘文国】我回应吴文超老师,英语 20 万词,汉语实际不需要那么多,这是 因为汉语可以用 组字的方式 表达 。这里面还有词和短语的分界问题。 GDP 翻译成国内生产总值是词还是短语,这还需要鉴别。第二个问题,吴老师把词跟词对应, 彭泽润 把字和字母对应,请问主张词本位的各位都同意这样的观点吗?达老师的语言学和文字学的问题,我回答一下:就字本身的分析而言,语言学和文字学 有重叠 。 字分析过程中,形体有意义的部分如偏旁部件是语言学的,没有意义的部分如笔划是文字学的。 【 彭泽润 】字和字母对应是正确的,是在文字这个单纯的逻辑层次对应。如果给“字”附加“语素”等含义,那么当然就没有对应关系了。 【史有为】第一,说明一下,语素在日语中叫做形态素。第二,基础术语最初是没有定义的,因此 我不反对字的概念,但应该严格定义 ,避免混乱。第三, 汉语的字 是不是单音节的实际上是人为规定的,完全可能是多音节的,只是在现实中在规范化的作用的才 变成了单音节 。第四,文字的字和 口语的字 是对原来含混概念 剥离的结果 。第五,新的术语,如字本位,定义的术语能在多大范围内推广,这是需要思考的。词和字两个概念需要比一下,哪个才是更好的。第六,我对陆先生理论系统和教学系统看成两个截然不同的系统 提出商榷 ,我认为 教学系统也应该建立在理论系统上 ,两者有一定的共性 。第七,小孩学字 最早能认识表示实义的字 ,虚字不认,这说明文字 还是建立在语言上的 。 【严辰松】字本位各位专家 对字的认识是不同的 ,我认识的 字是既包含语言的,也包含文字的 。语素和字是不一样的。第一,语素的自由性和独立性 不能跟字比 。第二,字 具有离散性 。自由和粘着 是很难区别的 ,字往往要独立出来。 字能解决的问题是 需要一步一步做的,分析这样的单位 是 有助于语言的一些问题的解决的 。 ...... 5.汉语的“字”和英语的“ word”有形式依据,“语素”没有 【周上之】说字而不说语素的原因是语素没有形式的依据,而 字是有形式依据的 。 英语的 Word 是有形式依据的,所以才称得上是基本结构单位,字也是同样如此 。语素、词、短语由于没有形式依据,就不得不借助于语义和功能,但语义和功能是连续的,正如史有为先生所说的 柔性原则 那样。提出 字是为了强调形式结构上的天然性 。字和语素不是一个层面上的,字有形有音不一定有义,而语素必须有义。潘文国先生把 字的意义 分成 13 类,有的有义,有的无义,是个连续统。这也和史有为先生的 柔性原则 是一致的。西方语言的 词有形式、有意义、有功能 ,但汉语的词是 只讲意义和功能的 没有确定的形式结构。 形式字没有意义,例如 “ 国家 ” 的 “ 家 ” 已经虚化到没有意义的地步,虽然没有意义,但却是有功能, “ 国 ” 和 “ 国家 ” 出现的环境是不同的。 “ 学习 ” 的 “ 习 ” 也是无义的,但 “ 学习 ” 和 “ 学 ” 的功能仍是不同的。 同义的字和辞 功能的不同 正是由无义字反应出来的 。 【陆俭明】第一,我们是否承认 语言是音义结合的符号系统,这是个大前提 。承认是一种讨论法,不承认是另一种讨论法。第二, 语法是由小的音义结合体构成大的音义结合体所要遵循的一套规则 。同样的,承认是一种讨论法,不承认是另一种讨论法。我是承认这个说法的。我认为 词并不是我们的本位,语素才是最基本的语法单位 。词和语素是分不开的,汉语和英语都有这个问题,只是汉语更突出而已。汉语的四个单位实际上是三个层次的:语素、词和词组、句子。所以词和词组的划界并不是最重要的。 字本位到底解决什么问题是个关键问题。提出的理论新不新 主要要看对语言问题研究的深度和广度 。 因此, 如果 字指的就是音义结合体,只是术语的缘故,那么我同意 ,因为字和语素就是一码事了 。谈语法就一定要谈这个。 “ 死 ” 有多个 义项 ,作为一个字看,还是几个字看,这个问题必须回答。语法研究应该分三个单位,从文字学看应该是一个单位。 【史有为】 在我的框架下 字本位和词本位的矛盾可以化解 ,因此我应该是第三方。我的 起点是音节 ,与字和语素都可以联系起来,主要看有没有意义。语素和字可以解决一个重要的问题:词和句的构造是有相同点的。此外,话题也是很重要的,这点我和徐先生是一致的,与陆先生也没有分歧。 ...... 【苏立群】 字本位的启发 在于让我从字了解了文化 。在国外,不学汉字不可能让学生把汉语学下去,只有要学汉字的学生才能学下去。 我觉得汉语的语法实际上是按照理据进行的。 【蔡雅熏】我的疑问是 汉语教学应该公布的是字表还是词表 。白乐桑教授建议的是 250 字,而现在新 HSK 最基本的是 150 词。我们 究竟是公布词汇表还是字表 更有效。 字本位和词本位 体现在教学上、测试上 究竟有什么差异? 【陆庆和】字本位的价值在于 惊醒了 我们,我们的汉语的研究 应该建立在汉语上 。我希望理论能指导实践,解决实际问题。 语素教学 对高级班是很有帮助的。今天谈的问题有带回去思考的价值。 ...... 【潘文国】 第一,陆老师预设的两个前提是可以讨论的。第二,语素和字是不同的。语素的音节是不定的,可长可短。 字的语音形式则是定的 。义的方面也不同,语素是单义的, 字是多义的,而且义非常多 。语素是不能分析,下去就变成了音节和音素。但 字是可以分析的,下面可以是偏旁部件,这也是有义的 。 6.应该区分文字学的“字”和语言学中的所谓“字” 【陆俭明】 字往下分析涉及文字学和语言学的分界。我认为它们是有联系,但是,是不同的东西。 我们讨论的是在语法学这个前提下进行的,所以我认为 基本的结构单位 是最小的声音意义结合体。如果不在这个基础上讨论 会比较困难 。 另外,在教学上认为既应该有 字表 也应该有 词表 ,这是对蔡老师的回应 。 作为语言学、语法学,如何思考 字本位 ,是需要区别的。 【张朋朋】所谓音义系统是索绪尔的符号观。文字是人造符号。文字是形的符号,不发音也能看懂。语法内部那是一个认知结构。 ...... 【陆俭明】我回应张朋朋。语法研究的怎么样,在教学中怎么说语法不是一回事儿。 ...... 【邹晓辉】 文字学和语言学 有叠交 ,汉语的形和西方语言的形 是叠交的 。象字(对象语言的字)和释字(解释语言的字) 有叠交 。 字本位 拓宽了 (西方)语言学的范围 , 汉语 有字法和章法 ,而且 字法涵盖了 汉语的句法和词法 。 【汪平】为什么说语素,不说字?第一,字是自然的,语素是分析的结果;第二,字和语素共同的部分是比较多的,除了联绵词和外来音译词,语素基本上就是字。朱德熙先生分词法和句法,词以上是句法,以下是词法。这跟我的认识有所不同,实际上, 字组合也完全可以和句法结合的,可以打通。如果陆先生认同这个观点,我们的距离就更小了。 【陆俭明】郭绍愚先生最早提出这个观点。朱先生主要研究句法,所以强调词组的构造规则和句法的构造规则基本一致。我不强调词,而是 强调语素,因为它是最小的音义结合体。 如果把字定义为最小的音义结合体,这样我也同意。 当然,现在对字的定义与我说的还是不一样的。 http://www.yywzw.com/show.aspx?page=2id=1825
个人分类: 语言学基础研究|2554 次阅读|1 个评论
研读《我关于“字本位”的基本观点》有感
geneculture 2012-5-15 15:29
陆俭明教授《我关于“字本位”的基本观点》揭示了什么? 回答这个问题的不同角度及其过程和答案,可反映乃至形成不同的观点或理论。 附录 :陆俭明《我关于“字本位”的基本观点》(邹晓辉:节选并标读) 1. 两种“字本位”说 学术界目前实际存在着 两种不同性质的“字本位”之说 :一是指 徐通锵 先生1991年起所提出的“字本位”之说(徐通锵1991,1994,1997,2004,2008),一是指 白乐桑 先生1989年在他与张朋朋合写的法文本汉语教材里所提出的“字本位”之说(Bellassen and Zhang1989)。二者其实 只是术语相同,实质有别 。 徐通锵 先生是就 汉语本体 及汉语 语法研究 说的,认为“ 字是汉语句法的基本结构单位 ”或“ 字是汉语基本结构单位 ”, 而 语素、词、句 都是印欧语的东西 ,不适合汉语 (徐通锵1991,1994,1997,2004,2008)。 白乐桑 先生则是就 汉语作为第二语言教学 说的,更确切地说,是就汉语 书面语 教学说的。白乐桑(1996)指出:“汉语教学上 不是有两口锅 吗?我们认为有这么 两口锅: 以字为基本语言教学单位 的书面语言算一口, 以词为基本语言教学单位 的口头语言算一口。” ...... 大家知道 , 在 以往的语法研究 中 , 所使用的语法单位 分别是语素、词、词组、句子等 ; 另外 , 为了进行 需要对词进行分类 , 需要词类 。可是 , 在汉语 语法研究过程 中 , 下面 两大问题 伤透了研究者的脑筋 。 1) 语法单位的 分合问题 和语法单位的 界限问题 。 分合问题 是“一个还是两个”的问题。譬如 , “死亡”的“死”和“死脑筋”的“死” 是 同一个 语素还是 两个不同的 语素 ? “我在给林校长汇报今年本科的招生情况”里的“汇报”跟“我正在写个汇报”里的“汇报” , 它们 是 同一个 词还是 不同的 两个词 ? 界限问题 是 , “叶” , 从日常言语交际来看 , 它不跟别的词或词组进行组合 , 据此“叶”似只能看作语素 ; 但在植物学书本中 , “叶”可以单独作主语、中心语 , 如 : “枇杷树 , 叶可以入药。”“这种花的叶反倒是红色的。”那么“叶”又无疑可以分析为词。这就是 语素和词的界限 问题。人们常常要问 : “‘鸡蛋’、‘小鸟’是词还是词组 ? ”这是 词和词组的界限 问题。 2) 词的 分类问题 , 即词类问题 。 进行语法研究必须对词进行分类。“ 没有分类就没有科学 ”。但是 , 根据什么分类 ? 应该分为几类合适 ? 大家的看法 似永远没法统一。 上述 两大问题 吕叔湘先生在《汉语语法分析问题》 (1978) 这一经典性著作里都谈到过。已经过去 30 多年了 , 至今没有见到解决的良方。 在“字”本位理论中 , 表面看冲破了印欧语的束缚 , “语素”、“词”、“词组”、“句子”和“词类”、“名词”、“动词”、“形容词” , 以及“主谓”、“述宾”、“述补”、“偏正”、“联合”等这些来自印欧语语法学的名称都看不到了 , 代之以似颇具汉语特点的“字”、“辞 ( 字组 ) ”、“块 ( 字块 ) ”、“读”、“句”和“辞类”、“一组字”、“二组字”、“三组字” , 以及“离散·离散”、“离散·连续”、“连续·离散”、“连续·连续”、“动·静”等名称。 如果“字”本位理论 在解决上述两大问题上能超越已有的语法理论 , 那 倒 真该充分肯定 ; 可惜至今我们还没能体会到这种优越性。 以上只是说了一点自己对“字”本位理论的体会 , 还没有到要对该理论持完全否定的地步。 对一种新的理论方法 , 既不要急于一棍子打死 , 也不要急于做过高的不切实际的评价 , 因为一种新的思路、新的观点、新的理论、新的学说、新的方法提出来之后 , 需要有一个对这种新的思路、新的观点、新的理论、新的学说、新的方法进行深入思考、分析的过程 , 进行实践、检验的过程。 有鉴于此 , 我们真诚的希望持徐通锵先生“字”本位理论观点的同仁进一步阐释徐先生的“字本位”理论 , 彰显其在解决汉语语法研究难题、解释汉语语法现象中的优势。 ...... from: http://mall.cnki.net/magazine/Article/YYKE201103002.htm
个人分类: 语言学基础研究|2443 次阅读|0 个评论
研读《形式语言学的纯科学精神 》有感
geneculture 2012-5-15 15:05
研读《形式语言学的纯科学精神 》有感
宁春岩教授《形式语言学的纯科学精神》揭示了什么? 回答这个问题的不同角度及其过程和答案,可反映乃至形成不同的观点或理论。 附录: http://wenku.baidu.com/view/62640b4ce518964bcf847c82.html
个人分类: 语言学基础研究|2274 次阅读|0 个评论
学科交叉中的比较文学批评理论建构之可行性探讨(1)
热度 1 liyanwu 2012-4-10 14:54
学科交叉中的比较文学批评理论建构之可行性探讨(1) 摘要:比较文学是一种多元文化对话活动,这种文化对话覆盖了跨文化、跨学科的丰富内涵,而将语言认知理论研究与比较文学研究相结合,构建一种新的文学批评方法,本文作者认为不仅可行,而且可能是更为精准的。 关键词:学科交叉;批评理论;数字;理据 一 、语言学意义上的理据 : Chomsky 的语言观 : 人的初始状态应该包括人类一切语言共同具有的特点,可称为 “ 普遍语法 ” 。简单地说: “ 普遍语法就是构成语言学习者的 ‘ 初始状态 ’ 的一组特性、条件和其他东西,所以是语言知识发展的基础。 ”“ 普遍语法是一切人类语言必须具有的原则、条件和规则系统,代表了人类语言的最基本的东西 ” ,对任何人来讲是不变的。每一种语言都要符合普遍语法,只能在其他次要方面有所不同。 Chomsky 认为。普遍现象是一组特征,一切语言必须从中选择自己的特征。普遍现象有两重:形式普遍现象( formal universals )和实体普遍现象( substantive universals )。实体普遍现象指的是描写世界各种语言必须使用的有关语音、句法或语义的范畴。如: ….. 形式普遍现象指语法要满足的抽象条件,也就是抽象的规则。但是,这并不是说某项规则必须出现在一切语言之中,而是更加概括、更加抽象的概括。比如:一切语法的句法部分都要包括转换规则,使深层结构的意义表达于表层结构之中。所以, “ 形式普遍现象指的是出现在语法中的规则的性质,以及他们之间发生联系的途径。 ” (《句法理论若干问题》, 29 页)语言学的任务正是要揭示儿童大脑的初始状态和内化了的语法规则。正是这样, Chomsky 宣布语言学是心理学的一部分。这并不是说语言学放弃对语言的研究,而是说,研究语言的最终目的是揭示人脑的实质、人的知识的本质和人的本质。 那么后天因素无关紧要吗? Chomsky 认为后天经验十分重要。狼孩不会说话,正是因为缺少了必要的客观条件。从普遍语法过渡到某种个别语法( particular grammar )需要 “ 经验 ” 的触发 : “ 经验 ” 普遍语法( UG ) --------------------- 》个别语法 ( PG ) PG= a •UG 通过参数 a 的变化 (即儿童的出生地不同,周围的语言不同),可以得出各种具体的语言。比方说, a = a 时, a•UG 可能就是汉语语法; a=b 时, b•UG 可能就是俄语语法。 这个个别语法是什么?就是儿童接触语言材料后内化了的语言规则,是下意识的语言知识。 Chomsky 称之为语言能力( competence ),以区别于语言运用 ( performance )。语言能力是指在最理想的条件下说话人 / 听话人所掌握的语言知识;语言运用是对这种知识在适当场合下的具体运用。语言能力是潜含的,只有在语言行为中才能观察得到;语言运用表露在外面,可以直接观察。语言能力是稳定的、长久的;语言运用是多变的、瞬息的。同样的语言能力在不同的时间 , 地点和场合 , 表现为不同的语言行为。语言运用永远不会完全反映语言能力,因为说话人受着记忆、情绪、劳累等条件的限制。 Chomsky 从心理学角度看问题,把语言能力看成是人脑的特性之一。 Chomsky 的语言能力是动态的,是生成语言过程中的潜在能力。生成语法不是说话过程的模式,而是语言能力的模式,是对语言能力作出的形式化的描写,用一套公式将其内容表达出来。生成语法不局限于个别语言的研究,而是要揭示个别语法与普遍语法的统一性。它不以具体语言为出发点,探索出语言的普遍规律,最终弄清人的认知系统、思想规律和人的本质属性。 Chomsky 认为,一种语言可能同时有几种描写充分的语法,所以还需要达到最高层面,即解释的充分性 (explanatory adequacy) 。 “ 如果一种语言理论能够在原始语言素材的基础上挑选出描写充分的语法,那么,这种语言理论就达到了解释充分性。 ” (《句法理论若干问题》, 25 页) Chomsky 没有把解释充分性讲得十分清楚,所以人们对这一平面的争议最多。它的基本意思是,描写充分的语法解释语言能力后,还要与普遍语法联系起来,才有可能去揭示人的认知系统。在把许多语言描写充分后,要进一步概括出人类语言的普遍特征,才能探讨包括普遍语法的人脑初始结构。(以上节选自刘润清教授的《西方语言学流派》, 2002 )
3076 次阅读|2 个评论
《结合具体学科和专业开展高等教育理论研究(明确方向)》
geneculture 2012-4-10 11:20
《结合具体学科和专业开展高等教育理论研究(明确方向)》
《 结合具体学科和专业开展高等教育理论研究 (明确方向)》 作者:邹晓辉Geneculture (一)“许多不同的说法”之间的沟通问题 在语言学和语言哲学这两个相当庞大的国际化的理论研究领域 其实聚集着众多学科和专业各具特色的理论研究共同体 他们之间往往就同一个话题会有许多不同的说法 (二)“许多不同的工具”之间的兼容问题 在信息学和信息哲学这两个不断扩充的国际化的理论研究领域 也在聚集着众多学科和专业各具特色的理论研究共同体 他们之间往往就同一类对象会有许多不同的工具 注 :还有一系列的科学预言和哲学反思相互结合的国际化的理论研究领域,在此也就不一一举列了。毕竟一个人的时间、精力和能力都是非常有限的,不可能面面俱到,只可能仅就自己感兴趣且具有相当积累的研究方向展开深入具体的学习和研究。 说明 :至此,融智学问体系算是基本建立起来了。为什么今天可以这样说了呢?细心的读者可以从本博客的两组 关键词 (其中,科学网一组——专业、高等教育、共同体、语言学、信息学、融智学,新浪网一组—— 语言、信息、知识、智、教育、管理)和两个系列的 问题 及其相应的具体研究方向,特别还有其下方言简意赅的断言,初步洞察其奥妙,尽管要全面地了解它们,还须首先学习“协同智能观”和“融智方法论”及相应的“广义双语信息处理”、“文化基因工程”或“协同智能计算系统工程”,但是,读者至此毕竟已可看出它明确的方向了。
个人分类: 高等教育学|1688 次阅读|0 个评论
[转载]计算语言学术语500条(汉英双语词条+汉语解释)
geneculture 2012-4-7 14:19
计算语言学术语500条 源语词典 source language dictionary 机器翻译系统中描述源语言的语音、词法、句法、语义或用法的机器词典,用于源语分析。 目标语词典 target language dictionary 机器翻译系统中描述目标语言的语音、词法、句法、语义或用法的机器词典,用于目标语生成。 多目标语词典 multi-target language dictionary 机器翻译系统中描述两个或更多目标语言的语音、词法、句法、语义或用法的机器词典。用于一对多的机器翻译系统。 词典结构 dictionary configuration 机器词典中词项以及词项具有的各种信息的组织形式。 词典信息 dictionary information 机器词典对每个词项的语音、词法、句法、语义特征或用法的形式化描述。 词法信息 morphological information 对词的结构属性或形态特征的描述。 句法信息 syntactic information 对词组合成句子的规律的描述。 语义信息 semantic information 对词汇意义、语言成分之间的逻辑意义、语法意义的描述。 超文本置标语言 ①hyperText markup language ②HTML 标准通用置标语言(SGML)的一种文件类型。它对一类特定的文件定义描述信息的方法,用于互联网上电子文本的传输和共享。 超文本标记语言 词法歧义 morphological ambiguity 由于形态学上的多重意义使得一个语言单位表达一种以上的意义。 句法歧义 syntactic ambiguity 在句子中同一个结构形式表达一种以上的结构关系。 消歧 disambiguiation 证明一个歧义句有几种可供选择的结构解释,或依靠语调、句法分析、上下文中的意义来消除歧义的过程。 分析器 analyzer 根据词法、句法、语义等信息对语句进行形态、语法或语义分析的计算机程序。 句法剖析器 parser 按照语言规则分析句子的句法结构的计算机程序。 中间语言 ①interlingua ②intermediate language 独立于任何特定自然语言的中介表达式,能够统摄机器翻译所需的句法和语义信息,在机器翻译系统中表示源语和目标语之间的联系。 中介语 词汇驱动 lexicon-driven 一种分析语句的方法,根据机器词典提供的词汇信息来控制操作流程。 文法驱动 ①grammar-driven ②syntactic-rule-driven 一种分析语句的方法,根据语法规则控制操作流程。 语法规则驱动 逻辑语义 logical semantics 语句中各成分所表达的概念之间或概念组合而成的事件之间的逻辑关系,例如:施事、受事、因果等。 逻辑语义结构 logical semantic structure 表示一个语言单位内全部逻辑语义关系的抽象表达式。 转换词典 transfer dictionary 在采用转换法翻译策略的机器翻译系统中,描述源语和目标语之间差异的机器词典。 词汇转换 lexical transfer 在采用转换法翻译策略的机器翻译系统中,把源语的词语置换为目标语的词语的过程。 结构转换 structural transfer 在采用转换法翻译策略的机器翻译系统中,把源语的句法结构置换为目标语的句法结构的过程。 自然语言理解 natural language understanding 在研究自然语言的机制和实现过程的基础上,用计算机分析口语或书面语,弄懂它们所表达的意思。 预处理 preprocessing 在进入自然语言信息系统的主要处理流程之前对输入的信息进行整理的过程。 后处理 postprocessing 对已经过自然语言信息系统的主要处理流程后的信息进行再处理的过程。 二值化 binarization 把一组数据按一定的规则映射为0或1的过程。 特征抽取 feature extraction 根据输入的信息产生一个n维向量的过程,这个n维向量反映出被识别模式的本质。 启发式搜索 heuristic search 一种优先求解方法,在问题的状态空间中对解进行搜索时,利用一些启发信息用来引导搜索过程,减少搜索空间,提高问题求解的效率。 隶属度 membership 一个元素属于某一模糊集的大小程度。 统计识别方法 statistical recognition method 一种利用统计进行识别的方法。将识别对象看作一个整体,其所有的特征是从这个整体上经过大量的统计而得到的,然后按照一定准则所确定的决策进行分类判定。 神经元网络识别法 cell meshed recognition method 一种利用神经元网络进行识别的方法。神经元网络是一种具有学习和自组织能力的智能机构,通过神经元网络来进行判定和识别。 贝叶斯判决规则 Bayes decision rule 统计中的一个基本规则。用该规则进行分类时要求各类别总体的概率分布是已知的,并且要决策分类的类别是一定的,贝叶斯判决规则包括最小错误率贝叶斯判决规则和最小风险贝叶斯判决规则等。 贝斯判决规则 匹配 matching 测试两个数据项是否相等或查找一个与关键字完全相同的数据项的过程和方法。 属性文法 attribute grammar 一种形式文法。是以语法的巴科斯范式说明为基础,在普通的上下文无关文法的基础上,对每一个终结点或非终结点加上一些属性和一些对这些属性进行估值的语义规则所形成的文法。其中的属性由属性名字,属性值有序对组成。 文法推断 grammar inference 确定词在句子中的语法范畴和作用的过程。 计算语音学 computational phonetics 计算语言学的一个分支学科。是通过建立形式化的数学模型利用计算机来处理语音的一门学科。 隐式马尔可夫模型 hidden Markov model 是描述连续符号序列的条件概率的一个统计模型,是马尔可夫模型的扩展。该模型由两个随机变量序列组成:一个是观测不到的马尔可夫链,另一个是可以观测到的随机序列。 语音信号处理 processing of speech signal 语音信号输入计算机后对其进行分析处理的过程。语音通过话筒转换成电信号,再经放大或转换变成数字信号,用模式分类方法分析和识别这些信号。 神经网络 neural net 神经系统的一种逻辑及数学模型,是一种具有学习和自组织能力的智能机构。模仿生物神经系统的神经元建立,试图模拟大脑处理信息、学习和记忆的方式,主要用于模式识别、语音识别和语音综合等领域。 识别率 recognition rate 被正确识别的输入模式的数量占被识别的所有输入模式的总数的百分比,是衡量模式识别系统性能的重要指标。 语图 sound spectrogram 将一定长度的语音信号或其他声音信号的动态频率用图形的方式表现,既可以是时间-频率-强度的三维显式,也可以是在某一时间断面上的频率-强度的二维显式。 人工言语 artificial speech 言语合成所产生的输出。 合成言语 ①synthesized speech ②synthethic speech 在言语合成中产生的人工言语。 类比学习 learning by analogy 机器学习中的一种方法。用类比的方法获取新的事实或技巧等知识是通过采取如下方式进行的:将与所需的概念或技巧等知识非常相似的现有的知识转换与扩展到新环境中。 分词单位 unit of word segmentation 汉语信息处理使用的、具有确定的语义和(或)语法功能的基本单位。 概念依存理论 conceptual dependency theory 一种语言自动分析方法。它试图用有限数量的基本概念(语义元)组成各种集合,表示语句的意义,称为概念表达式,并具有推理的能力。 概念从属理论 分词规范 standard of word segmentation 规定分词原则和方法的一系列规则。 规则合成 rule-based synthesis 规则合成是一种利用规则进行语音合成的方法。在这种语音合成方式中,合成语音库中是较小的语音单位(如音素或音节等)在声学上的合成参数。合成时,输入一串代码来指定每一语音单位的音色、音高、音强和音长,合成系统中有一套合成规则,对其合成参数进行必要的修改和调节,然后由语音合成器合成出连续的语句来。 语音合成器 speech synthesizer 在参数式分析合成和规则合成系统中,能将语音合成参数转变为语音波形的软件或硬件,称为“语音合成器”。 合成单元 synthetic unit 事音合成系统所处理的最小语音基本单元,称为“合成单位”,合成语音库就是所有合成单元的集合。按由小到大的顺序,音素、双音素、半音节(声母和韵母)、音节、词、短语和句子都可用作合成单元。 分词标记 mark of word segmentation 分词时可以利用的标记。书面语的分词标记主要有两种,一是自然的分词标记,如标点符号等;另一种是非自然的分词标记,如没有构词能力的单音节单纯词。 人机界面 man-manchine interface 人(用户)与计算机系统之间进行通信的方式与手段,尤指对那些具有支持软件的输入输出设备的使用。 人机接口 分词精度 precision of word segmentation 自动分词的正确率,切分正确的数占应分词总数的百分比。 最大匹配分词方法 maximum match segmentation 一种分词方法,是基于字符串匹配原理的一种机械匹配方法。每次从字串中取长度为最大词长的子串与词表中的词匹配,若成功则该子串为词,然后继续匹配,否则子串长度逐次减1进行匹配,直至成功为止。 最小匹配分词方法 minimum match segmentation 一种分词方法,是基于字符串匹配原理的一种机械匹配方法。每次从字串中取长度为最小词长的子串与词表中的词匹配,若成功则该子串为词,然后继续匹配,否则子串长度逐次加1进行匹配,直至切分完毕。 分词标记方法 mark method of word segmentation 利用分词标记进行分词的一种方法。 双向最大匹配分词方法 bidirectional maximum match segmentation 同时使用正向最大匹配分词方法和逆向最大匹配分词方法。分别从两个方向进行处理,如果得到相同的结果,则这种切分正确,否则系统报错,需要通过另外的措施处理。 逆向分词方法 reverse segmentation method 一种分词方法,与正向分词相反的方向取字符串进行匹配。 机械分词方法 mechanical segmentation method 一种分词方法。主要基于字符串匹配的原理进行,即以“足够”大的词表为依据,采用一定的处理策略将汉语文本中的字串与词表中的词逐一匹配,若成功,便认定该字串为词。 汉语分词系统 Chinese word segmentation system 用来把汉语句子自动切分为词的系统,特殊情况下分词结果包括少数词组和语素。 汉语信息统计 Chinese information statistics 采用统计的方法研究汉语的信息,包括汉字或词语的频率统计,以及汉语句型统计等。 汉语字频统计 Chinese character frequency count 采用统计的方法研究汉语中字的使用频率。 汉语词频统计 Chinese word frequency count 采用统计的方法研究汉语中词的使用频率。 信息量 information content 信息理论中的一个基本概念,指的是对信息确定程度的量度。 熵 entropy 随机试验结局的不肯定性程度的大小。 条件熵 conditional entropy 考虑符号出现概率之间相互影响后的熵,这种熵随机试验前面的结局对于后面的结局有影响。 汉字熵 entropy of Chinese character 汉字所包含的信息量的多少。 计算机辅助教育网络 network in computer assistant education 以电子计算机为主要教育媒介,利用它的逻辑运算、信息存储等功能来为教育服务的一种方式。它包括计算机辅助教学、计算机辅助学习、计算机管理教学和计算机教育行政管理等功能类型。 智能计算机辅助教学 intelligent CAI 利用人工智能技术进行计算机辅助教学。该系统通常由四部分组成:表达教程内容的专门知识模块,体现教师经验的教导策略模块,表示学生对课程理解程度的学生模型,计算机与学生之间用自然语言进行教学对话的智能接口或友好界面。 产生式规则表示法 production rule representation 一种知识表示方法。产生式规则由左部的模式和右部的动作两部分组成,左部的模式确定该规则可应用的条件,右部描述应用该规则时要采取的行动,得到的结论或状态。 语义网络表示法 semantic network representation 一种知识表示方法。语义网络由一些用有向图表示的三元组(结点1,弧,结点2)连接而成,结点表现为自然语言的词和短语的概念,弧是结点之间的语义关系。 框架表示法 frame representation 一种知识表示方法,以框架方式表示将特征与表达概念或实体的结点联系在一起,其中特征借助于槽和它们的值来描述。 谓词逻辑表示法 predicate logic representation 利用谓词逻辑表示自然语言知识的方法。谓词表示对客体的描述,谓词的项则代表某个领域的客体。 知识表示系统 knowledge representation system 用来表示知识的形式化系统,包括语言学知识(如句法、语义等)和外部世界知识(如常识和领域知识等)。 人工智能 artificial intelligence 利用计算机系统模拟与人类智能有联系的功能的过程和方法。 专家系统 expert system 一种人工智能系统。它根据从专家们的专门知识获得的知识库进行推理来解决特定应用领域中的问题。 知识工程 knowledge engineering 以知识为处理对象,以能在计算机上表达和运用知识为主要手段的应用性研究和技术。主要包括知识表示、知识应用和知识获取的方法,实现知识处理的工具和技术等。 知识模型 knowledge model 各种知识结构的统称。知识结构指的是知识表示方法,已有的知识结构有框架、脚本、定型和规则模型等形式。 知识获取 knowledge acquisition 在系统所要处理的问题域范围内,对该问题域客观存在的事物,以及所要解决的问题有全面的理解和把握,包括弄清事物的各种关系并找出解决问题的方法。 元知识 metaknowledge 关于知识的知识,规定系统如何使用它所知道的知识及其限制。例如在专家系统中,元知识告诉系统如何运行或推理。 元规则 metarule 描述一组给定的规则在何种条件、顺序或方式下可以运用的一种规则。 原型 prototype 专家系统试验模型的简称。专家系统不必等到所有的非形式化知识都形式化之后才建立,可以在将某些知识形式化之后就先输入至知识库,在有一定数量和典型的知识输入之后就可以试验运行专家系统,此时的专家系统仅仅是专家系统模型。 回溯 backtrack 一种搜索过程。在此过程中根据推测选择了某一结点,当这一选择导致不能接受的结果时,搜索则回到原始结点以作出另一选择。 事件驱动 event-driven 基于当前问题状态的正向链求解的方法。使用事件表去启动知识源,知识源能够建立或改变假设元素并且把一些新的事件放到事件表中,系统的运行状况是“机会主义”的:用最近发现的东西去指导运行状况,而不是用符合于目标需要去指导系统的运行状况。 评价函数 evaluation function 1.在博弈树中格局的得分数。2.在搜索图中,一个节点处于最佳路径的概率。3.在搜索图中任意节点与目标集之间的距离度量或者差异度量。 形式语言理论 formal language theory 用数学方法研究自然语言和人工语言的语法的理论,只研究语言的组成规则,不研究语言的含义。 框架 frame 一种数据结构。它与特定领域的知识有关,由槽组成,槽能接受特定属性的值,称作侧面,从这些侧面,借助于适当的过程可引出推理规则。 数据驱动 data-driven 一种问题求解方法。从初始的数据或观测值出发,运用启发式规则,寻找和建立内部特征之间的关系,从而发现一些定理或定律。 目标驱动 goal-driven 一种问题求解方法,从目标出发进行反向推导。 汉字编码 Chinese character encoding 给汉字规定一种便于计算机识别的代码,使每一个汉字对应于一个数字串或符号串,从而把汉字输入计算机。 汉字信息处理 Chinese character information processing 用计算机对汉字表示的信息进行操作和加工,如汉字的输入、存储、识别、生成和输出等。汉字信息处理是中文信息处理的一个重要组成部分。 汉字识别 Chinese character recognition 计算机或其他装置对汉字进行的识别。由于汉字的复杂性,汉字识别比拉丁字母识别要困难一些。汉字的印刷文本通过电子扫描而进入系统之后,还要进行预处理工作,例如笔划的细化工作,抽取特征之后再进行识别。 判定树 decision tree 一种具有树结构的判别网络。其中结点代表一些确定分类的具体条件。它实际是一种分类规则,通过它对输入的对象集合进行分类。 决策树 连续语音识别 continuons speech recognition 对连续语音(无中断的)进行识别的过程。这是人机之间最为自然的对话方式,在连续语音流中存在着大量的协同发音和语音段的丢失,特别在大词汇量系统中更为严重。解决连续语音识别的难题不能单纯靠信号处理和模式匹配技术,还要充分利用语法学、语音学、语义学和语用学等知识, 启发式规则 heuristic rule 在人工智能的问题求解时,为了减少搜索而使用的经验性知识等信息或规则。这些规则有助于使搜索过程向最有利于达到目标的方向进行。 树结构 tree structure 用树形式组织信息的方法。 条件概率 conditional probability 在概率统计中,条件A在事件B发生的情况下发生的概率,称为条件概率,记作P(A|B)。 训练集 training aet 用来设计或测试的样本集合。 知识库 knowledge base 为了满足求解问题的需要,按照一定的知识表示方式在计算机系统中组织、存储和使用的互相联系的知识集合。 形式文法 formal grammar 形式化语法规则的集合。这些规则是采用特殊符号写成的。用尖括号将语法成分的名字括起来;随后用::=表示“其范例是”;接着是其具体范例的表达式或符号。如果有多个范例,则在两个范例之间用符号“|”分隔开来。 汉字输入 Chinese character input 根据汉字的形、音等信息,通过各种方式,把汉字转换成计算机内部的数字形式的过程。 定向匹配 directed matching 语音理解系统的字假设器所采用的一种匹配方法,字假设器的目标是为每个未知语音部分找到一个包括正确字在内的最小语音相似空间。至少有三种方法可以用来寻找该最小空间。它们是迭代匹配假设,定向匹配假设和按数据匹配假设。 语言知识库 Language knowledge base 在计算机内存储的语言知识的集合。它是计算机从语音、文字、词汇、句法、语义、语用等角度对语言进行信息处理的基础。 语言模型 language model 语言客观事实的形式化模拟。语言模型是语言客观事物的近似物,语言模型与语言客观事物之间的关系,与数学上的抽象直线与客观世界中存在的各种各样的直线之间的关系类似。 概念树 concept tree 知识组织的一种表达形式。树中每一节点表示基本概念,节点间的联线表示基本概念间的相互关系,前一节点代表的概念为后一节点所代表概念的先决条件。 汉字输出 Chinese character output 将计算机内部以数字形式表示的汉字用计算机外部设备(例如显示终端、打印机等)输出的过程。 汉字内部码 Chinese character internal code 汉字在信息处理系统内部最基本的表达形式,供存储、处理、传输汉字用。它与汉字交换码有一定的对应关系,通常借助于某种特定标识信息来表明它与单字节字符的区别。 汉字交换码 Chinese character code for information interchange 汉字信息处理系统之间或者信息处理系统之间进行汉字信息交换的代码。 语音输入 speech input 通过下述过程所实现的数据输入:通过人机接口接受并识别一种特定的语音信号,然后将其转换为一种代码,传送给计算机。计算机接收这种数据,如同键入的一样。 机器翻译 machine translation 用计算机将一种自然语言(源语言)转换成另一种自然语言(目标语言)的过程。包括书面语机器翻译和语音机器翻译。 自动翻译 机器翻译系统 machine translation system 实现机器翻译的计算机应用程序。有基于规则的机器翻译系统,通常包含机器词典、规则库、源语分析器、目标语生成器及翻译支援程序等部分。也有基于统计语言模型的机器翻译系统。 自动翻译系统 源语言 source language 从一种语言转换为另一种语言时,原来的语言称为源语言。对机器翻译系统来说,源语言是输入的语言。 目标语言 target language 从一种语言转换为另一种语言时,新的语言称为目标语言。对于机器翻译系统来说,目标语言是输出的语言。 语言对 language pair 机器翻译中参与翻译的一种源语言和一种目标语言的合称。 受限语言 restricted language 在词汇、句法、语义及语用等方面受到人为限制的自然语言的真子集。 转换法 transfer approach 经过源语分析、源语到目标语的转换和目标语生成三个阶段来实现机器翻译的策略和方法。 中间语言法 interlingua approach 一种实现机器翻译的策略和方法。利用独立于任何特定自然语言的某种中介表达式来统摄翻译所需的句法和语义信息,表示源语和目标语之间的联系。 中介语言法 语法标注 grammatical tagging 给自然语言文本中的语言单位按形式、功能或意义标明语法类别的过程。 机器词典 machine dictionary 以供人使用的词典为基础,对词条的语音、词法、句法、语义、用法等信息进行规范化或形式化描述,存储在计算机里的词典。可为各种用途的自然语言处理系统提供语言知识资源。 人用电子词典 human-oriented ED 存储在磁盘、光盘或集成电路等媒体上供人使用的词典。 机器可读词典 machine-readable dictionary 存储在磁盘、光盘或集成电路等媒体上的词典,可以在计算机上读取。 频率词典 frequencydictionary 按指定语言单位在使用中出现的频次或分布情况统计编纂的词典。 用户词典 user specific dictionary 自然语言信息处理应用系统中为特定用户设计的、便于该用户使用和维护的机器词典。 双语词典 bilingual dictionary 词目和释义分别用两种语言表达的词典。 单语词典 monolingual dictionary 词目和释义用同一种语言表达的词典。 自然语言生成 natural language generation 在研究自然语言的机制和实现过程的基础上,用计算机把想说的意思以口语或书面语的形式表达出来。 可扩展置标语言 ①extensible markup language ②XML 标准通用置标语言(SGML)的子集。用来定义电子文件的类型,制作和管理用SGML定义的文件,以便在网上传输和共享这些文件。 可扩展标记语言 文本校对系统 ①text-critiquing system ②text proofreading system 自动发现文本的录入或书写错误、发出警告并提供修改建议的计算机应用软件系统。 文本校勘系统 基于知识的推理 knowledge-based inference 根据语言知识或客观世界的知识,从某些已知事实依照推理规则得到另外一些结论的过程和方法。 短语结构语法 phrase structure grammar 对形式语言或自然语言的形式化定义。它包括四个部分:语言中所有词(或符号)的集合T;所有语法范畴的集合N;重写规则的集合P;起始符号S(是N中的元素)。短语结构语法既能生成语言成分序列,也能对语言成分序列进行结构分析。 范畴语法 categorical grammar 本世纪50年代由几位语言学家和逻辑学家发展起来的一类形式语法。利用句法类型演算方法,通过有穷步骤判定句子是否合乎语法。分析语言时只从两个基本范畴(名词和句子)出发进行操作,其他范畴均由此派生而成,操作都以这些范畴的句法分布为依据。 格语法 case grammar 生成语法总框架内的一种语法分析方法。用深层结构的“格”表示句子成分之间的语义关系。深层结构由“情态”和“命题”组成。前者是与整个句子相关的时、语气、体、否定等特征;后者以动词为中心,结构成分可能充当的各种语义角色依动词而定。 系统语法 systemic grammar 一种语法理论。它重视言谈者为体现不同的社会交际功能而在不同语言形式中所作出的选择,旨在建立一个由语言的各个分系统组成的层级网络,用来解释整个语言中全部相关的语义选择。 概率语法 probabilistic grammar 用概率统计的方法分析文本中语言成分之间的关系、推断句子结构的语法分析方法。 扩充转移网络语法 augmented transition network grammar 在有限状态文法基础上进行了扩充的一种语言自动分析方法。它不仅能识别有限状态的语言,还能识别上下文自由的语言。 语义语法 semantic grammar 主要以语义范畴为非终结符的一种上下文无关语法。 蒙德鸠语法 Montague grammar 美国数理逻辑学家R.Montague七十年代提出的一种用数理逻辑方法研究自然语言的理论。它用内涵逻辑模型论描述和计算句子的语义。强调句法与语义的同构对应原则、句法和语义规则的递归定义和组合原则、以及合成语言成分时的数学运算原则。 蒙太古语法、蒙太古语义学 上下文无关语法 context-free grammar 不管上下文如何,所有规则全都适用的一种短语结构语法。 上下文自由语法、二型文法 上下文有关语法 context-sensitive grammar 规则应用时受上下文限制的一种短语结构语法。 上下文敏感语法、一型文法 功能语法 functional grammar 一种语言学理论。把语言互动视为合作活动的一种形式,说明支配这种互动的规则和支配作为这种活动工具的语言表达的规则(包括句法、语义和音系规则)。 词汇功能语法 lexical functional grammar 一种语言学理论。其中词库起中心作用,各种语法功能作为基元。句子的句法结构包括一个成分结构(C-结构)和一个功能结构(F-结构),后者表示表层的各种语法关系。 功能合一语法 functional unification grammar 一种用于自然语言处理的语法理论。其中词项、句法规则、语义信息以及句子的结构和功能都采用复杂特征集来表示,既可用于语句分析,也可用于语句生成。 词性标注 part of speech tagging 在给定的语句中判断每个词的语法范畴,确定其词性并加以标注的过程。通常指采用规则或统计方法进行的自动标注。是语料库加工的基本任务,其难点是兼类词的歧义排除问题。 未登录词 ①unknown word ②unlisted word ③unregistered word 词典中没有收录的词语。通常在汉语自动分词中指没有在分词底表中登录过的人名、地名、机构名、译名和新词语等。 树邻接语法 tree adjoining grammar 用树结构表示语言成分之间的关系、通过树的替换和附加操作来生成句子的语言自动分析方法。又称树邻接语法。 广义短语结构语法 generalized phrase structure grammar 一种语言学理论。建立在上下文无关短语结构语法的基础上。由句法规则、特征限制和语义解释三个部分组成。句法范畴以X阶理论为基础,由重写规则推导出句子的树形结构,再通过特征限制进行合格性条件检验,限制过强的生成能力,然后用蒙德鸠语法的方法得到句子的语义解释。 逻辑语法 logic grammar 用形式逻辑方法描述语言的句子结构的语言分析方法。 定子句语法 definite clause grammar 仅使用上下文自由语法规则的逻辑语法。既可以描述语言的句子结构,也可以表示分析句子的推理方法。其基本思想是:语法的符号不仅是原子符号,而且可以是广义的逻辑项。 外位语法 extraposition grammar 在定子句语法的基础上引入“间隔”等规则扩充而成的逻辑语法。 元语法 metagrammar 可以用来生成一个语法的一组元规则的集合。通过元规则来揭示语法中规则之间存在的规律。 计算语言学 computational linguistics 语言学的一个分支。用计算机科学技术来阐释语言学和语音学问题。可以应用于自然语言理解和生成、语音识别与合成、机器翻译、文本检索和考释、语言统计、计算机辅助语言教学和词典编纂等。 计算语义学 computational semantics 借助数学方法(主要是数理逻辑方法)构建语义模型,把语义分析作为一个计算过程来研究的理论。 计算词汇学 computational lexicology 计算语言学的一个分支。用计算技术从意义、形态、结构等方面研究自然语言的词汇系统,建立面向各种应用目标的机器词典和语料库。 数理语言学 mathematical linguistics 语言学的一个分支。用数学方法研究语言现象,通常采用统计学、代数、概率论、信息论和计算分析等方法。 代数语言学 algebraic linguistics 数理语言学的主要内容之一。把语言学作为现代科学的演绎系统来研究,用一般的符号系统建立语言模型,对语言事实进行抽象的数学描述和理论上的精确分析。 统计语言学 statistical linguistics 语言学的一个分支。研究统计方法、概率方法和信息论方法在语言学理论和描写中的应用,包括分析语言单位在篇章中出现的频率和分布,确立某些关于语言统计特点的一般规律等。 计量语言学 quantitative linguistics 语言学的一个分支,也称数量语言学。用统计技术研究语言单位的频率和分布,研究这些语言单位在使用方式上的统计规律,并应用这些处理风格区别、作者鉴定等实际问题。 语料库语言学 corpus linguistics 语言学的一个分支。把大规模的自然语言数据(书面文本或言语录音的转写)作为语言学描写、验证语言假说、或建立语言学统计模型的依据。 自动机 automaton 离散数字动态系统的数学模型。按照存储量是否有限分为有限自动机和无限自动机两类。 图灵机 Turing machine 由一个控制部件、一条存储带和一个读写头构成的抽象机器。在理论上能够模拟现代数字计算机的一切运算,可以看作现代数字计算机的一种数学模型。通过对这种模型的研究,可以揭示数字计算机的性质。 乔姆斯基层级 Chomskian hierarchy 指生成形式语言的能力逐次增加的一系列形式语法,相互之间的包含关系是:3型文法 2型文法 1型文法 0型文法。由它们生成的语言也具有相应的包含关系。 乔姆斯基等级 语言串理论 linguistic string theory 用结构主义观点描述语言的自动句法分析方法。在语言串分析法中,每一个句子都可以看作由若干个基本串通过附加、连接和替换等方式组合而成。在组成句子的这些基本串中至少有一个是中心串(center string),中心串代表句子的基干。每一个句子都由一个中心串加上零个或多个基本附加成分(elementary adjuncts) 组成,从中心串出发,通过逐渐扩展的方式,可以生成语言中无限多的、任意复杂的句子。 基于合一的语法 unification-based grammar 在语言描写、分析机制和操作原则上以合一的思想为基础的语法理论,广泛应用在自然语言处理领域。例如,广义短语结构语法、词汇功能语法、功能合一语法、范畴合一语法等。它们的共同特点是:语句分析的过程是一个对递归定义的特征结构进行合一运算的过程。 语料库 corpus 大量机器可读的自然语言连续素材的集合,这些素材是书面文本或言语录音的转写。可以为自然语言信息处理的研究提供语言数据,也可以应用于语言教学、词典编纂等。 汉语分词 ①Chinese word segmentation ②Chinese word tokenization 在以连续字串的形式表达的汉语书面语语句中,把词逐个自动识别出来的过程。特定情况下分词的结果也包括一些词组和语素。 汉语自动分词、汉语切词、汉语自动切词 句法范畴 syntactic category 在句法结构中,表示各个语言单位之间的结构关系的类别。如,主语、谓语、宾语、补语等。 依存语法 dependency grammar 在句子的各个成分之间建立各种类型的依存关系,用来解释各种语法关系的一种形式语法理论。又称从属关系语法。依存关系由支配词语和从属词语联结而成,例如在一个小句中,动词是支配词语,从属词语是名词短语,它们由属于动词的配价指派。 链语法 link grammar 用链的方式描写句子中相邻成分中心词之间的连接关系的语言自动分析方法,其生成能力等价于上下文无关语法。 优选语义学 preference semantics 用语义公式表示词义、用语义模式表示短语或句子、用语义优先选择的方式表示词语之间的语义限制的语言自动分析方法。 词频 word frequency 在一定范围的语料中统计词语的实际使用情况而得到的绝对频度和相对频度。绝对频度是词语出现的次数;相对频度是该次数与整个语料所含的总词次数之比。 长距离依存 long-distance dependency 句子中在逻辑上有依存关系的两个成分被其他成分分隔开来的现象。 长距离对应 特征共现限制 feature coocurrence restriction 广义短语结构语法中用于合格性条件检验的投射原则之一。表示句法特征之间的相互依存关系。 合法性定义 well-formed definition 生成语法中关于句子的合语法性的规定。一个句子如果能由一部语法的规则生成就是合法的,否则就是不合法的。 合格性定义、合式性定义 最高投射 maximal projection 生成语言学术语,投射指一部语法对任何一组给定句子的分析经扩展后也适用于整个语言无穷多潜在句子的能力。有各种不同的短语扩展类型,所有的完整短语(例如AP、NP、PP)都是最高投射。 最大投射 功能限制方程 constraint equation 词汇功能语法中记录词汇信息的一种形式,它规定该词的某个属性必须是某个指定的值,限制短语结构规则的生成能力。 限制性等式 中心词特征通律 head feature convention 广义短语结构语法中用于合格性条件检验的投射原则之一。表示父结点上的中心语特征应与子结点的中心语所含的特征一致。 中心语特征规约 特征描述默认值 feature specification defaults 在不需作专门选择的情况下,系统自动给复杂特征集中的特征名指派的特征值。在广义短语结构语法中是用于合格性条件检验的投射原则之一。 特征赋值缺省 术语库 terminology bank 存储专业术语的数据库。数据库中的每条记录是一个专业术语和与该术语有关的各种信息,如注释、类别、出处、语言学特征、其他语种的译名等。 术语数据库 电子词典 electronic dictionary 存储在磁盘、光盘或集成电路等媒体上的词典。又分为人用电子词典和机用电子词典(也叫机器词典)。 概率上下文无关语法 probabilistic context free grammar 每一个产生式A→a都被附加了一个概率值的上下文无关语法。对所有的非终结符A,该概率分布必须满足:∑P(A→a)=1。又称随机上下文无关语法。 合一算法 ①unification algorithm ②unification 给定两个逻辑项A和B(由函数符、变量或常量组成),如果能够找到这样的逻辑项,用它(们)代换A、B中的变量后,得到完全相同的结果,则称代换的过程和结果是A、B的合一。实现代换的算法称为合一算法。在计算语言学中,用合一算法进行复杂特征集的属性匹配和赋值运算。 信息抽取 information extraction 利用计算机从一段非结构化或半结构化的文本中抽取指定的一类信息(例如事件、事实),并将其形成结构化数据,填入一个数据库中供用户查询使用的过程。 信息自动抽取、信息提取、信息自动提取 自动文摘 ① automatic text summarization ②automatic abstraction 利用计算机自动地给指定的文章做摘要的过程。常见的是机械文摘,即根据文章的外在特征(词和短语的频率、文章的结构信息等)抽取能够表达该文中心意思的部分原文句子,并把它们组织起来形成连贯的摘要。 文本分类 ①text categorization ②text classification 在给定的分类体系下,利用计算机根据文本的内容自动判别文本类别的过程。从数学角度来看,文本分类是一个映射的过程,它将未标明类别的文本映射到已有的类别中,该映射可以是一一映射,也可以是一对多映射(通常一篇文本可以同多个类别相关联)。 文本自动分类 标准通用置标语言 ①standard generalized markup language ②SGML 置标语言是描述书面自然语言的文档结构的语言。标准通用置标语言(SGML)由国际标准化组织制定的定义电子文件结构和内容描述的标准。目的是促进语言信息格式的标准化,便于自然语言文本信息的交换。一个SGML语言程序由三部分组成:语法定义、文件类型定义和文件实例。语法定义部分给出文件类型定义和文件实例的语法结构;文件类型定义部分给出文件实例的结构和组成结构的元素类型;文件实例是SGML语言程序的主体部分。在计算机处理过程中,置标语言的标记既可以作为数据,也可以作为控制语句来使用。 标准通用标记语言 信息检索 information retrieval 计算机根据要求自动地从语料库或数据库等信息源中查询和提取有关信息的过程。 概念词典 conceptual dictionary 通过揭示词汇单位之间的各种语义关系,构成语言知识库的语义描写系统,并使之与某个具体知识领域的概念层级系统对应起来的词典。 意念词典义类词典 语义词典 semantic dictionary 是为建立某种语言的词汇语义分类体系,从而为自然语言处理系统提供语义知识支持的词典。词典中的语义信息可以用来进行多义词的义项判别和歧义排除,增强对句子中词汇语义理解的准确性。? 类型和类例关系 relation between type and token 在一个语篇中类型(不同词)的全部数目与类例(实际出现的词)的全部数目的关系。 类型和标记关系 复杂特征集 set of complex features 在功能合一语法中,复杂特征集用功能描述来表示。功能描述由一组描述元组成,每个描述元是一个成分集、一个模式或一个带值的属性,其中最主要的是“属性/值”偶对。描述元的值可以是原子,也可以是另一个功能描述。所有的描述元都写在一个方括号里,书写顺序无关紧要。 ##### 静态属性表 static attribute list 词类特征、单词的固有语义属性、单词的固有语法属性都是可以在词典中独立地给出来的,它们是单词本身所固有的属性,由这些属性构成的表叫做静态属性表。 动态属性表 dynamic attribute list 词组类型属性、句法功能属性、语义关系属性、逻辑关系属性并不能表示单词本身的固有特性,它们是单词与单词之间发生联系时才产生出来并同时被记录在树形图结点上的属性,由这些属性构成的表叫动态属性表。 推导树 derivative tree 从起始语符开始,连续运用规则,生成的终端语符列的树形图。 节点 node 图中连结一条或一条以上边的点。多用于树形图、有向图或线图中。 结点 弧 arc 在有向图或线图中用来连结两个节点,表示其间关系的线段。 线图 chart 能够把剖析过程中在局部上正确的中间结构保存下来的非成圈有向图。 活性线图 边 edge 线图中的弧,叫做边。 终极符号 terminal symbol 树形图中不支配其它节点,处于树的最底部的节点。 终端符号终端成分 非终极符号 non-terminal symbol 树形图中支配其它节点的节点。 非终端符号非终端成分 有向图 directed graph 由一组节点和一组带有方向的连线所构成的图。 槽 slots 1.一种知识表示法中待填项的格式,通常由槽名和槽值构成。2.语法分析中,一个结构式中可以插入某一类语项的位置,也叫槽位。例如在句子“他____书”中,横线标出的是槽,可以填入“看、读、买、写”等动词的一个子类。用槽分析句子结构是法位学语法的特点。 槽位 填充项 filler 可以填入到槽中的语言项目。 类属关系 class hierarchy 上位概念和下位概念之间的关系。 基元动作 ①primitive acts ② primitive actions 从动词中抽象出来的表示基本动作的概念要素。不同理论中,基元动作的种类和数量不同。 概念图 concept graph 用图形的方式来描述概念之间关系或概念表达式的知识表示法。 概念网络 conceptual network 用网络的方式来描述概念之间关系或概念表达式的知识表示法。 属性继承 property inheritance 表示属性或特征的信息从某一结构体传承到另一结构体。 特性继承 上位概念 superordinate concept 外延完全包含另一个概念的外延,且该概念的外延仅仅是其外延一部分的概念。与下位概念相对。在上下义关系中表示较概括意义的那个概念。 下位概念 subordinate concept 外延完全包含于另一个概念之中,并仅仅成为该概念外延一部分的概念。与上位概念相对。在上下义关系中表示较具体意义的那个概念。 逻辑语义学 logical semantics 20世纪发展起来的、主要从逻辑角度研究语义问题的一门学科。 数理逻辑语义学 logical and mathematical semantics 运用数学和逻辑运算符号即用数理逻辑方法来分析语义现象的交叉学科。 可能世界 possible world 可能世界语义学中把一个句子所遇到的各种情况和各种条件的集合称为该句的可能世界。 isa关系 isa hierarchy 语义网络图中用“isa”连接的两个节点所具有的上下义的关系。 上下位体系 上下文意义 contextual meaning 语言单位在一定的上下文中与其他词语或句子搭配时所表示的意义,也叫语境意义。 内涵意义 intensional meaning 语义学中区分出来的一种意义类型,与“认知意义”相对。指语言单位所反映出的人们对事物的非本质特征的认识,是语言单位通过所指事物传递的意义。 外延意义 extensional meaning 语言单位所反映出的人们对其所指事物范围的认识。 外延 denotation 概念所反映的对象的总和。 内涵 connotation 概念所反映的对象的特有属性、本质属性。 上下义关系 hyponymy 词项或概念之间所具有的具体和一般的涵义关系,也叫类属关系、种属关系。 类属关系种属关系 语义基元 semantic primitive 从词语中抽象出来的表示行为或状态的最基本概念,可以用它们和它们的组合来描述句子内部的语义关系。 语义特征 ①semantic feature ②semantic property 从词义中分析出来的、能将词分类的最小意义成分,也称语义成分、义素。 语义成分义素 语义因子 semantic factor 从语言中抽象出来的最单纯、最基本的概念。如果按一定的方式组合起来,可以构成复合概念。 语义标记 semantic marker 1.用来描述词义的一组带有正负值的语义成分,也称为语义特征。 2.一种用语义成分来描述词义的形式化语义描述方法。 语义特征语义成分 语义模式 semantic pattern 用来确定语段中词与词语义关系的格式。在优选语义理论中是“实体——动作——实体”的三元组合。 语义范畴 semantic category 语句中词与词之间语义关系的类别。 语义类别 语义场 semantic field 按一定的语义关系组成的大小不等的词项集合。在一个语义场内的所有词项要具有一定的共同语义特征。 语义解释 semantic interpretation 根据语义规则对句法部分生成的句法结构所表达的意义的说明。又称语义表达、逻辑式。 语义表达逻辑式 音文转换 speech to text 利用计算机分析、识别给定的语音信息并将其转换成与其等价的文本形式的过程。 音转文 文语转换 text to speech 利用计算机根据给定的文本产生与之等价的相应的语音形式的过程。 文转音 交集型歧义切分字段 overlapping ambiguous segmentation (OAS)? 在字符串ABC中,AB是词,BC也是词,如“会诊断”中,“会诊”是词,“诊断”也是词,因此在自动分词中可能产生错分。这样的字段叫交集型歧义切分字段。 组合型歧义切分字段 combination ambiguous segmentation (CAS)? 在字符串AB中,AB是词,A是词,B也是词,如“将来”中,“将来”是一个词,“将”也是一个词,“来”也是一个词,因此在自动分词中可能产生错分。这样的字段叫组合型歧义切分字段。 多义型歧义切分字段 受控语言 controlled language 在词汇规模和语言结构复杂度上受到有意控制以便于识别和处理的自然语言。也叫受限语言。 受限语言 文本对齐 text alignment 从组织在一起的同一文本的不同语言的译文中识别等价的词项、短语、句子或表达式的过程。 双语对齐 bilingual alignment 在双语语料库中建立原文和译文的相同语法单位之间的对应关系。双语文本之间存在着多层次的对应关系,包括段落之间、句子之间、短语之间以及词语之间的对齐。 组块分析 chunking 在词分析的基础上对短语的识别和分析,也叫基本短语分析或浅层分析。 知网 hownet 董振东等人创建的以汉语和英语词语所代表的概念为描述对象,揭示概念之间以及概念属性之间关系的语言知识库。 词义自动标注 word sense tagging 在计算机上运用逻辑运算和推理机制,对出现在一定上下文中的词语的语义进行判断,自动确定其义项并加以标注的过程。 语义自动排歧 知识表示 knowledge representation (KR) 用形式化的表达方式表示常识、知识和推理过程。目的是让计算机能够自动分析自然语言中体现的常识知识及特定的语言交际环境中出现的具体知识。 选择限制 selectional restrictions 是一种利用语义消解歧义的方法。它规定可共现语义是合法组合,而剖析过程中产生的不合法表达式要被排除掉。 黑箱评测 black box evaluation 只关注工作结果不关注工作过程的系统评测方法。 词义消歧 word sense disambiguation (WSD) 是对出现在具体语境中的多义词确定一个合适的义项的过程。 歧义结构 ambiguous structure 是具有潜在歧义的抽象句法结构。其结构项包括常项和变项,常项是具体词语,变项是词类或句法范畴类。 歧义格式 玻璃箱评测 glass box evaluation 既关注工作结果又关注工作过程的系统评测方法。 透明评测 自学习 self-learning 用机器模拟和实现人的智能行为的自学习特性的过程,即按照一定的推理机制通过学习已有知识不断获取新的知识,然后在已有知识和已学新知识基础上重新获取新知识的过程。 机器学习 machine learning 研究怎样使用计算机模拟实现人类学习活动的一门科学,是计算机科学人工智能领域的一个重要分支。学习意指系统在不断重复的工作中对本身能力的增强或者改进,使得系统在下一次执行同样任务或相似任务时,会比现在做得更好或效率更高,而这对计算机来说,就是根据其记忆或经验修改程序,或改变逻辑通路及参数值的过程。 信息 information 广义的说,信息就是消息。一切存在都有信息。用文字、图像、声音、现象、情景等表示的内容,都称为信息。信息可以被储存和使用。 信息处理 information processin 获取信息并对其进行加工处理、使之成为有用信息并发布出去的过程,称为信息处理。 智能 intelligence 指人类认识客观事物并运用知识解决实际问题的能力。它包括感知、记忆、抽象概括、学习知识、积累经验和解决问题的能力,所以是一种复杂的综合精神活动的功能。 消息 message 具有各种内容和编码类型,并可以以存储转发方式传送的信息。 数值数据 numerical data 数据(Data)是表达和传播信息的载体或工具。从实际使用的角度看,数据分为两类:"数值数据"和"非数值数据"。"数值数据"是指具有"量"的概念的数据,可比较大小,它常常带有量词。而"非数值数据"是指具有"陈述"意义的数据,它常常是对对象的一种"描述"或"表达"。 检索系统 retrieval system 对结构化和非结构化数据包括多媒体信息进行储存、索引、查询和管理的系统。 特征/标记系统 tag system 标记系统是一个规则集,它定义了固定数量的元素(它们要么是通常被定义过的,要么从一个序列开始处移去)以及一套附加元素集(它们是基于那些从开始处移去的元素)。 同态 homomorphism 代数系统(G,*)和(S, °),f是从G到S上的一个映射. 对于任意a,b属于G,有f(a*b)=f(a) °f(b),则称f是由(G,*)到(S, °)的一个同态映射. 并称G与S同态。 推导 derivation 生成语法术语,指一组形式上可识别的阶段,构成从起始符号到终端语符列的句子生成过程,即一整套已经应用的短语标记规则、转换规则等。 推理规则 rule of inference 非终极符重写和替换的规则或者公式。 无限制文法 unrestricted grammar 短语结构文法的规则在生成符号串的过程中没有附加任何限制,这种文法称为无限制文法。 0型文法、短语文法 无限制语言 unrestricted language 应用无限制文法所定义的语言叫做无限制语言。 无向树 undirected tree 连通无回路的无向图称为无向树,简称树 无向图 undirected graph 若图G中的每条边都没有方向,则称为无向图。 无序图 unordered graph 指图中结点之间没有次序排列,则称为无序图。 相邻弧 adjacent arcs 同一回路中有且仅有一个公用节点的两个弧称为相邻弧。 相邻项 adjacent vertices 由无向图G中一条边连接两个项,称为相邻项。 映射 mapping 两个集合元素之间的一种对应规则。映射有时又称函数。 有限图 finite graph 设G=(P, L)为图。如果P是点的非空集合,L是连接某些不同点对的边集合,并且任意一对不同点之间最多有一条边。当P为有限集时,G称为有限图。 有序树 ordered tree 指树中同层结点从左到右有次序排列,它们之间的次序不能互换,这样的树称为有序树,否则称为无序树。 有序图 ordered graph 指图中结点从左到右有次序排列,它们之间的次序不能互换,这样的图称为有序图。 语法范畴 grammatical category 根据某些语法意义的共同内容,把语法意义概括为几个基本类别,这种语法意义的类就叫作语法范畴。语法范畴可以大致分为词法范畴和句法范畴两大类。 语法规则 grammatical rule 是一种语言中由小的音义结合体组合成大的音义结合体所依据的一套规则。 范畴 category 就是分类,是人的思维对客观事物的普遍本质的概括和反映。 源程序 source program 由程序员应用各种程序语言编写的程序。这种程序一般需要编译成机器语言后才能在计算机上运行。 源词 source word 机器翻译中被翻译的语言的词。 真值语句 truth value expression 一个语句的值或者是真或者是假,则这个语句称为真值语句。 正则集 regular set 设有字母表Σ,Σ上的正规表达式及其值称为正规集,其递归定义为: (1)ε和Φ都是Σ上的正规表达式,它们所表示的正规集分别为{ε} 和Φ; (2)任何a∈Σ,a是Σ上的一个正规式,它所表示的正规集为{a}; (3)假定U和V都是Σ上的正规式,它们所表示的正规集分别记为L(U)和L(V),那么,(U|V)、(U·V)和(U)*也都是正规式,它们所表示的正规集分别为L(U)∪L(V)、L(U)·L(V)(连接积)和(L(U)*(闭包)。 正则文法 regular grammar 是乔姆斯基短语结构文法分层里的3型文法。可用四元组G=(V,Σ,P,S)表示,其中V是变元的有限集合,Σ是终结符的有限集合,S∈V,称为开始符号,P是由形为A→w和A→wB(A→Bw)产生式组成的有限集。 正则语言 regular language 由正则文法生成的语言。 终极树 terminal tree 不能再解析的树。 重言式 tautology 恒取真值的命题公式称为重言式。 转换 transformation 从一种句法结构到另外一种句法结构的转变。 转换规则 transformational rule 对句法结构进行转换的规则。 转换语言 transformational language 由转换语法生成的语言。 自反性 reflexivity 对所有a∈A,如果有(a,a)∈ R,则称R是A上的自反关系。 自然语言 natural language 是与编程语言或者其他人机交互语言相对立而言的,用于人和人之间交流的书面语或者口语。 族 family 数理语言学中,具有相同词干而词尾不同的一组词。一般表示为{ai},其中I I,I是一个非空集合,称为索引集,ai即表示族中索引为I的一个词。 自然语言处理 natural language processing 用计算机对自然语言的音、形、义等语言文字信息进行的加工和操作,包括对字、词、短语、句、篇章的输入、输出、识别、转换、压缩、存储、检索、分析、理解和生成等各方面的处理技术。它是在语言文字学、计算机应用技术、人工智能、认知心理学和数学等相关学科的基础上形成的一门边缘学科。 元理论 meta theory D.Hilbert采用分层理论的办法,把理论分为两层,一层是需要证明其相容性的那个系统,叫做对象理论;另一层是作为证明工具的那个系统,叫做元理论。元理论必须简单清晰,正确可靠,没有任何疑问。 语言的随机模型 stochastic model of language 用概率统计的方法来揭示语言单位内在的统计规律的模型。常用的有N元语法以及马尔可夫模型等。 语言归约 language reduction 自动机的读头自左向右扫描输入串,一边把输入符号移入栈内,一边检查位于栈顶部的一串符号是否与某产生式右部相同,如相同就把栈顶的符号替换成相应的产生式左部非终结符,这种替换称之为归约。 自动索引 automatic indexing" 利用计算机自动从文章(或文本段落)中提取能代表主题的单词或短语的过程。 自动分类 automatic classifying 利用计算机根据某种特征对元素进行划分和聚类的过程。 自动检索 automatic retrieval 利用计算机从众多的文献资料中找出符合特定需要的信息的过程。 词汇统计法 lexicostatistics 指年代语言学使用的一种方法,用来对假定有亲缘关系的语言一组组相关词项的变化速度作定量比较,从而推算这些语言分离后的时间差距。 马尔可夫链模型 Markov-chain model 一个随机过程{Xn,n³0},若已知现在时刻t的状态Xt,如果将来状态Xu(ut)取值(或取某些状态)的概率与过去状态Xs(st)取值无关,则称此性质为马尔可夫性;具有马尔可夫性的随机过程称为马尔可夫过程。若Xt的取值全体构成的集合S为可列的无限集或有限集S={1,2,3,…},则称该随机模型{Xn,n³0}为马尔可夫链模型。马尔可夫链模型的数学描述是:如果随机序列{Xn,n³0}对任意i0,i1,…,inS,0≤N≤n及P{X0=i0,X1=i1,…,Xn-1=in-1}0,有 P{Xn=in|X0=i0,X1=i1,…,Xn-1=in-1}=P{Xn=in|Xn-N=in-N,…,Xn-1=in-1} 称其为马尔可夫链,其中i0,i1,…,in,in+1分别为马尔可夫链的状态,N称为马尔可夫链的阶。 转移概率矩阵 transtion-probablity matrix "I,jS,称P(Xn+1=j|Xn=I)=pij(n)为n时刻的一步转移概率。若对"I,jS,pij(n)=pij,即pij与n无关,则称{Xn,n³0}为齐次马尔可夫链。记P=(pij),称P为{Xn,n³0}的一步转移概率矩阵,简称为转移矩阵。 0阶马尔可夫链 zero-order Markov chain 若在特定情况下,系统在时间t的状态与其历史状态均不相关,即N=0,则该系统构成一个离散的0阶马尔可夫链,P{Xn=in| X0=i0,X1=i1,…,Xn-1=in-1} = P{Xn=in} 1阶马尔可夫链 first-order Markov chain 若在特定情况下,系统在时间t的状态只与其在时间t-1的状态相关,即N=1,则该系统构成一个离散的1阶马尔可夫链。P{Xn=in| X0=i0,X1=i1,…,Xn-1=in-1} = P{Xn=in|Xn-1=in-1}。 2阶马尔可夫链 second-order Markov chain 若在特定情况下,系统在时间t的状态与其在时间t-2,t-1的状态均相关,即N=2,则该系统构成一个离散的2阶马尔可夫链。P{Xn=in| X0=i0,X1=i1,…,Xn-1=in-1} = P{Xn=in| Xn-2=in-2,Xn-1=in-1}。 高阶马尔可夫链 higher-order Markov chain 若在特定情况下,系统在时间t的状态与其在时间t-N,…,t-1(N2)的状态均相关,则该系统构成一个离散的高阶马尔可夫链。P{Xn=in| X0=i0,X1=i1,…,Xn-1=in-1} = P{Xn=in| Xn-N=in-N,…,Xn-1=in-1}。 最大似然估计量 maximum-likelihood estimator 最大似然估计量是对未知参数的一个估计值,使获得当前样本的可能性最大。 信息论 information theory 关于信息的本质和传输规律的科学理论。它是研究信息的计量、发送、传递、交换、接收和储存的一门新兴学科。 消息源 message source 消息源用来发出某个消息或关于某个消息的状态。 语言羡余 language redundancy 原为信息论术语,现用来分析造成语言学中对立的各种特征。一个特征(语音的、语法的等)如果为识别一个语言单位所不必出现的,就是羡余的。不被认为是羡余的特征是区别性特征。 方差 variance 设X为一可积随机变量,则随机变量(X-EX)2的期望E(X-EX)2称为X的方差。 统计分布 statistical distribution 对随机变量取值的估计,以显示其发生的观察或理论频率。 绝对频率 absolute frequency 在给定统计范畴内的观察数目。 词长分布 distribution of word length 单词长度(即组成单词的单字个数)的概率分布。 离散分布 discrete distribution 随机变量均取离散值的分布。 单词概率 word probability 单词出现的概率分布,即一个单词出现的可能性。 单词类型复现率 repeat rate of word type 某个词型在真实文本中的重复出现比率。 复现率估计 estimation of repeat rate 某些统计特征量重复出现的概率估计。 语言多样性 linguistic diversity 世界上各个国家和民族在语言文化上的差异(包括词语,发音,语法等),称为语言多样性。 词汇容量 size of vocabulary 词汇容量是指一个系统所能处理的词汇总数。 词汇集中度 vocabulary concentration 词汇在文本中集中出现的频度。 词汇差异度 vocabulary diversity 词汇在形态、语义、句法功能等方面上的差异性。 总体样本 population sample 通常把研究对象的全体成为总体样本。 相对频度 relative frequency 绝对频度和数据点总数的比率。 齐普夫假设 Zipf's hypothesis 该假设的描述是:由于单词(或事件)出现的概率通常是开始较高,然后逐渐减小,因此只有少部分单词(或事件)是经常出现的,而大多数单词(或事件)很少出现。 统计推断 statistical inference 根据对样本信息的统计而进行推断或做出结论的过程。 期望值 expectation value 又称均值,是随机变量按其取值概率的加权平均,表征其概率分布的中心位置。 分布函数 distribution function 设随机变量X取值小于实数x的可能性。即,设X为(Ω,F,Ρ)上的随机变量,对任一实数x,定义 F(x)=P(Xx)=P(X(-,x]),则称F(x)为X的分布函数。 语言年代学 glottochronology 根据核心词汇在发展中遗留下来的百分比计算语言发展年代和亲属关系的一种科学方法。它主要建立在语言中核心词汇按恒定比率(第1000年后平均保留约81%)发展变化的假设基础上,可用于根据亲属语言(后人发展应用于方言)中共有的同源词百分比来推算它们从原始母语中分化出来的年代及亲缘关系的远近,因而可用于测定同源民族分离的年代和关系的亲疏。 词汇分化 lexical divergence 词汇分化是这样一种语言现象,即一个语言中的主动词在翻译成另一个语言时却使用了意义不同的另一个动词。例如,英语句子 “They run into the room.” 其北印度语翻译为“woye daurte huye kamre mein ghus gaye.” 这里,英语句子的主动词是“run”(跑),北印度语句子中的主动词是 “ghus” (进入),而“run”的意思仅作为一个分词在句中出现。 样本容量 sample size 按一定规则从总体中抽取若干个个体,这些个体称之为样本,样本中所含个体的数目称为样本容量。 抽样 sampling 按照一定规则从总体中抽取样本的过程。对于有限总体,可分为有放回抽样和无放回抽样。 样本频度 sample frequency 单位时间(或距离)内抽取样本数据(或获得测量数据)的次数。 文本检索 text retrieval 根据用户提出的查询,在文本库中寻找相关文本的过程。 跨语言信息检索 cross-language information retrieval 在信息检索中,如果用户的提问用一种语言表示,而文本库中的文本用另外一种语言表示,这样的信息检索过程称为跨语言信息检索。 信息过滤 information filtering 根据某些特定的要求,截流或删除互联网某些敏感信息的过程。 问答系统 question answering system 系统根据用户的自然语言提问,从大规模文本库中提取相关信息并用自然语言给出精确的答案,这种系统称为问答系统。 召回率 recall 是信息检索等领域的一种系统性能测试指标,指检索到的正确样例数与实际存在的正确样例数总数的比值。 F值 F-measure 是信息检索等领域的一种系统性能测试指标,是综合召回率和精确率的一种系统评价指标。 搜索引擎 search engine 是一个对互联网上的信息资源进行搜集整理供用户查询的系统,它包括信息搜集、信息整理和用户查询三部分。 文本校对 text checking 利用自然语言处理技术,对文本进行核对和校正以检测文本的拼写、句法等是否正确的过程。 词网 WordNet WordNet是Princeton大学认知科学实验室开发的一个在线的英语词汇参考系统,它的设计基于心理语言学中的人类词汇记忆理论(psycholinguistic theories of human lexical memory)。WordNet将英语的名词、动词、形容词和副词组织成同义词集,每个同义词集表示一个词汇概念。同义词集之间用各种不同的关系联系起来。 知网 HowNet 是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。由董振东教授领导的研究组提出和建立。 言语识别 ①speech recognition②automatic speech recognition ③ASR 运用电子技术分析和识别人类言语并作出适当响应的过程。通常是用计算机把口语的语音形式自动转换成文本形式。 自动言语识别、语音识别 言语合成 speech synthesis 运用电子技术产生能让人听得懂的人工言语的过程。通常是用计算机把文本转换成语音。这一过程使用的设备称作言语合成器(speech synthesizer)。 语音合成 n元模型 N-gram 是一种概率模型,其中规定当前元素(如:词,词性等)出现的概率只同它前面出现的N-1个元素有关。N=1时就是一元模型(unigram),N=2时就是二元模型(bigram)。 脚本 script 是描述人类某种活动的事件序列,是已成陈规的事件序列的知识。 Brown语料库 Brown Corpus 始建于20世纪60年代初,由W.N.Francis和H.Kucera发起,在美国Brown大学建立了世界上第一个根据系统性原则采集样本的标准语料库,规模为100万词次,主要代表了当代美国英语。 LOB语料库 LOB Corpus 始建于20世纪70年代初,由英国Lancaster大学的著名语言学家G.eoffrey和倡议,由挪威Oslo大学的Stig Johansson主持完成,最后装在挪威Bergen大学挪威人文科学计算中心(LOB语料库也因此以三家单位的首字母缩写得名)。规模与Brown语料库相当,主要代表了当代英国英语。 COBUILD语料库 COBUILD Corpus 是80年代第一个以词典编撰为应用背景构建的大规模语料库,是英国Birmingham大学与Collins出版社合作的结果,规模达到2000万词级。语料库名称也是两家单位的首字母缩写(Collins Birmingham University International Language Database)。 Upenn树库 Upenn treebank 美国Pennsylvania大学80年代末90年代初开始发起了树库计划,对百万词级的语料进行句法结构标注。该项目由Pennsylvania大学计算机系M.Marcus主持,到1993年,完成了对近300万英语词的句子的基本法结构标注。 文-语转换系统 text to speech system 将文本形式转换为语音形式的语音合成系统,称为“文-语转换系统”。这一系统的运作过程是,先对一输入文本作形态和音系分析,分析时考虑到规则和不规则形式这类问题。然后由字母-语音转换规则和其他一些专门特征生成词平面上的音系表征式,后者再转换成语音表征式(容纳连续言语的特征,包括句子韵律)。合成的实现靠一个基于规则的系统,输出由一个终端模拟合成器提供。 语音清晰度 diction 一个人说话时的发音清晰程度。 倒谱平滑 cepstral smoothing 一种处理语图的方法,它消除嗓音纹理,得到一条突出主要频带的平滑曲线。 模数转换器 ①analog-to-digital converter ②ADC 一个变换模拟信号为数字信号的电子器件。它通过很高的频率对模拟信号采样完成模数转换。根据采样定律,如果信号采用频率不低于两倍的信号最高频分量马厩不会有信息丢失,原始信号能够由采样值精确地重建。 模拟信号 analog signal 一个连续变化的波形,因此它从一个值变到另一个值时经过其中的一切数值。通常的声波是一个模拟信号。 信号 signal 在利用声波或电子技术进行信息的传播和重建过程中,指有意要传输和重建的信息。它与伴随的噪声相对立。 Longman语料库 Longman corpus Longman语料库建于80年代,由三个大语料库构成,规模达到5000万词级。包括LLELC语料库(Longman/Lancaster英语语料库)、LSC语料库(Longman口语语料库)和LCLE(Longman英语学习语料库)。该语料库的主要目标之一是编撰英语学习词典,为外国人学习英语服务。 ACL/DCI语料库 ACL/DCI corpus ACL/DCI是由美国计算语言学会(The Association for Computational Linguistics,简称ACL)倡议发起的语料库项目,收集语料范围相当广泛,包括华尔街日报、Collins英语词典、Brown语料库、Pennsylvania大学开发的树库,以及一些双语和多语文本等。既有标注的语料,也有未标注的生语料。ACL/DCI最初构建语料库时,制定了语料文件的格式标准,所有收集的语料文本都用SGML语言进行描述,语料标注则依照TEI(Text Encoding Initiative)标准进行,为语料库在不同计算机环境下进行数据交换奠定了基础。 双语语料库 bilingual corpus 包含两种语言文本的语料库,可以分为平行语料库(Parallel Corpus)和比较语料库(Comparable Corpus)两种类型。其中,平行语料库指的是语料库中的文本构成译文关系,根据标注层次可以细分为:文本级对齐平行语料库、段落级对齐平行语料库、句子级对齐平行语料库、词语级对齐平行语料库等;比较语料库指的是将表述同样内容的不同语言文本收集在一起形成的语料库,这些不同语言文本之间并不构成翻译关系。 基于实例的机器翻译 example-based machine translation 以双语对照的翻译实例库作为主要知识源的机器翻译方法。实例库保存大量源语言句子和该句对应的译文。每当输入一个源语言句子S时,系统利用S和实例库中的源语句子进行比较,找出其中和S最为相似的句子S’,并模拟S’的译文T’生成S的译文T,然后输出。 基于规则的机器翻译 rule-based machine translation 以表达语言学知识的符号系统——规则系统为主要知识源的机器翻译方法。翻译过程在规则的驱动下完成。 基于统计的机器翻译 statistical machine translation 建立在统计语言模型基础上的机器翻译方法。这种方法认为,机器翻译问题是一个噪声信道问题,一种语言S经过了一个噪声信道而发生了变形,从而在信道的另一端呈现为另外一种语言T,翻译实际上就是如何根据观察到的T,恢复最为可能的S的问题。用Pr(S|T)表示S翻译成T的概率,那么翻译问题就成为:在观察到T的前提下,寻找一个S,使得Pr(S|T)取最大值。即 ,利用贝叶斯公式,有 ,因Pr(T)和S无关,故有 。其中Pr(S)称为语言S的语言模型,Pr(T|S)称为S到T的翻译模型。 词频索引 word frequency index 为改进单词索引,同时采用非用词表和用词词表两种办法建立索引。其处理过程是,首先进行词频统计,然后用非用词表删除非用词,去掉高频词,建立用词词表,从而抽取用词,按字母排序生成词频索引。 概念描述 concept description 使用描述符描述概念,在研究计算机的归纳学习时,大量的研究是让学习系统具有从给定的例子或观察出发,使用一些转换规则,最后得到某个概念,无论是初始的例子还是经规则转换得到的中间结果以及最终的概念,都需要一定的符号表示,这些符号就是描述符。 概念描写 语义对立 semantic opposition 概念上的对立在词汇意义上的反映,包括义位的对立和义素的对立,前者如“冷”与“热”,“大”与“小”,后者如“简”与“牍”,“颈”与“项”。 语义范围 semantic coverage 某一词语的语义能够在一定范围内对其它词语产生词义影响,如“我们也去北京”中的“我们”和“北京”均在“也”的语义范围之内,都有可能称为该句的信息中心,产生歧义的表达。 语义连续统 semantic continuum 语义的连续性序列关系,如“冷”、“凉”、“温”和“热”这四个概念并没有一个离散的标准,而是一个连续的序列。 故事树 story tree 用来描述故事语法的树结构图,包括背景和各种情节,主要用于研究记忆和语篇理解。 焦点 focus 话语的关键部分,是交际过程中受话者注意力的所在,发话者详细描述的部分。 长时记忆 long term memory 1.理解一个句子所需的各种背景知识,这些知识是人们在长期的实践中逐渐积累起来的。2.短期记忆神经元经过反复刺激后,由于反馈作用存在,致使阀值下降至0,从而成为长期记忆。 自动记忆 automatic memory 系统自动地、自主地把相关信息保存起来。 拒识率 rejection rate 被拒识的输入模式的数量占被识别的所有输入模式的总数的百分比,是衡量模式识别系统性能的重要指标。 误识率 error rate 被误识的输入模式的数量占被识别的所有输入模式的总数的百分比,是衡量模式识别系统性能的重要指标。 聚类 clustering 把相关对象聚成集合体,用相似性尺度来衡量事物之间的亲疏程度,并以此来分类。 模式 pattern 用计算机或其他装置处理的物体、图象、语音、字符等信息形式。 子模式 subpattern 模式的组成部分,用一些比较简单的子模式组成多级结构来描述一个复杂的模式。 聚类中心 cluster centre 在聚类分析中的一个特殊样本,用来代表某一类,其他样本通过与它计算距离来决定是否属于该类。 群分析 模糊聚类 fuzzy clustering 利用模糊集理论进行聚类分析的过程。根据研究对象本身的属性来构造模糊矩阵,在此基础上根据一定的隶属度来确定分类关系。 模糊集 fuzzy set 一个集合,设X为全域,若A为X上取值 的一个函数,则A为模糊集。 参量学习 parameter learning 机器学习的一种方法,指学习程序通过对事物的识别经验,对其判别函数的多项式系数进行修改,从而提高其识别率。这种学习的结果体现在参量的修改上,故称参量学习。 先验概率 prior probability 根据训练集样本直接得出的概率,是后验概率的基础。 简单聚类 simple clustering 一种聚类分析,把所有样本直接按属于或不属于某类进行聚类。 特征向量 feature vector 在模式识别的特征空间中,每一个样本对应于一个向量,这个向量称作特征向量,特征向量具有若干个特征分量,表示被抽样物体的若干个特征。 特征矢量 逻辑连词 logical connectives 复合命题中用来连接两个命题,表达某种逻辑关系的联结词。 逻辑联结词 合取 conjunction 设P,Q为两命题,复合命题“P并且Q”称作P与Q的合取式,记作P∧Q,P与Q的合取表达的逻辑关系是P与Q两个命题同时成立。因而,自然语言中常用的联结词:和,不仅……而且……,虽然……但是……等,都可以符号化为∧。 析取 disjunction 设P,Q为两命题,复合命题“P或Q”称作P与Q的析取式,记作P∨Q,自然语言中的“或”具有二义性,有时表示相容性“或”,有时表示不相容性“或”。 复杂特征 complex features 对一个语言单位具有的语音、语法、语义、语用等各种必要信息所进行的多重性质的描述。 元语言 metalanguage 描述研究对象时使用的语言。可以是自然语言,也可以是人工语言。 多义性 polysemy 一个词项具有多种不同的意义。 一词多义现象 单义性 monosemy 一个词项只有一个意义。 歧义 ambiguity 语言的不同层面上存在的一对多的现象。 歧义排除 disambiguity 对语言不同层面上存在的一对多的现象,运用一定方法,选择其中一种最具可能的解释。 消歧、排歧 同形异义词 homograph 书写形式相同而意义不同的词。 语素变体 allomorph 同一语素在不同环境中的不同形式。 词素变体 模式匹配 pattern matching 将输入模式与样本相匹配的过程。 宽度优先策略 breadth-first strategy 在分析句子的过程中,每一个阶段都要先把处于同一平面上的所有节点可能具有的组合都产生出来,然后再做进一步归约的搜索方法。 广度优先策略 深度优先策略 depth-first strategy 在分析句子的过程中,总是循着一条路径,做垂直扩展,一直走到底,不到终了不回头的搜索方法。 语言工程 language engineering 开发、研制计算机识别、理解、生成人类语言系统的技术和领域。 成分结构 constutuent structure 词汇功能语法术语。是词汇功能语法中句法描写的一个平面,指语言的外部结构,表示句子成分的先后次序,是由一组短语结构规则映射而形成的树型结构。 功能结构 functional structure 词汇功能语法术语。是词汇功能语法中句法描写的一个平面,指语言的内部结构,表述各语言成分之间的关系,代表句子的语义。 功能描述 functional description 词汇功能语法术语。是成分结构向功能结构转换的中介,由一组等式构成,具有形式化的特点,可以很容易地进行计算机编码。 功能等式 functional equation 词汇功能语法术语。由它规定了单词所承载的语法信息的组合方法,在经过有穷步骤的运算之后,能够得到这些语法信息的最终组合结果——功能结构。 句法树 syntactic tree 用短语结构语法分析句子时,从起始符开始,运用短语结构规则一步步推导出句子的符号序列,描述这个推导过程的树形图叫句法树。 剖析树 parsing tree 描述计算机自动识别句子的各个句法单位以及它们之间相互关系的过程的树形图。 层级理论 stratificational theory 动词谓语与角色在语义组合上存在的先后次序和谓语动词一致关系标记的语法化序列存在的先后次序,层次高的谓语动词的组合先于层次低的谓语动词的组合。 带注释树 annotated tree 节点与节点之间的边上带有标记的树形图。 自顶向下剖析 top-down parsing 根据重写规则,从初始符号开始,自顶向下地进行搜索,构造推导树,一直分析到句子的结尾位置。这样的方法叫做自顶向下剖析法。 自顶向下分析 自底向上剖析 bottom-up parsing 从输入句子的句首开始顺次取词向前移进(shift)并根据文法的重写规则逐级向上归约(reduce),直到构造出表示句子结构的整个推导树为止。这样的方法叫做自底向上分析法。 自底向上分析 翻译工作站 translator's workstation 运用机器辅助系统为经常进行翻译和外语写作的人员提供一个半自动工作环境,以帮助翻译者提高工作效率。 翻译记忆 translation memory 通过自动记忆并使用先前人工翻译结果的方式来构建语言翻译知识系统的机器翻译方法。 人助机译 human aided machine translation 通过人在译前、译后参与编辑的方法或以人机交互方式参与的方法来提高译文质量的机器翻译。 确定性算法 deterministic algorithm 在分析过程中不需要进行回溯或并行,每一局部分析都将成为最终结果的分析方法。 等待观察析句法(Wait and See Parsing) 非确定性算法 nondeterministic algorithm 在分析过程中面对多种可能时需要进行回溯或并行、并不是每一局部分析都将成为最终结果的分析方法。 基于模式句法分析 pattern-based parsing 通过建立句子模型,进而采用模式匹配对句子结构进行分析的方法。 试探性句法分析 heuristic parsing 以试探性规则或过程的知识作分析向导的一种并行分析。 启发式句法分析 数据驱动句法分析 data-driven parser 从具体的数据出发,根据数据所提供的信息来控制操作流程的分析方法。 活性线图句法分析 active chart parser 基于活性线图的、自底向上和自顶向下相结合的句法分析。 词专家句法分析程序 word expert parser 根据单词之间的关系分析概念的一种自然语言理解的分析程序。在这样的程序中,语言学知识主要集中在单词本身,并把单词看作与解释过程(the process of interpretation)相关的语言学单位。 通用句法处理程序 general syntactic processor 美国计算语言学家Kaplan于1973年提出的用于形式描写、分析和生成自然语言符号串的系统,其基本数据结构是线图。简称GSP。 通用句法处理器 依尔利算法 Earley algorithm 美国计算语言学家Early于1970年提出的具有预测、扫描和完成三种功能的句法分析算法。 CYK算法 Cocke-Younger-Kasami algorithm 基于非活性线图的、以乔姆斯基范式为描述对象的并行句法分析算法。CYK算法是Cocke-Younger-Kasami算法的缩写。 LR算法 LR algorithm 由克努特(Knuth)于1965年提出的一种自底向上分析方法。根据分析栈的内容以及向前看k个输入串的符号决定分析动作的方法称为LR(k)算法。LR算法是k取不同值时的LR(k)算法的总称。 靠左推导 left most derivation 推导句子时,总是扩展重写规则右部(RHS)的第一个非终极符号的推导。 最左推导 靠右推导 right most derivation 推导句子时,总是扩展重写规则右部(RHS)的最后一个非终极符号的推导。 最右推导 有限状态转移网络 finite state transition network 是一种自动形态分析器。它由Q,V,T三部分组成:FSTN=(Q,V,T),其中 Q表示状态的有限的非空集合,V表示语言符号的有限的非空集合,T表示转移函数。简称FSTN。 递归转移网络 recursive transition network 在有限状态转移网络的基础上,根据语言符号的递归性而提出的一种识别器。简称RTN。它由一个或多个网络组成,其弧标识词、词类或语法类,其中语法类是另一个网络的名称,这造成了可递归的调用条件。 扩充转移网络 augmented transition network 按语法类组合在一起的结构模式,是一个由一个标号、一组状态和结点组成的网络。简称ATN。在RTN上增加一个寄存器,用于存放一系列的结果或全局状态;在其弧上附加一组测试和一组设置寄存器值的动作。 控制结构 control structure 在语言中,表示控制流程的一种句法模式。常用的控制结构有 if…then…else, while…do, repeat…until, and case. 重写规则 rewriting rules 生成语法的一类规则,形式为X→Y。箭头左边的符号代表单一的组构成分;箭头右边的符号代表一个或多个成分的语符列;箭头指示用Y取代(或“扩展”)X。这类规则习惯上读作“重写X为Y”。 产生式 产生式 production 运用符号变换规则“A→aA”来表示在某种条件下做某种动作的知识表达方法。 巴科斯-诺尔范式 Backus-Naur form (BNF) 以美国人巴科斯和丹麦人诺尔的名字命名的一种形式化的语法表示方法。它是一种典型的元语言,可以严格地表示语法规则,且描述的文法是上下文无关文法。 文摘 abstract 文献的摘要。摘要又称概要、内容提要。摘要是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。摘要应具有独立性和自明性,并且拥有与文献同等量的主要信息,即不阅读全文,就能获得必要的信息。 属性 attribute 指一个事物所具有的不可缺少的性质。 属性关系 attribute relation 指一个事物的各属性之间的内在联系。 自动标引 automatic indexing 使用计算机自动对文献赋予检索标识的技术。 分类标引 classed indexing 对文献按类别进行索引的技术。 组配标引 coordinate indexing 在主题标引过程中,将两个或两个以上的主题词按照一定的逻辑关系加以组织以表达文献主题的技术,叫做组配标引。组配标引是主题标引中准确揭示文献主题的一种基本的标引方法。 规范词表 controlled term list 列出首选的或允许使用的词的词表。 自由关键词 free keywords 反映一篇论文主题中新技术、新学科并且尚未被主题词表收录的、新产生的名词术语或在叙词表中找不到的词。 类属词 generic word 类属词是表示概念中类属关系的词。又称上下位词。类属词表示的概念必须是具有上下级层次的类属关系,既不能处在同等层次,也不能跨越几个层次,而必须是紧紧相连的上下层次。 层级关系 hierarchical relation 是一种语义关系,其中一个概念严格地从属于另一个概念,例如:属种关系。 主次关系 hypotaxis 传统语法分析的术语,指用从属连词连接的成分之间的关系。 文献编号 identification number 根据文献应该归入的类目确定的文献的代码。 识别号 identifying number 是某一信息资源的数字标识。一般情况下,一个特定的信息资源只有一个识别号,而一个识别号只代表一个特定的信息资源。 标识符 identifier 用于标识某个数据资源的标记,一般由字母和阿拉伯数字组成。 索引 index 是记录和指示文献事项或单元知识,按一定系统组织起来的检索工具。具体地说就是将图书、报刊等文献中的各种事物的名称,如书名或篇名、人名、地名等,分别摘录出来,注明其出处页码,按字顺或分类排列而成的一种检索工具。 标引 indexing 所谓标引,系指对文献和某些具有检索意义的特征如:研究对象,处理方法和实验设备等进行主题分析,并利用主题词表给出主题检索标识的过程。标引是检索的前提,没有正确的标引,也就不可能有正确的检索。 主题词 Subject Word 主题词一般是指从各学科的自然语言词汇中选出来、经过规范化的词,主要用作文献标示主题和检索之用。每篇文章的主题词可以从论文的题目或摘要中最能反映文章主题内容的词中选取,一般可以提出3~7个。 关键词 keyword 关键词是反映文章主题内容但未经规范化处理的名词和术语。 登录词 posting term 收录在计算机系统的词表中的词。 登录 record 列入;记载 加权标引 weighted indexing 采取统计文献的检索方法,通过给最能体现文献内容词以较高的权值来进行标引的方法。 数据库 data bank 长期储存在计算机内、按一定的数据模型组织、可共享的数据集合。 数据压缩 data packaging 采用特殊的编码方式来保存数据,使数据占用的存储空间比较少,这种技术称为数据压缩。 相关分析 correlation analysis 分析一个独立变量的变化对另一个相关变量的变化的影响程度的过程。 相关索引 correlative index 可引导读者找到更多的相关资料的索引。 查准率 precision 是信息检索等领域的一种系统性能测试指标,指检索到的正确的样例数与检索到的样例总数的比值。 查询 query 在检索系统中,用户对检索内容的提问。 主题检索 subject retrieval 主题检索是以某一主题为匹配原则来查找相关文章的信息检索方式,它是一种方便快捷的检索方式,它利用主题词进行检索,可以快速、准确地检索到所需要的文献,查准率高。 二叉树 binary tree 每个结点至多只有两棵子树的树结构。 子结点 child 树结构中当前结点的各个子树的根称为当前结点的子结点。 父结点 father 树结构中当前结点的上位结点称为当前结点的父结点。 兄弟结点 sibling 树结构中具有同一个父结点的结点称为兄弟结点。 子树 subtree 树结构中以某个结点n的子结点为根结点的树称为结点n的子树。 顶点 vertex 是数学图形中一种特殊的点,位置往往在两条或多条线或边的交接处。 布尔运算符 Boolean operator 在布尔代数中进行运算的符号,几个最基本的布尔运算是:与运算、或运算、非运算、补运算等。 气泡排序 bubble sort 排序方法的一种。其基本思想是逐次进行相邻两个记录的比较,不满足排序要求的则进行交换。 中文字符集 Chinese character set 中文字形的集合。主要作用是为汉字输入设备提供汉字的字形数据。 0型文法 type 0 grammar 0型文法的规则形如:u::=v,其中u,v为符号串,且u非空。0型文法的相应语言称为0型语言,又称为递归可枚举集合。0型语言是不可判定的。 1型文法 type 1 grammar 1型文法的规则形如:xUy::=xuy,其中U为非终结符号,x,y,u为符号串,且u非空。1型文法又称为上下文相关文法。1型文法是可判定的,但是现在没有找到有效的判定方法。 2型文法 type 2 grammar 2型文法的规则形如:U::=u,其中U是非终结符号,u是符号串。2型文法又称为上下文无关文法。一般的程序设计语言的语法都使用2型文法描述。2型文法是可判定的,且有有效的判定方法。 3型文法 type 3 grammar 文法规则的规则形如:U::=T或者U::=WT,其中U,W是非终结符号,T是终结符号。3型文法又称为正则文法,其语言也称为正则语言。 标记图 labelled graph 标记图是在每条边上加注了标记的图。 标准形式 standard form 对重复性事物和概念所做的统一规定的一种表达方式。 产生式语言 production language 是一种常用的知识表示语言。描述一个(或一些)事件的存在导致另一事件的产生。用符号方法表述如下: if A then B 或A?→?B 其中A称为前件;B称为后件;→表示由A为真导致B为真。 传递性 transitivity 是关系的一种属性。如果关系R 有传递性,若元素a和b之间有关系R,元素b和c之间有关系R,则 推断出元素a和c之间有关系R。在关系图中,有从a到b的弧,有从b到c的弧,则有从a到c的弧。 词性 part of speech 词的语法属性。 词型 type 词汇研究测量词汇密度时使用的术语。型-例子比例(type-token ratio)是在一个样篇样品中不同的词(型(type))的全部数目与实际出现的词(例(token))的全部数目的比率。 词例 token 词在文本中表现出的实例。词汇研究测量词汇密度时使用的术语。型-例子比例(type-token ratio)是在一个样篇样品中不同的词(型(type))的全部数目与实际出现的词(例(token))的全部数目的比率。 词形式 word form 一个单词的发音和原始拼写形式。一般单词的变形形式是由词干和附着在其上的一系列变形词缀组成的。 等价关系 equivalence relation 设R为定义在集合A上的一个关系,若R是自反的、对称的和传递的,则R为等价关系。 递归定义 recursive definition 为了描述问题的某一状态,必须用到它的上一状态,而描述上一状态,又必须用到它的上一状态,……。这种用自已来定义自己的方法,称为递归定义。 短语 phrase 语法分析术语,指单一的结构成分,一般包含不止一个词而又没有一般小句具有的主语-谓语结构。 对称关系 symmetric relation 对于集合A上的某种关系R,如果A中元素a1和A中元素a2有关系R,则a2与a1也有关系R,那么,集合A上的关系R是对称关系。 翻译程序 translator 将源语言翻译为目标语言的程序。 翻译模式 translation scheme 进行机器翻译时所采用的方式。 组合 compositionality 认为语言是由较小单位构成较大单位的一种观点。 基本运算 elementary operation 加、减、乘、除和取整运算中的一种。 链 chain 链是一种数据类型,数据对象实例的每个元素都放在单元或节点中进行描述,每个节点中有包括了与该节点相关的其他节点的位置信息。 链长 length of a chain 链表中所包含的单元或节点的个数。 流程图 flowchart 应用箭头和各种形状的方框表示控制的流程或事件进展的过程,使其直观、易懂的一种图形形式。 命题演算 proposition calculus 由命题与命题联结词构成的更复杂命题,以及这样构成的命题间的推理关系的运算。 模式识别 pattern recognition 所谓模式是指人认识具体事物或现象时,按照规定的相似性抽象出来的分类。所谓模式识别是指按模式抽象对事物或现象进行分类,辨识类的特征而做出判断的过程。模式识别是研究人类识别能力的数学模型,并借助于计算机技术实现对其模拟的科学。 内涵逻辑 intensional logic 应用内涵和外延算子将一个词项与它在上下文中的具体意义加以区别的一种逻辑。 派生 derivation 派生就是经过一系列的合乎逻辑的运算步骤,从一个结果到达另一个结果的过程。 派生树 derivation tree 派生过程中,各派生出来的对象所组成的层次化结构关系,称为派生树(或继承树)。 歧义文法 ambiguous grammar 所谓歧义就是一个字词串经过文法分析器后产生多个合格输出的现象,或者说歧义指的是同一句子可能有几个符合句法解释的现象。歧义文法是指同一语法形式可以表示多种语法意义。 二义性文法、含混文法 乔姆斯基文法 Chomsky grammar 以乔姆斯基为首的一些语言学家在50年代建立起来的一种形式语言理论体系,语言的文法被分成4种类型,即0型(短语文法)、Ⅰ型(上下文有关文法)、Ⅱ型(上下文无关文法)和Ⅲ型(正规文法)。 圈 cycle 若图中的一条路经,除了起点和终点相同外,其余的顶点均不相同,则称此路径为简单回路或圈。 全序集 total ordered set 设是集合A 上的二元关系,如果对于A中任意两个元素a, b,必有a b或b a,则称 是A上的全序关系(或线性次序关系)。若集合A具有全序关系 或R,则称A为全序集或线性次序集,记为(A, )或(A, R) 。 树 tree 生成语法采用的一种二维图形表示,能方便地显示由一组规则生成句子的内部层级结构。 范畴语言 categorial language 用范畴语法生成的语言。 算术表达式 arithmetic expression 算术表达式是由算术运算符和括号连接起来的式子。 算子文法 operator grammar 类似于依存文法、范畴文法以及数学逻辑中的谓词演算,它识别操作符,施事,受事并进行相应运算。 算子优先文法 operator precedence grammar 算子文法的一种,在每对终极符号之间必存在一种优先关系。 算子优先语言 operator precedence language 可由算子优先文法生成的语言,称为算子优先语言。 算子语言 operator language 算子定义语言是一个精简指令集,这些指令完整地定义了一个算子。 特征函数 characteristic function 一个集合的特征函数是二值函数。如果一个逻辑论述是集合的一个成分,则此时该集合的特征函数为真值,否则,若逻辑论述不属于集合,这特征函数为假。 http://ling.cass.cn/yingyong/resource/nlp500..html
个人分类: 双语信息处理|0 个评论
什么是语言科学的研究对象——“言本位”从根上解决问题
热度 4 geneculture 2012-4-6 04:24
什么是语言科学的研究对象——“言本位”从根上解决问题
什么是语言科学的研究对象* ——“言本位”从根上解决问题 作者:邹晓辉(Geneculture)** 1.提出问题 索绪尔曾明确指出:语言学完整而具体的对象是什么呢?这个问题尤其难回答;后面我们还会分析其原因;这里我们只是强调这种困难。其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察;但是语言学不是这样的。*** 索绪尔既然已经认识到:其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察。那他为什么不把语言学的研究对象往这个方向或这个层次上引导呢? 2.分析问题 笔者认为:索绪尔及其后续各个方面的继承者均在对普通语言学的研究对象的取值和确信两个方面迷失了进一步前进的方向。 笔者凭什么可以这样说呢?仅以索绪尔区分语言和言语这一对范畴并至今还得到各派语言学家的一致认可,就足以说明索绪尔在对普通语言学的研究对象的取值问题上所取得的具有里程碑意义的成就和贡献,但是,同时也说明学界在这个问题上再前进一步多么困难。 笔者发现其中至少存在以下两个重要原因: 其一,是英语等西方语言以及受其影响现代汉语的词均存在一个不同于古代汉语的特点,即:词兼有言和语双重属性。这就是在形式上造成语言学研究对象不明确的一个根本性原因。 其二,是不仅索绪尔创立的普通语言学而且乔姆斯基创立的形式语言学均未深入研究过汉语的特点,而这正是可克服西方语言学的基本研究对象不明确的一个非常有效的切入点。 为什么会这样呢?笔者发现西方语言学的价值判断和置信假设共同造成了该局面。 首先,他们在价值判断上排除了汉语研究可对西方语言学做出实质性贡献的机会。 进而,他们在置信假设上确信了汉语研究可与西方语言学的进一步发展没有关系。 也就是说,他们几乎忽略了语言的共性是离不开语言的个性而独立存在这一事实。 尤其必须指出的是:弗雷格和塔斯基所探讨的价值(真值)与索绪尔所探讨的价值(即从经济学引入的可判断语言实体功用或意义——价值)以及它们在确立词语的用法或语法的取值等涉及义项的选择和句子成分的选择的价值(取值)之间,既存在区别又存在联系。其难点在于纯粹形式上的取值与夹杂着内容的选择均与语言使用者的态度即置信程度挂钩。 3.提出进一步的问题 在普通语言学建立之初,由于索绪尔确信:(其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察;但是)语言学不是这样的。从而,导致普通语言学的研究对象长期仅限于语言和言语这两个层面,迄今为止的语言学乃至言语学(虽然暂时还没有此学说但是的确已有此探讨)发展几乎均未突破这两个研究对象的边界。 既然学界早已认识到科学工作的对象能否预先确定是同行之间是否能够合理分工并高效协作从不同的角度来考察或探索同一个研究对象的根本性问题,而且,经过百年探索之后至今还仍然是众说纷纭的这么一个仅有其外在建制而其内在建制仍未建立起来的学科,难道不应该从根上反思一下其问题所在吗?以往语言学界确信的研究对象,为何不能再换一个思路来进一步重新细分一下呢? 4.进一步分析该问题 首先,仅就价值判断而言,虽然索绪尔早已发现语言是一个价值系统,但是,他却未能把可从经济学引入语言学的价值与可从数学引入语言学的价值以及可从逻辑学和化学引入语言学的价值之间的相互关系理顺。这就是本文强调的第一个问题,即:取值问题。 本来早就可以沿着这条路径开辟出一条自然语言理解的间接形式化通途,但是,却由于学界在价值判断和置信假设两方面的错误一而再再而三地给耽误了,因为,学界确信了错误的判断和假设。于是,不仅迷失了语言科学进一步精准发展的研究对象,宏观上说就是混淆了语言符号形式与思想内容以及两者的物质载体乃至支配三者的序位关系四个“类”的界限,中观上说,是学科性质尤其是在学科交叉研究领域的划界时常出现张冠李戴的错误,微观上说,是学界至今仍未确立汉语的“言和语”这一可间接形式化处理与理解的方略在普通语言学和形式语言学中的地位。    接着,仅就置信假设而论,尽管弗雷格早就提出与价值判断密切相关的置信或确信的问题,但是,它却仅限于对真值判断问题以及间接引语置信问题的探讨。这正如前面所说,价值这个词语的用法或义项在不同领域或从不同学科背景来看具有不同的含义,因此,置信或确信什么?也就不能不影响取值。这就是本文强调的第二个问题,即:确信问题。 5.从根上解决问题 普通语言学的研究对象究竟是什么?或者说,什么是语言?它主要指什么?可否进一步区分为言和语?为什么不能在英语的言与汉语的言之间划等号?    索绪尔曾尝试性地回答了前面三个问号,他不仅区分了语言和言语,而且还指出了语言是一个价值系统,为学界系统分析其中音义结合的词素、单词、词组、句子等结构单位指出了方向。从而,开创了科学探讨语言学的先河。 汉语的情形很特殊,因为在文言中根本就没有印欧系语言的词素、单词、词组、句子那样的结构单位,只有偏旁部首、字、辞、链、块、读、句这样的结构单位。 白话文及现代汉语引入印欧系语言的结构单位造成了多次本位转移或本位之争,其中最典型的是马建忠、黎景熙、朱德熙和徐通锵教授等人提出的本位学说。 笔者提出“言”和“语”两个系列的细分价值系统,指出两者的区别在置信而联系却在取值。例如,如果假设英语的言是词(实质上词兼具言和语双重属性),汉语的言是字,那么,英语的语就是词组与句子,汉语的语则是字组1(即:辞、链、块)与字组2(即:读、句)。从普通语言学的基本研究对象“言”及其取值角度来看,说英语与说汉语的社团可视为对英语的言即词与汉语的言即字分别置信的社团。而从普通语言学的派生研究对象“语”及其取值角度看,说英语与说汉语的社团可视为对英语的语即词组与句和汉语的语即字组1(即:辞、链、块)与字组2(即:读、句)分别置信的社团。 这样,就可得到以英语与汉语为例的普通语言学研究的言和语两个系列的细分价值系统,即作为基本符号对象的普通语言学的基本研究对象“言”及如何取值与置信的细分价值系统;和作为符号组合解释的普通语言学的派生研究对象“语”及如何取值与置信的细分价值系统。 图1 言(Yan)和语(Yu)的关系 由图1可见以汉语为例的普通语言学研究可区分两类基本研究对象,然而,以英语(或其他印欧系语言)为例的普通语言学研究却必然遗漏文言的字这样的研究对象。 鉴于白话及现代汉语的词属引进的语言结构单位,故被纳入区别于字的另一类语言结构单位。在以汉语为例的普通语言学的研究对象之中,言具有基本结构单位的地位,简称:言本位。 采用“言本位”这种语言观,不仅可克服以汉语为例的普通语言学研究中其他几种本位说的错误、缺点或不足,而且还可为一种崭新的机译策略奠定语言理论基础,并且也可为语言学迈向语言科学进一步发展奠定形式化处理的基础。 因为,现代汉语必然传承古代汉语的精髓“言本位”,即使引入西方语言(混音节词)形式上混沌即兼具言和语双重属性的所谓“词本位”也掩盖不了汉语形式上清晰即言(单音节字)和语(双音节及多音节的字组)截然分明的本质特性。 参考文献 : 邹晓辉.语言的取值与置信——对语言学研究对象的哲学分析.“语言与价值”国际学术研讨会(2011北京师范大学)论文集,2011;文集双语版,牛津大学出版社,2012 注释 : * 本文是直接从《语言的取值与置信——对语言学研究对象的哲学分析》节选重组而成的短论。仅有极少数涉及文本文字和文体格式上的调适,论点、论据、论证等实质性内容和系统的语言表达风格均无改变。 ** 2000年至2005年邹晓辉由北京大学中文系徐通锵教授一步一步地带入以汉语为例的普通语言学基础研究领域,邹晓辉的研究重点是字与词的关系以及基于双语信息处理的汉语字与字组的计算机辅助分析。分别于2004-2011年期间参加新加坡、北京、青岛、厦门大学(注:此前会议仅是文章上了会议论文集);西班牙、上海、哈佛大学、加州伯克利大学的一系列学术交流,并且发表了相关研究成果,同期,还申请了着重于汉语形式化技术处理的发明专利(2010101752962)。 *** What is both the integral and concrete object of linguistics? The question is especially difficult; later we shall see why; here I wish merely to point up the difficulty. Other sciences work with objects that are given in advance and that can then be considered from different viewpoints; but not linguistics. 【 这一条答复,也可用于回答:科学网读者 】 “ 北大中文论坛 www.pkucn.com 汉语语言学 什么是语言科学的研究对象——“言本位”从根上解决问题 ” http://www.pkucn.com/viewthread.php?tid=277927page=1extra=page=1 (一贴出来不久也很快就有人留言) 原帖由 汝南 于 2012-4-6 09:18 发表 http://www.pkucn.com/images/common/back.gif    这个论文节选很好,想来是反映出了语学界动态的 。至于说论文针对“字本位”和“词本位”而 又新提出“言本位”,由于是第三方观点 ,就不便请教了。只想借此请问一下楼主,不知能否介绍一下 语言里“本位”到底是指 ... 邹晓辉Geneculture答复 如下: 语言学只有摆脱主观臆断的干扰,才能走上科学化道路 。 “本位”这个辞语有两个义项 ,其一由金融学的“金本位”截取并借用到语言学的“词本位”、“句本位”和“短语本位”;其二就是徐通锵教授的《语言论》以及《基础语言学教程》所述的汉语的基本结构单位,即: 字是汉语的基本结构单位,这样的说法被其弟子中对立的两派师生简称为“字本位”。 言,在形式上,就是:单音节字;在内容上,言的每一个义项 都是由双或多音节的语来同义并列地加以表述的。 因此,如果仅仅从内容上来看,它不仅与单音节的词素(即语素)而且也与单音节的词甚至还与独字句均有相似之处。所以,为了避免歧义,在言和语的关系这一问题的研究上,仅限于音节的数量形式这样的可区分标志。由此可见,无论是单音节的词素(即语素)、单音节的词、单音节的独字句,还是这三者的双或多音节的形式,以及双或多音节的词组或短语,都不可能独立充当:言,单音节的字。 因为,词素(即语素)、词、句,作为三个类,均在相同的概念之下可兼有言和语双重属性。只有双或多音节的词组或短语,仅仅属于语这个大类。同时,也只有单音节的字,仅仅属于言这个基础类。这样的表述是很明确且相当清晰的。 只有基于这样的可形式化的无歧义的表述,才有利于语言科学内在学科建设的进一步发展。只有摆脱主观臆断的干扰,才能走上科学化道路。 附录 : 字与词的义项分析 摘要:本文回顾了汉语研究的几次“本位”转换,认为这就是前辈在探寻汉语理论体系建构的逻辑起点。如果必须在字与词之间做出选择,那么,赵元任“字是中国人心目中的中心主题”的论断,以及徐通锵“‘词’不能代表‘字’而成为汉语的一种基本结构单位”的论断,都选择了字。而之前,其他人分别选择了词(马建忠1898)、句(黎锦熙1924)、词组(朱德熙1982)。这是为什么呢?难道赵、徐两位语言学教授都不懂字和词的常识性义项吗?显然不是。他们是根据学术直觉作出上述断言的。有没有可支持他们这种学术直觉背后的学术性义项呢?这是笔者提出的问题和思考。本文从宏观的类与微观的例两个层面多个角度,分析了字与词的学术性义项,发现常识性义项往往是造成非学术性争议的起因。本研究采用史论结合形式和学术分类方法,通过对“语”与“字”两个亚系统的二八分类,凸显了音节、字、言“迭交”的特点,得出了“汉语就是组字成语的典例系统”的论断。陆俭明、冯志伟都说如果字本位换成语素本位,也就不会有人再反对字本位了。因此,为避免字本位提法所引起的非学术之争,与其说字不如说言是汉语的基本结构单位,从而便于我们集中精力论述字素关系(周上之)、字词关系(潘文国)、字语关系即言和语的关系(邹晓辉)几组术语及其关系(这是字本位内部尝试统一认识的努力之一)。 关键词:普通语言学、形式信息学、汉语形式化、汉语研究的逻辑起点、字本位、言本位
个人分类: 语言学基础研究|8376 次阅读|9 个评论
《立委随笔: 语言学家是怎样炼成的》
热度 5 liwei999 2012-2-29 23:29
《立委科普: 语言学家是怎样炼成的》 我们知道,钢铁战士保尔柯察金是在残酷的革命斗争中炼成的。我要说:语言学家是在 瞎琢磨中炼成的。下面这个故事就是证明。 《立委说文解字:好,好不?》 语言现象中,有逻辑的成分,也有不逻辑的成分:约定俗成是语言的天则,只要语言共同体认可,逻辑不逻辑不是问题。前不久跟朋友聊天就聊到了这样一个现象。 朋友说:你是做NLP(自然语言处理)的,汉语是不是特别难做? 我说:亦难亦不难,要看谁做了。要是我全心去做,那就不难,=)连欧洲语言我都弄服帖了,到了母语我还不能驾轻就熟?(哈,一不留神,吹起牛来了:正做得上瘾呢,想不吹都难。) 朋友于是问:那比如汉语中不逻辑的现象。否定式当作肯定用,譬如 “好不高兴”实际上等价于“好高兴”,你怎么处理? 我笑道:这是个小 case 啦,记住,对于NLP,凡是可枚举的语言现象,统统不是问题(【 成语从来不是问题 】 ),因为电脑擅长的就是记忆,可枚举的现象全部扔进海量词典即可。具体到你说的这个现象也是如此。我们知道,程度副词(很/太/极/真/顶/忒/极为/非常 等)可以修饰形容词,它的否定式之一加上一个否定词“不”即可,这条规则是逻辑的,compositional 的语义叠加: 肯定式:程度副词 + 形容词 否定式:程度副词 + 不 + 形容词 如: 很高兴 / 很不高兴 非常漂亮 / 非常不漂亮 现在我们遇到了一个反例,就是作为程度副词的 “好” (顺便一提:“好”通常是形容词,但是在口语中也可以做程度副词用),其否定式 “好不” 不遵循上述规则,否定肯定说的都是一个意思(语言真地不讲道理,这肯定否定怎么能一样呢?没办法,语言这个monster本身就是不讲理的事儿,你最好服从,没法反抗)。怎么办呢?简单,就把它放到词典里面去,把“好不”作为“好”的同义词即可,用法是位于形容词前: 肯定式:好 + 形容词 = 好不 + 形容词 (这是所谓词典个性规则,因为这条规则是由两个具体的词“好”/“好不”驱动的) 好开心 = 好不开心 好漂亮 = 好不漂亮 好恶心 = 好不恶心 自以为得意,心想这样的问题太容易了,扔进词典标注清楚就完事:整个的文法规则系统一点儿也不要变动。汉语处理中确实有一批真正的难题(等以后找机会再另文专谈汉语分析的挑战性),但这种封闭类的现象不是。 本来此事就算了结了,我也顺手把“好不”加进了系统,问题似乎解决了。可是我这个人没什么其他爱好,没事就爱瞎琢磨语言。回答完朋友的问题后,一路还在顺着这个问题想。真所谓,天下本无事,就怕瞎琢磨。这一琢磨,问题来了。 上面这个对例外“好不”的解决方案原来还有例外,真是应验了那句老话:对于自然语言,可以说是无一条规则没有例外,无一条例外不是规则。这个例外发生在形容词“容易”前:虽然 好容易 = 好不容易,但是它们却不是肯定的语义:“好不容易见到你”,说的是不容易见到;“好容易见到你”,说的也是不容易。 怎么办呢?easy,记住:凡是个性的、可枚举的现象,对于电脑就不是问题。既然其他形容词与“好不”搭配都没有问题,只有“容易”才有问题,就把这种搭配放进词典不就完了吗: 否定式:好不容易 = 好容易 (语义结论:“容易”的否定式+强调语气) 兵来将挡,水来土囤。我几乎得意了自己的天才。 我于是把“好容易”/“好不容易”请进了词典,这事就这么过去了-- 直到昨天。昨天不知道是什么trigger的,我又鬼使神差地琢磨起来。天下本无事,就怕瞎琢磨。这一琢磨,问题又来了。原来, “好(不)容易” 并不那么容易,也不总是表示否定,如下面这个对比的句例: 否定式:好不容易(才)见到你 = 好容易(才)见到你 肯定式:这个问题好容易啊 ≠ 这个问题好不容易啊。 这是怎么回事呢?原来,“好容易” 有时候强调的是“不容易”,有时候却强调 “容易”。在表示“不容易”的时候,它等价于“好容易”:好容易见到你=好不容易见到你。但是,在表示“容易”的时候,其否定式“好不容易”却不再等价于其肯定式 “好容易”,而是遵从否定式的共同规则:“这个问题好容易啊” 说的是“容易”,而 “这个问题好不容易啊”,说的却是“不容易”(困难)。 怎么办?easy,可枚举现象只要人能分析清楚其用法的条件,扔进词典即可。具体说,这词典的相关个性规则就是: 1. 否定句型:好容易+VP(动词短语)= 好不容易+VP 2. 肯定句型:NP(名词短语)+ 好容易 3. 否定句型:NP + 好不容易 Wow,这么个破词折腾了这么大一圈儿。好在罗嗦是罗嗦,终于搞定了,也实现在正研发中的中文系统里。Everything works perfectly -- until now, at the time of writing this post: 瞎琢磨的毛病又犯了,这次想到的是与“好”有关的另一个个案现象,就是“好坏”,表述如下: “好” 的一个插曲是,当 “好” 遇到 “坏” 的时候(when a girl meets a boy),在通常的正反形容词并列结构的逻辑或意义之外,e.g【无论】好坏=好或坏;大小(=大还是小)【不是问题】,也一样有程度副词的语义,imagine 你要吃豆腐时你女友的娇嗔:你好坏! 电脑实现起来就是放进专家词典,其词典规则就是: 【“好坏”规则:(1)承继【“好”规则】,好坏=很坏:通常用作谓语;(2)形容词并列结构,常与连词【无论】等搭配,做主句的让步状语】 生命不息,瞎琢磨不止,如果你是语言学家。如果你读到这儿嫌烦了,你就做不了语言学家。这比真假马列主义的试金石还灵。如果你读此文津津有味,而你并不是语言学家,只能对你表达遗憾,本来是语言学家的材料,一定是年轻时不小心入错行了,错过了语言世界的大好风光。 突然想到:汉语怎么这么磨人啊,规则有例外,大例外里面还套着小例外?我们是 native speakers,可能不觉得,要是洋鬼子来学,他们会不会诅咒这个据说是博大精深的东方语言怪物啊?幸好,我们现在有电脑,电脑不懂得抱怨,只要你教它,它就永远记住,讨厌的例外反而是它的拿手好戏。 【后记】为避免“瞎琢磨”引起的误导,特说明如下。本文 所谓瞎琢磨,只是强调作为语言学家的语言敏感性。事实上瞎琢磨不仅不是工业开发的“正道”,而且可能引入歧途。笔者见过被语言学家 “过度开发” 的系统,其结果是低效率,系统没必要的庞杂,维护费用高,甚至不堪使用。系统开发的正道应该是数据制导(data-driven,怎样实施数据制导,里面很有讲究):由数据而不是拍脑袋来引导系统开发。 绝不能由着语言学家瞎琢磨的性子来 。正确的理解是,本文的 “瞎琢磨” 自嘲大于自夸,调侃在我们这些“迂腐”的语言学家身上常见到的执着和痴迷。实用系统的规则编制,一定要遵循投入产出的原则,不能事无巨细,面面俱到地穷举。做到这一点的一个办法就是利用机器学习把统计上最有价值的现象粗略筛选提供给语言学家,避免他们走入死胡同,做无用功或低效功。 [附:围脖的有关留言讨论] 鲁鹏一 :这不能依靠着人工穷举,而是需要有能够处理句法结构上的机器学习算法,如果有了这一个,才能在机器识别遇到困难时,再编辑规则。这样可以在大语料的基础上,保证规则的完整性和可行性// @算文解字 : 规则-专家词典,看上去是个简单有效的办法。但人工穷举,会不会出现低覆盖率的瓶颈?如果有,如何克服 (3月1日 18:25) 米拉宝鉴 :从规则系统角度看,低覆盖率的问题可以由共性规则去解决。专家词典是解决低准确率的问题。语言系统因此成为一个hierarchy。理论上,低覆盖率的问题可以由机器学习去做,这样一个规则与学习的混合系统,可以发挥规则的高精度的长处,也可以发挥学习高覆盖率的长处。实际做起来,这话就长了 (3月1日 21:21) 删除 | 回复 鲁鹏一 :回复 @米拉宝鉴 :求数据制导的方法或思路,这实际上是现在汉语语言处理的难点,如果能够机器识别句子的结构,确实就可以进行制导了。 (3月1日 21:07 ) 【置顶:立委科学网博客NLP博文一览(定期更新版)】 回复
个人分类: 立委科普|6788 次阅读|19 个评论
开此博,以资纪念
热度 3 ann70 2012-1-4 20:34
     在同学的介绍下,我在科学网上注册博客.     进此网,如沐春风,我找到了自己一直很想要的氛围.耄耋之年的学者激扬文字,辛勤笔耕;年轻的学者抒发自己的理想,交流心得;中年以上的老师们对后辈的不吝赐教,对生活无限热爱,让我找到回归的感觉.     我在泰斗们的博文中游弋,赞美与羡慕之情不可言表.     最让我感动的是王德华老师的文章,字里行间透出一个导师对工作的热爱,对学生的热爱,对生活的热爱.我申请加他为好友,也得到了他的批准.我想,他就是我的新导师.感谢王老师.     还有我的同学大海.他在自己的领域做出了瞩目的成绩,我为他自豪,也以他为学习的榜样.     语言学方面的同行尚且不多,我在此期待更多朋友的到来.
4677 次阅读|6 个评论
水文研究的另一番天地
hillside 2011-12-30 22:20
先来欣赏四篇论文的标题,其中三篇为期刊文章,一篇为博士论文。 1、《水文方位字研究及其对普通文字学研究的启发—兼论水文研究的必要性与方法论》,作者王元鹿,发表《湖州师范学院学报》, 2003,(02)。 2 、《“水文”中的数目字与干支字研究》,作者王元鹿,发表于华东师范大学学报(哲学社会科学版), 2003,(04) . 3、《从文字接触视角看汉字对水文的影响》,作者朱建军,发表于《贵州民族研究》, 2006,(03)。 4、 《水文造字机制研究》,本篇为华东师范大学博士论文,作者翟宜疆,2007 粗看之下,我还以为是水文学与语言学的交叉研究呢?细瞧之后才发现,此“水文”非彼“水文”,我权且将之称为“水文研究的另一番天地”。 比较起来,二者还是有一些共通处的,水文学研究的是数字,水(族)文研究的是文字。
个人分类: 水文科学|2778 次阅读|0 个评论
[转载]SSCI收录语言学学科期刊精选部分+刊物介绍
gothere 2011-12-18 15:38
2011 年 SSCI 收录语言学学科期刊 100 种 浙江工业大学图书馆信息咨询部编,博主修 ( 截止到 3 月 5 日 ) SOCIAL SCIENCES CITATION INDEX LINGUISTICS - JOURNAL LIST Total journals: 155 注:★为 SCI 、 SSCI 共同收录期刊 6 种 (其中 SCI 、 SSCI 、 AHCI 共同收录期刊 3 种) ▲ 为 SSCI 、 AHCI 共同收录期刊 117 种 1. ACROSS LANGUAGES AND CULTURES Semiannual ISSN: 1585-1923 ▲ 这个不错http://www.citeulike.org/journal/akiado-alc AKADEMIAI KIADO RT, PRIELLE K U 19, PO BOX 245,, BUDAPEST, HUNGARY, H-1117 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 6. ANNUAL REVIEW OF APPLIED LINGUISTICS Annual ISSN: 0267-1905 ▲ CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS, NEW YORK, USA, NY, 10013-2473 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 7. APPLIED LINGUISTICS Quarterly ISSN: 0142-6001 OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND, OX2 6DP 1. Social Sciences Citation Index 8. APPLIED PSYCHOLINGUISTICS Quarterly ISSN: 0142-7164 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS, NEW YORK, USA, NY, 10013-2473 1. Social Sciences Citation Index 9. AUSTRALIAN JOURNAL OF LINGUISTICS Semiannual ISSN: 0726-8602 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 10. BILINGUALISM-LANGUAGE AND COGNITION Tri-annual ISSN: 1366-7289 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS, NEW YORK, USA, NY, 10013-2473 1. Social Sciences Citation Index http://www.esaim-m2an.org/action/displayJournal?jid=BIL Bilingualism is an international peer-reviewed journal focusing on bilingualism from a cognitive science perspective. The aims of the journal are to promote research on the bilingual person and to encourage debate in the field. Areas covered include: bilingual language competence, perception and production, bilingual language acquisition in children and adults, neurolinguistics of bilingualism in normal and brain-damaged subjects, and non-linguistic cognitive processes in bilinguals. Bilingualism carries articles and research notes on all aspects of the bilingual person, and is published four times a year. 11. BRAIN AND LANGUAGE Monthly ISSN: 0093-934X ★ http://www.journals.elsevier.com/brain-and-language/ An interdisciplinary journal, Brain and Language focuses on the neurobiological mechanisms underlying human language. The journal covers the large variety of modern techniques in cognitive neuroscience, including lesion-based approaches as well as functional and structural brain imaging, electrophysiology, cellular and molecular neurobiology, genetics, and computational modeling. All articles must relate to human language and be relevant to an elaboration of its neurobiological basis. Along with an emphasis on neurobiology, journal articles are expected to take into account relevant data and theoretical perspectives from psychology and linguistics. ACADEMIC PRESS INC ELSEVIER SCIENCE, 525 B ST, STE 1900, SAN DIEGO, USA, CA, 92101-4495 1. Science Citation Index 2. Science Citation Index Expanded 3. Social Sciences Citation Index 14. CHILD LANGUAGE TEACHING THERAPY Tri-annual ISSN: 0265-6590 ▲ SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND, EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 17. COGNITIVE LINGUISTICS Quarterly ISSN: 0936-5907 ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index http://www.cogling.group.shef.ac.uk/ presents a forum for high-quality linguistic research on topics which investigate the interaction between language and cognition. We publish articles that focus on topics such as: the structural characteristics of natural language categorization (such as prototypicality, cognitive models, metaphor, and imagery) functional principles of lingusitic organization (such as iconicity) the conceptual interface between syntax and semantics the relationship between language and thought , including matters of universality and language specificity the experiential background of language-in-use, including the cultural background, the discourse context, and the psychological environment of linguistic performance 18. COMPUTATIONAL LINGUISTICS Quarterly ISSN: 0891-2017 ★ 这个刊物真的很难 MIT PRESS, 55 HAYWARD STREET, CAMBRIDGE, USA, MA, 02142 1. Science Citation Index 2. Science Citation Index Expanded 3. Social Sciences Citation Index 4. Arts Humanities Citation Index 19. COMPUTER ASSISTED LANGUAGE LEARNING Bimonthly ISSN: 0958-8221 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 20. CORPUS LINGUISTICS AND LINGUISTIC THEORY Semiannual ISSN: 1613-7027 ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index http://www.degruyter.de/journals/cllt/detail.cfm Corpus Linguistics and Linguistic Theory is a newly founded, peer-reviewed journal publishing high-quality original corpus-based research focusing on theoretically relevant issues in all core areas of linguistic research (phonology, morphology, syntax, semantics, pragmatics), or other recognized topic areas. It features: Papers that develop new corpus-linguistic methods or extensions of existing methods of interest in the context of linguistic theorizing; Papers that test or evaluate theoretical claims using corpus data and corpus-linguistic methods; Papers that offer systematic and detailed analyses of individual linguistic phenomena within a theoretical framework; Papers that compare corpus data to other kinds of empirical data, such as experimental or questionnaire data; Critical surveys of relevant areas of research; Squibs (short notes on theoretical issues, short reports of interesting data, or short replies to or rebuttals of previously published articles); 28. FOLIA LINGUISTICA Semiannual ISSN: 0165-4004 ▲ WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 29. FOLIA LINGUISTICA HISTORICA Annual ISSN: 0168-647X ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 31. FOREIGN LANGUAGE ANNALS Quarterly ISSN: 0015-718X WILEY-BLACKWELL PUBLISHING, INC, COMMERCE PLACE, 350 MAIN ST, MALDEN, USA, MA, 02148 1. Social Sciences Citation Index 32. FUNCTIONS OF LANGUAGE Semiannual ISSN: 0929-998X ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 38. INTERACTION STUDIES Tri-annual ISSN: 1572-0373 JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 39. INTERCULTURAL PRAGMATICS Quarterly ISSN: 1612-295X ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 40. INTERNATIONAL JOURNAL OF AMERICAN LINGUISTICS Quarterly ISSN: 0020-7071 ▲ UNIV CHICAGO PRESS, 1427 E 60TH ST, CHICAGO, USA, IL, 60637-2954 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 41. INTERNATIONAL JOURNAL OF BILINGUALISM Quarterly ISSN: 1367-0069 ▲ SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND, EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 42. INTERNATIONAL JOURNAL OF CORPUS LINGUISTICS Quarterly ISSN: 1384-6655 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 44. INTERNATIONAL JOURNAL OF LEXICOGRAPHY Quarterly ISSN: 0950-3846 ▲ OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND, OX2 6DP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index http://ijl.oxfordjournals.org/ The International Journal of Lexicography was launched in 1988 by EURALEX , the European Association for Lexicography. Interdisciplinary as well as international, it is concerned with all aspects of lexicography, including issues of design, compilation and use, and with dictionaries of all languages, though the chief focus is on dictionaries of the major European languages - monolingual and bilingual, synchronic and diachronic, pedagogical and encyclopedic. The Journal recognizes the vital role of lexicographical theory and research, and of developments in related fields such as computational linguistics, and welcomes contributions in these areas. IJL will include a regular feature on some practical aspect of dictionary-making and will publish, also on a regular basis, reviews of dictionaries and books reflecting the full range of the Journal's interests. 46. INTERPRETER AND TRANSLATOR TRAINER Semiannual ISSN: 1750-399X ▲ ST JEROME PUBLISHING, 2 MAPLE ROAD, WEST, BROOKLANDS, MANCHESTER, ENGLAND, M23 9HH 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 47. INTERPRETING Semiannual ISSN: 1384-6647 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 50. JOURNAL OF CHILD LANGUAGE Tri-annual ISSN: 0305-0009 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS, NEW YORK, USA, NY, 10013-2473 1. Social Sciences Citation Index 51. JOURNAL OF CHINESE LINGUISTICS Semiannual ISSN: 0091-3723 ▲ JOURNAL CHINESE LINGUISTICS, CHINESE UNIV HONG KONG, CENTRE EAST ASIAN STUDIES, SHATIN, NEW TERRITORIES, PEOPLES R CHINA, HONG KONG, 00000 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 54. JOURNAL OF EAST ASIAN LINGUISTICS Quarterly ISSN: 0925-8558 ▲ SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 55. JOURNAL OF ENGLISH LINGUISTICS Quarterly ISSN: 0075-4242 ▲ SAGE PUBLICATIONS INC, 2455 TELLER RD, THOUSAND OAKS, USA, CA, 91320 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 58. JOURNAL OF GERMANIC LINGUISTICS Quarterly ISSN: 1470-5427 ▲ CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND, CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 59. JOURNAL OF HISTORICAL PRAGMATICS Semiannual ISSN: 1566-5852 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 60. JOURNAL OF LANGUAGE AND POLITICS Tri-annual ISSN: 1569-2159 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 61. JOURNAL OF LANGUAGE AND SOCIAL PSYCHOLOGY Quarterly ISSN: 0261-927X 有趣SAGE PUBLICATIONS INC, 2455 TELLER RD, THOUSAND OAKS, USA, CA, 91320 1. Social Sciences Citation Index 62. JOURNAL OF LANGUAGE IDENTITY AND EDUCATION Quarterly ISSN: 1534-8458 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 63. JOURNAL OF LINGUISTIC ANTHROPOLOGY Semiannual ISSN: 1055-1360 ▲ WILEY-BLACKWELL PUBLISHING, INC, COMMERCE PLACE, 350 MAIN ST, MALDEN, USA, MA, 02148 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 64. JOURNAL OF LINGUISTICS Tri-annual ISSN: 0022-2267 ▲ CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS, NEW YORK, USA, NY, 10013-2473 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 65. JOURNAL OF MEMORY AND LANGUAGE Bimonthly ISSN: 0749-596X ★ ACADEMIC PRESS INC ELSEVIER SCIENCE, 525 B ST, STE 1900, SAN DIEGO, USA, CA, 92101-4495 1. Science Citation Index Expanded 2. Social Sciences Citation Index 66. JOURNAL OF MULTILINGUAL AND MULTICULTURAL DEVELOPMENT Bimonthly ISSN: 0143-4632 ▲ INFORMA HEALTHCARE, TELEPHONE HOUSE, 69-77 PAUL STREET, LONDON, ENGLAND, EC2A 4LQ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 67. JOURNAL OF NEUROLINGUISTICS Bimonthly ISSN: 0911-6044 ★ PERGAMON-ELSEVIER SCIENCE LTD, THE BOULEVARD, LANGFORD LANE, KIDLINGTON, OXFORD, ENGLAND, OX5 1GB 1. Science Citation Index Expanded 2. Social Sciences Citation Index http://www.journals.elsevier.com/journal-of-neurolinguistics/ The Journal of Neurolinguistics is an international forum for the integration of the neurosciences and language sciences. JNL provides for rapid publication of novel, peer-reviewed research into the interaction between language, communication and brain processes. The focus is on rigorous studies of an empirical or theoretical nature and which make an original contribution to our knowledge about the involvement of the nervous system in communication and its breakdowns. Contributions from neurology, communication disorders, linguistics, neuropsychology and cognitive science in general are welcome. Published articles will typically address issues relating some aspect of language or speech function to its neurological substrates with clear theoretical import. Interdisciplinary work on any aspect of the biological foundations of language and its disorders resulting from brain damage is encouraged. Studies of normal subjects, with clear reference to brain functions, are appropriate. Group-studies on well defined samples and case studies with well documented lesion or nervous system dysfunction are acceptable. The journal is open to empirical reports and review articles. Special issues on aspects of the relation between language and the structure and function of the nervous system are also welcome. 69. JOURNAL OF PIDGIN AND CREOLE LANGUAGES Semiannual ISSN: 0920-9034 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 70. JOURNAL OF POLITENESS RESEARCH-LANGUAGE BEHAVIOUR CULTURE Semiannual ISSN: 1612-5681 ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 71. JOURNAL OF PRAGMATICS Monthly ISSN: 0378-2166 ▲ ELSEVIER SCIENCE BV, PO BOX 211, AMSTERDAM, NETHERLANDS, 1000 AE 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 72. JOURNAL OF PSYCHOLINGUISTIC RESEARCH Bimonthly ISSN: 0090-6905 SPRINGER/PLENUM PUBLISHERS, 233 SPRING ST, NEW YORK, USA, NY, 10013 1. Social Sciences Citation Index 73. JOURNAL OF QUANTITATIVE LINGUISTICS Quarterly ISSN: 0929-6174 ▲ 《计量语言学》关注ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 74. JOURNAL OF SECOND LANGUAGE WRITING Quarterly ISSN: 1060-3743 PERGAMON-ELSEVIER SCIENCE LTD, THE BOULEVARD, LANGFORD LANE, KIDLINGTON, OXFORD, ENGLAND, OX5 1GB 1. Social Sciences Citation Index 75. JOURNAL OF SEMANTICS Quarterly ISSN: 0167-5133 ▲ OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND, OX2 6DP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index http://jos.oxfordjournals.org/ Journal of Semantics aims to be the premier journal in semantics. It covers all areas in the study of meaning, with a focus on formal and experimental methods. The Journal welcomes submissions on semantics, pragmatics, the syntax/semantics interface, cross-linguistic semantics, experimental studies of meaning (processing, acquisition, neurolinguistics), and semantically informed philosophy of language. 76. JOURNAL OF SOCIOLINGUISTICS Quarterly ISSN: 1360-6441 WILEY-BLACKWELL PUBLISHING, INC, COMMERCE PLACE, 350 MAIN ST, MALDEN, USA, MA, 02148 1. Social Sciences Citation Index 78. JOURNAL OF THE INTERNATIONAL PHONETIC ASSOCIATION Tri-annual ISSN: 0025-1003 ▲ 这个有空再说CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND, CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 79. LANGUAGE Quarterly ISSN: 0097-8507 ▲ LINGUISTIC SOC AMER, 1325 18TH ST NW, SUITE 211, WASHINGTON, USA, DC, 20036-6501 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 80. LANGUAGE COMMUNICATION Quarterly ISSN: 0271-5309 PERGAMON-ELSEVIER SCIENCE LTD, THE BOULEVARD, LANGFORD LANE, KIDLINGTON, OXFORD, ENGLAND, OX5 1GB 1. Social Sciences Citation Index 81. LANGUAGE ACQUISITION Quarterly ISSN: 1048-9223 ▲ PSYCHOLOGY PRESS, 27 CHURCH RD, HOVE, ENGLAND, EAST SUSSEX, BN3 2FA 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 82. LANGUAGE AND COGNITIVE PROCESSES Bimonthly ISSN: 0169-0965 PSYCHOLOGY PRESS, 27 CHURCH RD, HOVE, ENGLAND, EAST SUSSEX, BN3 2FA 1. Social Sciences Citation Index 83. LANGUAGE AND EDUCATION Bimonthly ISSN: 0950-0782 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 84. LANGUAGE AND INTERCULTURAL COMMUNICATION Quarterly ISSN: 1470-8477 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index http://www.tandf.co.uk/journals/rmli Language Intercultural Communication promotes an interdisciplinary understanding of the interplay between language and intercultural communication. It therefore welcomes research into intercultural communication, particularly where it explores the importance of linguistic aspects; and research into language, especially the learning of foreign languages, where it explores the importance of intercultural perspectives. The journal is alert to the implications for education, especially higher education, and for language learning and teaching. It is also receptive to research on the frontiers between languages and cultures, and on the implications of linguistic and intercultural issues for the world of work. The journal seeks to advance a perception of the intercultural dimension of language within a complex and pluralist view of the world. To this end, it seeks always to resist reductive and hegemonic interpretations, and is stimulated by contemporary, critical perspectives in understanding cultural practices and intercultural relationships. Its aspiration to promote an understanding of the position and politics of language(s) in intercultural communication is conceived as a contribution to personal development and to interpersonal understanding, dialogue and co-operation. The journal also seeks to make an effective contribution to disseminating new ideas and examples of good practice in educating students in language and intercultural communication. 85. LANGUAGE AND LINGUISTICS Quarterly ISSN: 1606-822X ▲ INST LINGUISTICS ACAD SINICA, NO 130, SEC 2, ACADEMIA RD, NANKANG, TAIPEI, TAIWAN, 11529 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 86. LANGUAGE AND LITERATURE Quarterly ISSN: 0963-9470 ▲ SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND, EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 87. LANGUAGE AND SPEECH Quarterly ISSN: 0023-8309 KINGSTON PRESS SERVICES LTD, 43, DERWENT RD, WHITTON TWICKENHAM, MIDDLESEX, ENGLAND, TW2 7HQ 1. Social Sciences Citation Index 88. LANGUAGE ASSESSMENT QUARTERLY Quarterly ISSN: 1543-4303 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 89. LANGUAGE AWARENESS Quarterly ISSN: 0965-8416 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 90. LANGUAGE CULTURE AND CURRICULUM Tri-annual ISSN: 0790-8318 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 91. LANGUAGE IN SOCIETY Bimonthly ISSN: 0047-4045 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS, NEW YORK, USA, NY, 10013-2473 1. Social Sciences Citation Index 92. LANGUAGE LEARNING Quarterly ISSN: 0023-8333 WILEY-BLACKWELL PUBLISHING, INC, COMMERCE PLACE, 350 MAIN ST, MALDEN, USA, MA, 02148 1. Social Sciences Citation Index 93. LANGUAGE LEARNING TECHNOLOGY Tri-annual ISSN: 1094-3501 UNIV HAWAII, NATL FOREIGN LANGUAGE RESOURCE CENTER, 1859 EAST WEST RD, 106, HONOLULU, USA, HI, 96822 1. Social Sciences Citation Index 94. LANGUAGE MATTERS Semiannual ISSN: 1022-8195 ▲ ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 95. LANGUAGE POLICY Quarterly ISSN: 1568-4555 ▲ SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 96. LANGUAGE PROBLEMS LANGUAGE PLANNING Tri-annual ISSN: 0272-2690 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 97. LANGUAGE SCIENCES Bimonthly ISSN: 0388-0001 ▲ ELSEVIER SCI LTD, THE BOULEVARD, LANGFORD LANE, KIDLINGTON, OXFORD, ENGLAND, OXON, OX5 1GB 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 98. LANGUAGE SPEECH AND HEARING SERVICES IN SCHOOLS Quarterly ISSN: 0161-1461 AMER SPEECH-LANGUAGE-HEARING ASSOC, 10801 ROCKVILLE PIKE, ROCKVILLE, USA, MD, 20852-3279 1. Social Sciences Citation Index 99. LANGUAGE TEACHING Quarterly ISSN: 0261-4448 ▲ CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND, CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 100. LANGUAGE TEACHING RESEARCH Quarterly ISSN: 1362-1688 SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND, EC1Y 1SP 1. Social Sciences Citation Index 101. LANGUAGE TESTING Quarterly ISSN: 0265-5322 ▲ SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND, EC1Y 1SP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 102. LANGUAGE VARIATION AND CHANGE Tri-annual ISSN: 0954-3945 ▲ CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND, CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 104. LINGUA Monthly ISSN: 0024-3841 ▲ ELSEVIER SCIENCE BV, PO BOX 211, AMSTERDAM, NETHERLANDS, 1000 AE 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 105. LINGUISTIC INQUIRY Quarterly ISSN: 0024-3892 ▲ MIT PRESS, 55 HAYWARD STREET, CAMBRIDGE, USA, MA, 02142 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 106. LINGUISTIC REVIEW Quarterly ISSN: 0167-6318 ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 108. LINGUISTICA URALICA Quarterly ISSN: 0868-4731 ▲ ESTONIAN ACADEMY PUBLISHERS, 6 KOHTU, TALLINN, ESTONIA, 10130 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 109. LINGUISTICS Bimonthly ISSN: 0024-3949 ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 110. LINGUISTICS AND PHILOSOPHY Bimonthly ISSN: 0165-0157 ▲ SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 111. LITERARY AND LINGUISTIC COMPUTING Quarterly ISSN: 0268-1145 ▲ OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD, ENGLAND, OX2 6DP 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 112. METAPHOR AND SYMBOL Quarterly ISSN: 1092-6488 ▲ LAWRENCE ERLBAUM ASSOC INC-TAYLOR FRANCIS, 325 CHESTNUT STREET, STE 800, PHILADELPHIA, USA, PA, 19106 1. Social Sciences Citation Index 2. Arts Humanities Citation Index http://www.tandf.co.uk/journals/titles/1092-6488.asp This innovative journal is dedicated to the study of figurative language and the cognitive processes behind it. By applying a variety of perspectives to their investigations, contributors provide a broad spectrum of unique and thought-provoking articles – theoretical essays, original empirical research, and literature and book reviews. Its international editorial board is composed of scholars and experts in linguistics, education, artificial intelligence, sociology, anthropology, philosophy, and psychology. This journal appeals to the broad range of scholars and researchers in the field of metaphor. 113. MIND LANGUAGE Quarterly ISSN: 0268-1064 WILEY-BLACKWELL PUBLISHING, INC, COMMERCE PLACE, 350 MAIN ST, MALDEN, USA, MA, 02148 1. Social Sciences Citation Index http://www.blackwellpublishing.com/journal.asp?ref=0268-1064 The phenomena of mind and language are currently studied by researchers in linguistics, philosophy, psychology, artificial intelligence, and cognitive anthropology. Mind Language brings this work together in a genuinely interdisciplinary way. Along with original articles, the journal publishes forums, survey articles and reviews, enabling researchers to keep up-to-date with developments in related disciplines as well as their own. 114. MODERN LANGUAGE JOURNAL Quarterly ISSN: 0026-7902 WILEY-BLACKWELL PUBLISHING, INC, COMMERCE PLACE, 350 MAIN ST, MALDEN, USA, MA, 02148 1. Social Sciences Citation Index 115. MULTILINGUA-JOURNAL OF CROSS-CULTURAL AND INTERLANGUAGE COMMUNICATION Quarterly ISSN: 0167-8507 ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 117. NATURAL LANGUAGE LINGUISTIC THEORY Quarterly ISSN: 0167-806X ▲ SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 118. NATURAL LANGUAGE ENGINEERING Quarterly ISSN: 1351-3249 ★ CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND, CB2 8RU 1. Science Citation Index Expanded 2. Social Sciences Citation Index 3. Arts Humanities Citation Index 119. NATURAL LANGUAGE SEMANTICS Quarterly ISSN: 0925-854X ▲ SPRINGER, VAN GODEWIJCKSTRAAT 30, DORDRECHT, NETHERLANDS, 3311 GZ 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 120. NORDIC JOURNAL OF LINGUISTICS Semiannual ISSN: 0332-5865 ▲ CAMBRIDGE UNIV PRESS, EDINBURGH BLDG, SHAFTESBURY RD, CAMBRIDGE, ENGLAND, CB2 8RU 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 126. PRAGMATICS Quarterly ISSN: 1018-2101 ▲ INT PRAGMATICS ASSOC- IPRA, IPRA SECRETARIAT, PO BOX 33, ANTWERP 11, ANTWERP, BELGIUM, B-2018 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 127. PRAGMATICS COGNITION Tri-annual ISSN: 0929-0907 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 130. RESEARCH ON LANGUAGE AND SOCIAL INTERACTION Quarterly ISSN: 0835-1813 ROUTLEDGE JOURNALS, TAYLOR FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON, ENGLAND, OXFORDSHIRE, OX14 4RN 1. Social Sciences Citation Index 137. SECOND LANGUAGE RESEARCH Quarterly ISSN: 0267-6583 SAGE PUBLICATIONS LTD, 1 OLIVERS YARD, 55 CITY ROAD, LONDON, ENGLAND, EC1Y 1SP 1. Social Sciences Citation Index 142. STUDIES IN LANGUAGE Quarterly ISSN: 0378-4177 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 143. STUDIES IN SECOND LANGUAGE ACQUISITION Quarterly ISSN: 0272-2631 CAMBRIDGE UNIV PRESS, 32 AVENUE OF THE AMERICAS, NEW YORK, USA, NY, 10013-2473 1. Social Sciences Citation Index 144. SYNTAX AND SEMANTICS Annual ISSN: 0092-4563 ▲ EMERALD GROUP PUBLISHING LIMITED, HOWARD HOUSE, WAGON LANE, BINGLEY, ENGLAND, W YORKSHIRE, BD16 1WA 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 145. SYSTEM Quarterly ISSN: 0346-251X ELSEVIER SCI LTD, THE BOULEVARD, LANGFORD LANE, KIDLINGTON, OXFORD, ENGLAND, OXON, OX5 1GB 1. Social Sciences Citation Index 146. TARGET-INTERNATIONAL JOURNAL OF TRANSLATION STUDIES Semiannual ISSN: 0924-1884 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 147. TERMINOLOGY Semiannual ISSN: 0929-9971 ▲ JOHN BENJAMINS PUBLISHING COMPANY, PO BOX 36224, AMSTERDAM, NETHERLANDS, 1020 ME 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 148. TESOL QUARTERLY Quarterly ISSN: 0039-8322 TESOL, 700 SOUTH WASHINGTON ST, STE 200, ALEXANDRIA, USA, VA, 22314 1. Social Sciences Citation Index 149. TEXT TALK Bimonthly ISSN: 1860-7330 ▲ MOUTON DE GRUYTER, GENTHINER STRASSE 13, BERLIN, GERMANY, 10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 150. THEORETICAL LINGUISTICS Tri-annual ISSN: 0301-4428 ▲ WALTER DE GRUYTER CO, GENTHINER STRASSE 13, BERLIN, GERMANY, D-10785 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 151. TRANSLATOR Semiannual ISSN: 1355-6509 ▲ ST JEROME PUBLISHING, 2 MAPLE ROAD, WEST, BROOKLANDS, MANCHESTER, ENGLAND, M23 9HH 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 152. VIAL-VIGO INTERNATIONAL JOURNAL OF APPLIED LINGUISTICS Annual ISSN: 1697-0381 ▲ UNIV VIGO, CAMPUS DE MARCOSENDE, SERVICIO PUBLICACIONES, VIGO, SPAIN, 36310 1. Social Sciences Citation Index 2. Arts Humanities Citation Index 153. WORLD ENGLISHES Quarterly ISSN: 0883-2919 ▲ WILEY-BLACKWELL PUBLISHING, INC, COMMERCE PLACE, 350 MAIN ST, MALDEN, USA, MA, 02148 1. Social Sciences Citation Index 2. Arts Humanities Citation Index
个人分类: Linguistics|4657 次阅读|0 个评论
对语言学研究对象的哲学分析(从形式上论:言和语的关系)
geneculture 2011-12-16 11:39
语言的取值与置信 —— 对语言学研究对象的哲学分析 * 邹晓辉 1,2 ,邹顺鹏 1 ** ( 1. 中国地质大学(北京)高等教育研究所; 2. 中美合作项目:塞尔研究双语信息处理课题组) qhkjy@yahoo.com.cn 摘要 :本文报告这么一项研究成果,即:在以印欧语言为例的普通语言学里不明确的研究对象,却由于笔者在学习以汉语为例的普通语言学基础研究中探寻如何解决汉语理论界分别坚持字词本位的两派学者之间的尖锐冲突难题的过程中,运用语言哲学的取值与置信的基本方法得到了较为满意的分析结果。具体地说,本文的目的是通过言本位的确立而解决汉语理论的字本位和词本位的冲突,其意义在于它不仅解决了汉语理论研究的一个基本问题,而且,还解决了普通语言学研究的一个根本问题。本文的研究方法是在以汉语为例的普通语言学基础理论研究中采用语言哲学的价值判断与置信假设相结合的分析方法。 关键词 :语言哲学;置信;普通语言学;取值   Value-Taking and Confidence-Building as Language Using -- Philosophy Analysis on the Object of Study in Linguistics ZOU Xiaohui 1,2 , ZOU Shunpeng 1 (1. China University of Geosciences (Beijing) Institute of Higher Education; 2. SINO-US Project: Searle Research of Bilingual Information Processing Research Group) qhkjy@yahoo.com.cn Abstract : In this paper the authors report such a research result, namely: the unclear object of study in General Linguistics, which takes the Indo-European languages as examples, yields more satisfactory results through using basic methods of value-choosing and confidence-building as language using in philosophy of language by the authors’ fundamental research in general linguistics taking Chinese language as an example, particularly in exploring how to solve the sharp conflict between two schools of scholars among workers, who adhere to Zi-based linguist theory and Ci-based linguist theory respectively. Specifically, the purpose of this paper is to solve the conflict between both Zi-based view and Ci-based view by using the basic unit of Chinese theory. The significance of our paper lies not only in solving the fundamental problem in theory research of Chinese, but also in general linguistics. The research methods are combined by the methods of assumptions for the value-choosing and methods affected by the belief of language user in philosophy of language, which are reflected in the authors’ fundamental research in general linguistics taking Chinese language as an example . Key words : Philosophy of Language; Confidence-Building; General Linguistics; Value-Taking * INTERNATIONAL CONFERENCE ON LANGUAGE AND VALUE ( Sponsors : Research Center for Value and Culture, BNU ; State Innovation Base for Philosophy and Social Sciences ) ** 作者简介 :邹晓辉,( 1958- ),男,研究员,双语信息处理:协同智能计算系统 通信联系人 :邹顺鹏,( 1986- ),男,研究生,基于知识本体的高校学科建设 . E-mail: qhkjy@yahoo.com.cn 全文: 邹晓辉:语言的取值与置信.pdf
个人分类: Philosophy of Language|18 次阅读|0 个评论
[转载]简议语义预设及其特征
houerfei 2011-12-5 16:00
【摘要】在语言学的研究中,预设是一个常常被提及的概念。一般说来,预设可以被分为语义预设和语用预设。语义预设是句子之间的语义关系,研究语句的真值情况。本文概述了预设这一概念的提出和语义预设的概念,并分析了其特征及分类。 【关键词】语义预设;特征;分类 作为语言学中一个重要分支,语用学“研究某一语言的言者如何使用句子成功地进行交际” 84。预presupposition),也称前提、前设、先设,是语言学中一个重要概念。这一概念具有“较大的可塑性” 66,不同语言学家对其理解和定义也不尽相同。然而,语言学家普遍认为,预设这一概念“至少体现出两种不同层次上的关系:语言体系内句子构成成分间的关系和言语过程中说话人与语句的关系” 211。与之相对应,预设可以被划分为两种类型:语义预设(semantic presupposition)和语用预设(pragmatic presupposition)。前者属于语义学的研究范畴,后者属于语用学的研究范畴。 一、预设概念的提出与发展 预设这一概念最初出现在哲学领域, 最早由德国著名哲学家、数学家,现代逻辑学奠基人之一Gottlob Frege(1848-1925)提出的。Frege的预设理论可以概况如下:“(1)指称短语和(例如)时间分句均有所指,因此具有前提;(2)一句句子和它的否定形式具有同样的前提;(3)句子或声言,不论真实或谬误,其前提必须成立。”二十世纪六七十年代,预设这一概念引起了语言学家的注意。而语言学家对预设的关注,首先开始于对语义关系的研究。于是他们从语句的意义或命题的真假值这一角度,提出语义预设的概念。1973 年后,逐渐兴起的语用学又为预设的研究提供了新的视角,进而语言学家提出语用预设的概念。 二、语义预设的概念 语义预设是两个句子或命题之间的一种语义关系,它“依附于语言的表层结构,是句子意义得以形成的基础,其根本特征是无论在什么样的言语行为中,句子本身及其预设应是恒定的” 211。语义预设的概念建立在句子真假值的基础之上,和句子本身的意义有着密切的关系。 当命题a 和命题b 同时满足以下三个条件关系: 如果a 为真,则b 为真; 如果a 为假,b 仍为真; 如果b 为假,则a 不存在真值或假值的问题,即a 是不可能存在的命题。 此时,命题b 是命题a 的预设;换言之,命题a 预设命题b。 例如: a. His brother is a marketing manager. b. He has a brother. 显而易见,当a 为真时,b 也为真; a’. His brother isn’t a marketing manager.(a 的否定形式) b. He has a brother. 由此可见,当a 为假,b 依然为真; a. His brother is a marketing manager. b’.He doesn’t have a brother.(b 的否定形式) 由此可见,在b 为假的情况下,a 中的“his brother”就没有了所指,因此句子a 也就没有真值可言,即a 是不可能存在的命题。从上面的例子中可以看出,句子b 是句子a 的预设,或者说,句子a 预设句子b。 和传统的标准逻辑不同,语义预设不是二值逻辑(只有真、假两个值),而属于三值逻辑(即有真值、假值和无意义三个值)。 三、语义预设的特征 作为“语言内部语义关系的一种本质属性” 69,语义预设具有以下几个方面的特征: 1.语义预设“受到人们普遍接受的逻辑规律的限制” 161,因此对于句子或命题的语义预设分析,“仅仅是根据逻辑和语法来考察” 119 的。例如: a. The movie I watched yesterday is amusing. b. I watched a movie yesterday. 根据“人们普遍接受的逻辑语义” 148,很容易看出,这两个句子中句子a 以句子b 为预设。 2.“如果句中没有名词或者确定描述没有所指(即预设为假)时,整个句子没有真值可言。” 119 也就是说,“ 语义预设 是语句获得真值的必要条件” 66,如果语义预设是假的,那么语句就没有真值假值可言,就变得毫无意义了。 例如: The king of the United States is kind-hearted. 在这个句子中,“the king of the United States”没有所指,即语义预设得不到满足,于是整个句子没有意义。 3.语义预设具有稳定性。 语义预设的稳定性是指,“对语句加以否定或提出提问不仅不会否定或怀疑‘预设’,反而更加说明‘预设’为真” 66-67。 例如: a.The movie that Tim watched yesterday is amusing. b.The movie that Tim watched yesterday isn’t amusing. c.Is the movie that Tim watched yesterday amusing? d.Where did Tim watch the movie yesterday? e.Tim watched a movie. 以上五个句子中,句子a 的预设为句子e;对句子a 进行否定,得到句子b,其预设仍为句子e;对句子a 提出疑问,得到一般疑问句c和特殊疑问句d,且句子c 和d 的预设仍为句子e。 4.语义预设具有可变性。 语义预设的可变性是指,语义预设“会受到语句焦点的影响” 149,随着焦点的变化而变化。通常情况下,英语句子的语调核心位于句子中最后一个重读音节上。但有时为了突出强调句中的某一成分,会把语调核心转移到这个所要强调的成分上,显示出对比,达到强调的效果。例如: a.'Ben broke the valuable vase. b.Ben 'broke the valuable vase. c.Ben broke the 'valuable vase. d.Ben broke the valuable 'vase. (符号“ ' ”表示该词在句中的重读) 句子a 的焦点在Ben 上,预设是交际双方都知道有人打破了一个名贵的花瓶,但是受话人不知道是谁打破的,于是发话人以Ben 为焦点,告诉对方名贵的花瓶是Ben 打破的。 句子b 的焦点在broke 上,预设是交际双方都知道Ben 对一个名贵的花瓶做了某些事情,但是受话人不知道Ben 的具体行为,于是发话人以broke 为焦点,告诉对方Ben 把名贵的花瓶打破了。 句子c 的焦点在valuable 上,预设是交际双方都知道Ben 打破了花瓶, 但是受话人不知道Ben 打破的是怎样的花瓶, 于是发话人以valuable 为焦点,告诉对方Ben 所打破的花瓶是名贵的。 句子d 的焦点在vase 上, 预设是交际双方都知道Ben 打破了一件名贵的东西,但是受话人不知道那件名贵的东西究竟是什么,于是发话人以vase 为焦点,告诉对方Ben 打破的是一只名贵的花瓶。 在这里需要强调一点,以上所说的随着语句焦点的变化预设也发生变化,指的是通过“移动句子的语调核心” 296 使得句中的某一成分得到凸显和强调,从而使得预设有所改变。也就是说,预设的产生和改变是建立在使用音系手段的基础之上的。事实上,预设能够在音系、句法和语义这三个不同的语言层次上产生。因此,除了使用音系手段外,我们也可以使用句法和音系相结合的手段使得预设有所改变。如: It was 'Ben who broke the valuable vase. What did Ben do with the valuable vase is that he 'broke it. The vase that Ben broke is a 'valuable one. It is a valuable 'vase that Ben broke. 显然,尽管使用的方法不同,所达到的效果是一致的,即都使预设发生了改变。 四、语义预设的分类 语义预设可以分为两类:命题性预设和非命题性预设。“存在于两个命题之间的预设关系为命题性预设;存在于命题与非命题之间的预设关系为非命题性预设。” 67 换言之,陈述句与其预设之间的关系是命题性的,而疑问句、祈使句和感叹句与其预设之间的关系是非命题性的。 例如: a.The novel that you borrowed from the library is interesting. b.The novel that you borrowed from the library isn’t interesting. c.Is the novel that you borrowed from the library interesting? d.When did you borrow the novel from the library? e.Please return the novel that you borrowed from the library as soonas possible. f.You borrowed a book from the library. 以上句子中,句子a、b、c、d、e 都是以句子f 为预设的。然而陈述句a、b 与f 之间的预设关系是命题性预设,而一般疑问句c、特殊疑问句d、祈使句e 与f 之间的预设关系是非命题性预设。 五、结语 本文简述了预设这一概念的提出及其哲学渊源,分析了语义预设的概念及其特征。作为两个句子或命题之间的一种语义关系,语义预设受到人们普遍接受的逻辑规律的限制,具有稳定性和可变性,同时当句中没有名词或者确定描述没有所指时, 整个句子无真值可言,也就无意义。 本文并未对语义预设和语用预设的区分问题进行深入探讨。事实上,在这一问题上,语言学界一直存在着分歧,语言学家仍无法准确区分语义预设和语用预设的界限,正如Jean Stilwell Peccei 指出的那样,“语义预设和语用预设的界定是模糊不清的(fuzzy)” 19。因此这一问题还有待我们进行进一步的研究和探索 【参考文献】 [1]戴炜栋、何兆熊. 新编简明英语语言学教程 .上海:上海外语教育出版社,2002. [2]俞如珍、语义预设、语用预设和会话含义 .重庆:四川外语学院学报,1996,(1):66-70. [3]郭聿楷、何英玉.语义学概论 .北京:外语教学与研究出版社,2002. [4]何兆熊、新编语用学概要 .上海:上海外语教育出版社,2000. [5]范晓,陈忠.预设和蕴含 .信阳:信阳师范学院学报,2002,22(5):68-73. [6]汪大昌、普通语言学纲要 .北京:北京大学出版社,2004. [7]杨年保、语义预设与语用预设研究 .岳阳:云梦学刊,2005,26(3):119-121. [8]何自然、语用学概论 .长沙:湖南教育出版社,1988. [9]Jean Stilwell Peccei. Pragmatics .Beijing: Foreign Language Teaching and Research Press, London and New York:Rountledge,2000. 作者简介:宋瑶(1983—),女,满族,河南省郑州市人,杭州电子科技大学外国语学院硕士研究生在读,研究方向:外国语言学及应用语言学。
2078 次阅读|0 个评论
香港理工大学 现招招语言学、计算语言学博士 DALS
successful 2011-11-30 10:41
香港理工大学 现招招语言学、计算语言学博士 Doctor of Applied Language Sciences 1.学制: 3 年full time 或 5年part time 2.学费:28.8 万港币 (约23.547万人民币) 3. “ We also offer scholarships exclusively to outstanding students with excellent academic merits, teaching assistantship to qualified candidates, as well as partial tuition waiver to eligible students. ” 咨询:fh.enquiry@polyu.edu.hk http://www.polyu.edu.hk/FH/DALS/
1128 次阅读|0 个评论
从学习“字本位”到探索“言本位”明确了广义形式语言学研究对象
geneculture 2011-11-23 23:26
言和语及其关系为何是广义形式语言学的研究对象? 广义形式语言学是一门以言和语及其关系为研究对象的学问。其特点在于:言是单音节的形式,语是双音节和一些列的多音节的形式。两者之间的关系是基本符号形式体系与派生符号形式体系之间的关系。广义形式又叫广义文本。 附录1:广义形式语言学研究对象——言和语的关系 关键是的确可在形式上对言和语逐一做到精准地测序定位。 http://bbs.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=503886 言和语的形式与言义和语义的内涵或内容之间存在:反变关系 http://bbs.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=510906 分享 中文形式化前后的几组关系和间接形式化的数理基础和汉语示例 分享 可用世界上最简单的语言非常严谨地论证:意≠义 意义≠意+义 分享 两人都在索绪尔“语言”与“言语”区别理论基础之上进了一步... 融智学导论:言本位与双语信息处理(第三稿) http://bbs.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=488238 附录2:言本位提出之前所做的典型实例:由“一字精解”到“字字精解” 字本位与中文信息处理的基础 ——解析“字与字组的关系”探索“汉语形式化”新路 (典型实例:由“一字精解”到“字字精解”) 邹晓辉 著 http://bbs.sciencenet.cn/forum.php?mod=viewthreadtid=1299 字本位与汉语形式化 (本章全文超级连接) (作者:广东珠海 邹晓辉 )《 字本位理论与应用研究 ( 全书总目录超级连接 ) 》第 252-284 页 http://survivor99.com/pscience/2008_4jidu/zxh_paper_18.htm 探索汉语理论建设及中文信息处理的新路 The New Way on Grope for Chinese Theory Constructing and Chinese Information Processing 邹晓辉 * ( 北京大学国内访问学者; ) 摘要 : 本文介绍《字本位与中文信息处理的基础》 贡献的十个知识创新点,即:信息和智的本质定义及基本分类,汉语及中文的基本原理,认知心理学双语协同存储原理,形式理论的受限原理,序位逻辑原理及工具,语言和知识的通用计算方法和量具,生产式教学及协同智能训练体系,(产、学、研、教、用、算)一体化(知识信息数据)管理。其重要性不仅在于指出自然语言与机器语言的互换路径,除直接形式化之外还有间接形式化道路,对汉语形式理论建设和中文信息处理及基于中文的知识处理而言,后者更便捷而高效,而且还在于改变科学研究思路的十个知识创新点具有的整体功用。 关键词 : 汉语形式理论,中文信息处理,基于中文的知识处理,融智学的十个知识创新点 邹晓辉 . 探索汉语理论建设及中文信息处理的新路 . . 中国科技论文在线, http://www.paper.edu.cn/index.php/default/releasepaper/content/200708-255 Zou XiaoHui* ( qhkjy ( zhuhai ) ) Abstract : The paper introduces the Points of Knowledge Inaugurated on the contribution of 《 Groundwork of Zi BenWei and Chinese Information Processing 》 ,namely: the Definiens and Taxonomy of Information, and that of Intelligence, the Rationale on Chinese, the Principle of Memory Coordinated Bilingually in Cognitive Psychology, the Principle Restricted on the Formal Theory, the Principle on Logic with Bit-List Tool, the Universal Arithmetic and Measure for language and knowledge, the Producing Teaching cooperated with the training system as Man-Com-Net, the Integrative Management (of knowledge, information and data).Its fundamentality is not only that Indirect Formalization is much better than Direct One for Chinese Formal Theory and Chinese Information Processing along with Knowledge Management Based on Chinese, since the way of the Indirect Formalization discovered except the path of Direct Formalization especially on the path interchanging from Natural Language to Machine Language, or vice versa, but also that there is a macro using for the influence on thinking of science research with the points of knowledge inaugurated. Keywords : Chinese Formal Theory, Chinese Information Processing, Knowledge Management Based on Chinese, the Points of Knowledge Inaugurated on Man-Com-Net 下载 PDF 阅读器 PDF 全文下载: 初稿( 266 ) 作者简介: http://www.paper.edu.cn/paper.php?serial_number=200708-255 字本位与中文信息处理 ——解析“字与字组的关系”探索“汉语形式化”新路 (典型实例:由“一字精解”到“字字精解”) 邹晓辉 http://survivor99.com/entropy/2006entropy/3-4/2006-4-8.htm 【摘要】本文是笔者探索汉语及中文形式化信息处理新方法的总结。英语和基于英语的形式化方法及其好处学界周知,转换生成语法及其后续的各派理论的发展早已为计算机科学和计算语言学普遍接受或了解。模仿它们的汉语词本位、短语本位和句本位理论违背了汉语的特点。因为“汉语中没有词”(赵元任)。“这种跟着西方人思路转的研究是无法实现赶超国际水平的目标的”(徐通锵)。英语形式化方法突破不了中文信息处理的技术瓶颈。如:词的“切分”与“标注”就面临“消歧”难题(俞士汶、孙茂松、黄河燕等)。本项研究课题“摆脱了流行思路的束缚,以字本位理论为基础研究中文信息处理的问题,探索形式化新路。这抓住了汉语特点的关键”(徐通锵),因为“字是中国人心目中的中心主题”(赵元任)。 【关键词】基础语言学,字本位,计算语言学,形式化,计算机辅助,中文信息处理 【专家评语】 这是一个前沿性的课题。现在语言信息处理的思路大多受国外语言理论的影响,而如何根据汉语的特点,运用信息科学的技术,进行中文信息处理,赶超国际水平,是我们急需探索和解决的一个重大课题。方向正确,思路清楚,立论有据,是有原创性的新著,其形式化的研究成果也具有广泛的使用价值。 语言学专家:徐通锵(北京大学中文系教授) 全国普通高等学校人文社会科学研究十五规划纲要 语言学 咨询组负责人 字本位与中文信息处理的基础——解析“字与字组的关系”探索“汉语形式化”新路是作者经过长期深入研究和在计算机上通过实践检验的重大科研成果。这个成果的理论意义和实用价值在于:根据汉语的实际特点,运用信息科学先进技术从事中文信息处理,赶超国际水平。 计算语言学专家:鲁川(教育部语言文字应用研究所研究员) 中国中文信息学会计算语言学专业委员会(首届)主任 它较好地实现了与国际学术研究的接轨,因而处于国内同类课题研究的先进水平;作者倡导的融智学新范式和协同智能概念体系,不仅对于我国语言科学和信息科学及其相关学科的研究具有重要的学术探索价值,而且对于建立面向多文种语言信息处理的计算语言数据库和开发拥有自主知识产权的信息产品具有广泛的实际应用价值。 机器翻译专家:易绵竹(解放军外国语学院教授) 国防语言文化研究所所长 兼 计算语言学教研室主任 语言的形成是一个十分复杂的过程,语言所表达的语义的解析更是一个复杂的问题。本书作者通过对中文语言文字的长期研究,积累了丰富的知识,提出了许多有见地的观点。本文提出了以字为中心,从字出发分析中文语义的一种新的方法。这些思想对于中文信息的自动化处理都提供了一种新的途径。 计算机科学专家:奚建清(华南工业大学计算机科学与工程学院,软件学院教授) 兼任 广东省软件重大专项专家组组长 内容新颖,有较高学术水平,…。消解歧义是自然语言处理的关键,本文提出的理论和方法,可以对于这个问题的解决提供新的思路。 自然语言处理专家:冯志伟(教育部语言文字应用研究所研究员) 曾 师从国际计算语言学委员会主席(B.Vauquois)教授专门研究数理语言学和机器翻译问题 协同智能计算语言数据库的设计方案中的13张表很有新意。如果对于汉语的这13张表一旦建立了起来,那么汉语分析中的各个层次上的歧义就会比较容易地解决。这是一件有创建性的工作 中文信息处理专家:苑春法(清华大学计算机系教授) 智能技术与系统国家重点实验室 专家 引言 长期以来,我们一直缺乏适合汉语及中文自身特点的系统化的语法理论,这严重地制约了中文信息处理的研究进展。《语言论——语义型语言的结构原理和研究方法》(1997徐通锵)和《基础语言学教程》(2001徐通锵)独树一帜建立了汉语“字本位”理论。本文在此基础之上做了进一步的基础性研究,在尝试对字与字组及其各种关系进行形式化描述的同时,也尝试对汉语及中文信息处理的形式化方法进行大胆创新。 由本文的标题和副标题可知,“字与字组的关系”的探讨是汉语“字本位”理论关注的基础性问题(属于基础语言学领域);“汉语形式化”是中文信息处理实践面临的根本性问题(属于计算语言学领域)。两方面结合导致本论题。本文的缘起:北大中文系语言学专家对字的认识分歧(至今尚未达成普遍一致的共识)。试问:作为自然人的专家尚且无法消除的分歧,怎么让计算机系统去重用?这类性质的难题也是主张强人工智能观点的中文信息处理专家们所面临的棘手问题。如,中科院计算机语言工程研究中心机译专家就说:对机器翻译而言,只有一个难题,就是消歧。清华大学计算机系自然语言处理课题组专家也明确地指出汉语在“分词”与“标注”上存在技术瓶颈。北大计算语言学研究所专家还十分明确地指出(汉语及中文的)形式化非常困难。中国社科院语言学研究所机译专家公开指出语言学理论滞后制约了中文信息处理技术的发展。 同样研究自然语言,不同的学科有不同的视角,普通语言学站在人类智能主体的立场,采用的是自然人的视角;计算语言学站在人工智能代理的立场,采用的是计算机的视角;工程融智学站在协同智能计算系统的立场,采用的是自然人和计算机两者交互协同的视角。本文就是对从(必然兼容且优于前两种视角的)第三种视角而提出来的研究课题的回顾。 工程融智学的方法,以人机“合理分工、优势互补,高度协作、优化互动”的方式独辟蹊径,提出了自然语言理解的工程模型(基于Z-ASCII的GTCM/STCM与基于Z-Unicode的GSCM/SSCM)及应用模式(SDVE),如:“两典一册”。部分成果(1997-2005)已得到学术界多个课题组专家们不同程度的认可(见:专家评语)。本文将重点介绍其中近期取得的进展。汉语“字本位”理论方面,本文明确表述了字的迭交原理,直观地表述了字与词两种思维模式,二字组的构造原理;中文信息处理方面,本文明确给出了字处理的“三合一”设计方案(经过“中文计算机输出输入系统”、“终极标准信息交换码”和“大字符集可小字符集化的字型库”协同试运行一段时间之后可以中文基因芯片的形式固化),提供了“两典一册”(经过“合作型生产式教学法”推广普及活动检验之后可以中文语法芯片的形式固化)的示例。全局形式化标准平台,可为“中文基因”和“中文语法”信息的提取以及“(汉英/英汉)双语概念及命题”知识的提取,提供人机“合理分工、优势互补,高度协作、优化互动”的优化环境。从而,可进一步为“中文基因芯片”和“中文语法芯片”以及“(汉英/英汉)双语知识(概念及命题)芯片”的封装奠定形式化基础。这涉及业内普遍感兴趣的一组关键问题的解决,是适合汉语字本位语法形式化表述进而可改观中文信息处理形式化现状的新方法。  
个人分类: 语言学基础研究|1817 次阅读|0 个评论
翻译的语言学理论 中英文书稿
carldy 2011-11-10 13:30
J.C. Catford. 1965. A Linguistic Theory of Translation: an essay in applied linguisitcs. Oxford University Press. A Linguistic Theory of Translation.pdf J.C.卡特福特著. 穆雷 译. 1991. 翻译的语言学理论. 北京:旅游教育出版社. 翻译的语言学理论+(Catford).pdf
个人分类: 个人收藏 My favorites|1 次阅读|0 个评论
《 写作新解》收到的第二份反馈
zhaodl 2011-10-31 17:47
说是见到的,因为是在朋友博客中见到的,朋友是匿名交流,所以也就沿用其博客的名字。朋友点到的一点——与作者平等交流,一直是我努力的方向。 大良的新书//作者:云中君 转自:云中看天下 http://827485123.qzone.qq.com/ 我也给学生开过科技写作课,试图帮助学生提高写作水平,但总感觉效果不是很理想。我一直认为是学生不够重视,但看了大良的新书《科研论文写作新解》,忽然有了新的感悟。我们过去是就写作本身而组织内容的。比如,告诉学生论文的选题要求、格式、语体和语法特点、语言学知识、逻辑知识,以及标准化、规范化等,但很少顾及编辑与作者两个不同角色的交流。就写作内容组织的教学,很琐碎,但没有新的知识点,只不过汇总和强调而已。对学生而言,如果不是为了学分,没有兴趣点。课可以上,考试也没有问题,但是学完后并没有多大改善,依然故我。 大良的书之所以称为新书,不是因为他所涉及的知识,或者是因为刚刚出版,而是他所体现的观点和逻辑。这本书实际就是编辑与作者两种角色之间的对话。就编辑而言,当然是希望作者写好论文,但作者并不一定认同你的观点。这里不仅需要知识的传授,更需要职业的沟通。就作者而言,不管是否接受,编辑都是裁判,利益上有对立。因为对编辑这个职业的不了解,所以他很难相信你所说的论文写作知识就是投稿必中的全部,而是一直试图绕到你的身后了解编辑职业的所有神秘之处。从很多作者将论文写作的工夫不放在论文本身,而是放在编辑身上就可以说明这点。 大良做到了这一点。站在编辑的角度,毫无保留地向作者公开编辑职业的所有秘密,使两个角色平等沟通和交流,实现相互理解和认同,拉近了两者的距离。在这个基础上再谈论文写作,就变成了朋友之间的善意的提醒和帮助,效果自然与以往不同。这话不是主观臆断。在从南京回武汉的路上,遇到了一位南大电子系的刘教授,居然正是大良的朋友,也正好收到大良送的这本书,居然跟我持一样的观点。 我很高兴朋友有新作,也很庆幸这么快就看到了这本书。从资料袋里刚拿出的时候只是随手一翻,但很快就吸引了我。我粗略地看了几章,就断定这就是我以后搞科技写作讲座的蓝本了。这个星期一定会认真地读完所有内容,尽管已经好久没有认真地读完一本书了。
个人分类: 编辑出版|2879 次阅读|0 个评论
《立委科普:语言学的基本概念》
热度 1 liwei999 2011-10-19 18:02
《立委科普:语言学的基本概念》 (5384 bytes) Posted by: 立委 Date: June 26, 2008 12:32AM 语言学是语言的学问,这学问的引人入胜之处,就在于其研究对象语言是一个人人知其然,很少人知其所以然的复杂的系统。复杂到什么程度呢,总之是很容易陷进去出不来。能出来的人不多,立委自以为是出来人,因此,斗胆开讲语言学学理讲座。外行看热闹,内行看奥妙,陪伴各位做一次语言学揽胜之旅。 谈语言学,从基本概念起。 1 语言 语言的本质是人类的交流工具。这句大白话我们在学理的讨论中会反复引用,以示人们在语言学的不毛争论中多么容易偏离这一基本常识。 乔老爷的形式语言理论创立以后,语言定义为合法语句的集合。这个理论是计算机语言及其汇编的基石,对于自然语言(natural language)也有很好的借鉴意义(如果能够正确理解语法的话)。 把语言看成语句(sentence)的集合,意味着语句成为语言研究的基本对象。实际上语言不是简单的语句集合,语句之上还有篇章(discourse)结构,还有跨句回指(co-reference, 比如他回指前句的张三)。为简化学理的讨论,这次揽胜之旅不再涉及篇章语言学,一切限于语句之内。换句话说,作为理论的第一近似,语句是语言研究的最大单位。 2 语言研究的目的 目的可以有很多种,务虚的目的包括探询语言的本源,语言和思维的关系,语言理解的心理机制等等。立委乃计算语言学人,不尚务虚,因此本讲座限于务实的宗旨。具体说,主要为了支持电脑分析(parse)和生成(generate)语言。 3. 自然语言理解 语义(semantics)是内容,语言是形式,分析和生成就是建立语言和语义的连接。由语言达至语义是分析的宗旨,由语义外化为语言是生成的目标。什么叫做理解了呢?就是从语言的一句句话,解析出了相应的语义。在电脑自然语言理解里,解析出的语义表达(representation)称为逻辑形式(logical form),它是 parsing 的目标。 语义主要由两部分组成,即词汇意义和语法意义。词汇意义建立单词和概念的联系,是词典的任务。当一个个词排列成句的时候,句子的含义不是这些词汇意义的简单相加,而是涉语句结构及其语法意义,它决定了词汇意义转化为语句整体意义的组合方式(所谓 semantic compositionality),从而实现理解,达到交流的目的。形象地说,词汇意义好像散乱的珍珠,是语法意义把它们串接成理解的项链。如果一句话描述了一个事件(侧面),理解就是要求解 who (施事) did (动作) what (受事) when (时间), where (地点), how (方式) and why (原因) 等等。施事、受事、时间、地点等叫做语义角色(semantic roles)。 看下列例句:奥运会开幕式定于2008年8月8日晚8时在北京举行。 查词典可得词汇意义,用括号表示:(奥运会) (开幕式) (定于) (2008年) (8月) (8日) (晚8时) (在) (北京) (举行) . 所以,分析理解的关键是解析(decode)内含的语法意义。句子的主体是主语谓语,先切一刀: 【(奥运会) (开幕式)】| 【(定于) (2008年) (8月) (8日) (晚8时) (在) (北京) (举行)】 主语谓语的中心词形成了句子的主干,表达的是施事和动作的关系: (开幕式) ... (举行) 主语中心词 (开幕式) 带有定语 (奥运会),表达的是修饰关系。谓语动词 (举行) 带有两个状语:时间状语 【(定于) (2008年) (8月) (8日) (晚8时)】和地点状语【(在) (北京) 】。这两个状语内部还有句法结构体现出来的语法意义,可以将其构成成分的各个词的词汇意义串起来,我们以后会进一步探究,先到此为止。 小结一下:自然语言理解的中心任务是解析语言单位之间的语法意义,即谁与谁发生关系以及关系的语义角色。 4. 语言单位:语素、词、短语和语句 语言研究的基本单位一般认为是语素(morpheme)、词 (word)、短语(phrase)和语句(sentence/clause)。当然还可以细分(比如乔老爷X-bar理论认为词和短语之间还有一个X-bar的单位, sentence 一般认为大于等于 clause),或施行不同的单位分类法,但这不是我们要争论的点,也不妨碍我们对学理的探讨。 语素的标准定义是音义结合的最小单位,书面汉语中绝大多数汉字对应的是语素,在英语里面语素是前缀、后缀、词干(e.g. un-read-able)和合成词里面的构词单位(e.g. black-board)。 语法(grammar)是构词造句的机制。它通常包括词法(morphology)和句法(syntax)两大块。从生成上看,词法的输入是语素,输出是词;句法的输入是词,输出是句子。在标准的语法模型里面,句法建立在词法之上,而词是二者的接口。可见,词是一个关键的语言单位。 什么是词?这个问题语言学家争论了很久,在汉语语言学界还曾展开过大论战,有真知灼见,更多的是不毛之争和口水战。争论的起因之一是因为书面汉语的书写系统是连续的汉字串,不象西方语言以空格分隔多数的词。更深层的原因是字和词之间有一大片灰色地带,而这和汉语的发展史有关。大体说来,古代汉语中的字和词基本重合,随着语言的发展,多音词(尤其是双音词)逐渐固定下来,成为句法基本单位的主流。由于书面汉语的惰性和传承性,字词的界限很不分明。一般来说,对于灰色地带,不同的理论模型可以有不同的处理安排,只要在系统内部(system-internal)可以自恰或摆平,没有绝对的对错之分。 总结前人的真知灼见,可以归纳如下:1. 现代汉语不同于古代汉语,词已经大于等于字(语素)而成为一个(独L)的语法单位;2. 应该区分语法的词(grammar word)和词汇的词(vocabulary word):尽管二者有很大的重合面,但它们不是对等的;3. 作为相对(独L)的语法单位,词指的是语法的词,而不是词汇的词;4. 词汇的词可以大于等于也可以小于语法的词,举例如下: 性:现代汉语中已经演变成后缀语素(-ness),小于词的单位,如:革命-性,可读-性 洗:动词(wash) 澡:名词(bath),一般不单用,与洗搭配使用:洗-澡,洗-了一个痛快的澡,澡-洗得怎么样? 澡盆:合成词(bath-tub) 洗澡:可分离的动宾习惯搭配,属于短语,是大于词的单位 城门失火,殃及池鱼:成语,属于语句,是大于词和短语的单位 以前很多关于字词的不毛之争是因为争论双方没有区分两个不同的概念(词汇的词和语法的词)而引起的。 世界上的语言很有意思,词法句法的比重因语言类型的不同而不同,一般而言,词法复杂的语言(譬如俄语、法语)句法相对简单,而词法简单的语言句法就复杂一些(譬如英语和现代汉语)。推向极端,在古代汉语这样的所谓孤立语中,词法基本为零,一切语法关系都是句法关系。所谓多综复合语(譬如有些印帝安部落语言)是另一极端,句法极为贫乏,一个简单句的语义常常通过动词主干上的种种前后缀的叠加来表达。 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|5727 次阅读|3 个评论
《科普随笔:“他走得风一样地快” 的详细语法结构分析》
liwei999 2011-10-19 14:21
《科普随笔:“他走得风一样地快” 的详细语法结构分析》
《立委随笔:“他走得风一样地快” 的详细语法结构分析》 (1564 bytes) Posted by: 立委 Date: June 07, 2008 05:18AM 有老友问如何分析句子“他走得风一样地快”。镜兄回答: 引用: “走/得快”是一个区分,不应该是“走/得/快”。 (157425) Posted by: mirror Date: May 30, 2008 07:51PM “他走得风一样地快”的分析是:“他走/得{风一样地}快”的结构。 镜子的分析很到位,层次清晰。句法分析是立委大学和研究生阶段最常做的一种练习了,差不多如数家珍了。 这个句子虽然短,结构还挺复杂,而且涉及现代汉语一些主要短语。更具体的层次分析法是: 首先在主语谓语中间切一刀:他|走得风一样地快 他:由代词构成的名词短语(NP)做主语。 走得风一样地快:是动词短语(VP)做谓语。 其中,得字短语(又叫得字结构)做动词“走”的补语。所以,第二刀切在“得”字前: 走|得风一样地快 得字短语通常做补语表示程度,其构成是:得+XP, XP 指几乎任何短语,由“得”字统率。在此句中,是形容词短语(AP)风一样地快。 形容词短语(AP)风一样地快内部的一刀应该切在做壮语的“地字短语”(又称地字结构)和主形容词“快”之间: 风一样地|快 地字短语通常做壮语表示性状,修饰动词或者形容词,其构成是:XP+地, XP 指几乎任何短语,由“地”字统率。在此句中,是后置词短语(PP: postpositional phrase)风一样。 后置词短语(英语也有少数后置词,譬如ago)与前置词(又称介词)短语句法功能类似,句法上由后置词统率,常常充当状语。现代汉语的一个常用结构是前置词和后置词配合使用,构成所谓框式结构:Prep+NP+Postp, 比如:象...一样(象风一样);在...内(在脚池内)。这样的框式结构常常省略前置词而意思不变,象风一样--风一样;在脚池内--脚池内,就是所谓后置词短语了。 总的结构层次如下: | |地]|快]]] 以上的句法结构分析是比较流行的层次分析方法的结果,当然还有别的分析法。 汉语句法树之美,不下于北美亚洲小姐 作者: 立委 日期: 10/31/2011 16:24:08 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|6900 次阅读|0 个评论
从 colorless green ideas sleep furiously 说开去
liwei999 2011-10-14 17:59
从 colorless green ideas sleep furiously 说开去
《科普随笔:乔姆斯基》 (4031 bytes) Posted by: 立委 Date: April 22, 2007 10:15AM 周末说点语言学:从 colorless green ideas sleep furiously 说开去 (13928) Posted by: liwei999 Date: June 17, 2006 11:25AM 这句“名言”是大名鼎鼎的乔姆斯基(Chomsky)说的。 Noam Chomsky是MIT顶级教授(Institute Professor),各位应该很熟悉了,他不但是一位超级语言学家,而且对于美国外交的强盗主义行径和大众传媒的欺骗主义本质深刻揭露,是所谓的“持不同政见者”,左派人士。据说,他的著作的引用率仅次于《圣经》和马克思,在当代还健在的科学家中首屈一指。他是真正的学者明星,全世界巡回讲演,每到一处,崇拜者云集。著述甚丰,在中下层民众中影响深远。有次在加拿大乘出租,出租司机跟我聊起乔姆斯基来,眉飞色舞,说起自己曾经特意开车一百多公里去听乔姆斯基讲演。 关于乔姆斯基的政见,以后有空再介绍。今天简单谈谈他的语言学方面的影响。乔姆斯基1957年发表了划时代的著作“句法结构(Syntactic Structures)”,史称“乔姆斯基革命”(Chomsky's Revolution)。此前的语言学主流是行为主义主导,讲究细致观察记录言语行为,用归纳法慢慢总结规律。乔姆斯基认为,人生来就有一套语言机制(叫“普遍语法”,universal grammar),后天的语言习得不过是对 universal grammar 的某些参数做调整而已。语言学重点应该研究这种普遍语法的机制。自1957年以来,乔姆斯基在语言学界一直是龙头老大,他的理论也经历了四次大的创新,每次都是他的自我突破,每次突破都引领世界潮流。在语言学历史上,乔姆斯基现象是一个典型的英雄创造历史的实例。没有乔姆斯基,语言学不知道会是什么形态,甚至反对乔姆斯基理论的语言学家也不得不承认,是乔姆斯基提升了语言学的地位以及语言学对其他学科(心理学,哲学,计算机科学)的影响。 谈乔姆斯基的材料,汗牛充栋。今天,我只就乔姆斯基的上述名言做一点介绍。这句名言是,repeat: Colorless green ideas sleep furiously. from: http://paris.unlike.net/event_occurrences/111964-Colorless-green-ideas-sleep-furiously 有一次,我说话漏嘴了,女儿大笑,说:“Dad, it does not make sense at all”。我就趁机跟女儿介绍了上述名言,她居然极感兴趣,整整一天都在那里一边唠叨,一边自娱:“haha, this is the most stupid sentence I have ever heard. How can ideas sleep? Ok, even if it can sleep, how can it sleep furiously? Ideas have color? Green? Come on. Ok, if it is green, how can it be colorless.” 就是,在这个短短的句子中,所有发生语法关系的词,在概念上都不具有兼容性,不 make sense. 可是,每一个 native speaker, 都发现这是 perfectly grammatical English,否则我们怎么能够理解这个句子的荒谬(how do we make sense of nonsense?)。乔姆斯基的这个俏皮的思维实验是要表明,句法结构是可以独立于语义(和概念)的。语言学家在研究语言的时候,应该排除语义的干扰,才能深入了解语言结构及其转换规律。这个观点实际上是有隐患的(此处不谈),但是把句法(syntax)和语义(semantics)分开,在当时确实极大地推进了语言学的研究深度。 有意思的是,nonsense 是相对的,在特定场合,context 能够使得 nonsense 变得有意义。我多年前曾经以世界语的场景作为例子,对此名言做过如下解释(后来一个世界语小报编者还来信要求转载这个近似幽默的解释): Interpreting colorless green ideas sleep furiously Does it make sense? In a certain domain, the Chomsky's famous sentence is well imaginable. Colorless green ideas sleep furiously. Imagine the following context: As we know, Esperantists wear a badge of a green star, a symbol for Esperanto and its ideals. From there, green ideas would be easily conprehensible to their minds. Suppose now comes an opponent to Esperanto, he may say, Your green ideas are really colorless, not only colorless, those ideas are no longer popular! Colorless green ideas sleep now! Well, what is a possible reaction from some Esperantists? Yes, our ideas sleep now. But remember, colorless green ideas sleep furiously! 2006年06月18日 ----------------------------------------------------------------------- 立委补记: 老乔研究语言学的一个出发点就是:人一辈子在有限的语言exposure的环境里面,input is full of fragments, errors, slips of the tongue, etc. 怎么可能学会语言?他最后归结到人与生俱来的universal grammar机制。外在的imperpect input不过启动了这个机制,对其做微调而已。所以再笨的人母语也还是学会了,有语感。不过学第二语言就不同了,因为universal grammar 的 parameters 一旦置值,就有了固化的顽固。第二外语学得好坏各个不同,看造化了,总体来说,女孩比男孩强,所以立委虽为师兄,也不敢在师妹面前逞强。 【成长花絮:自嘲和幽默】 (698 bytes) Posted by: 立委 Date: October 25, 2007 01:23AM 甜甜不时冒出来的傻气和自嘲,极富幽默感,让人忍俊不住。今天早上就有一段,正在她随口胡编顺口溜的时候,我说她nonsense, 然后不知怎么又谈到了乔老爷的名言:Colorless green ideas sleep furiously. “Dad, it actually makes sense to me.” How? “well”, 她边想边造,”colorful green really means fancy green, shining green, …” No, not colorful green, it is colorless green. “Oh, yeh, colorless green is even better, it means transparent green, right? ideas sleep in a beauty sleep dream, too.” beauty sleep? it sleeps FURIOUSLY. “right, that must be a nightmare!” Wow you are really good at inpterpreting nonsenses. “hehe”, 甜甜狡黠地一笑,”I am a nonsense person after all.” 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|19037 次阅读|0 个评论
《科普随笔:汉字和语素》
liwei999 2011-10-14 17:48
实在忍不住,到隔壁插了一句 (16228) Posted by: liwei999 Date: July 26, 2006 05:35AM 前几天看到江老弟在黑暗中摸索,想用汉字表达他琢磨出来的语素的概念,就想好为人师一下。想还是等别的语言学家出来给他点拨一下吧。结果没有。质疑他汉字说的人,逼迫他重新修正概念,提出了近似语素的基本概念。 隔行如隔山,聪明人往往喜欢琢磨其他专业的事情。但必须承认,再聪明,这样做也基本是徒劳。这是个很有意思的过程。 引用: 关于汉字拼音化(修正稿,放弃广义汉字说法) 大脑思维时,虽然表现出来像是以语音进行,但实质上是一种意识流;此意识流由某种意识元素组成。意识元素,从物理上说,表现为大脑神经网链;这些神经网链体现出意识内容、发音以及文字之间的联系。对于西语,意识元素对应于word;对于汉语,意识元素对应于字(一个汉字相当于英文小word)和词所表达的概念。下面主要讨论汉语的情况。 意识元素的三要素(意识内容、发音以及书写文字)中,意识内容是最重要的。 声音虽然是语言的一大载体,但思维并不就一定是声音流。比如对于先天聋人来说,思维纯粹就和声音无关。 再比如,当你脑子里想“可疑”二字时,你清清楚楚知道是“可疑”而不是“可移”;也就是说,思维是在用“意识元素”进行,只是一般感觉上表现出语音形式。 汉语在脑中的意识元素常常是“图声并茂”,其中图只是存图的特征信息,人脑并不存图的全部。 人们学汉字时,实质上是在建立一个从这个意识元素到字形的映射库;学拼音时,则是在建立从意识元素到混淆了同音字的拼音这种映射库。 1。汉语意识元素的图表示即汉字的书写形式。显然,其与汉字一一对应。 2。汉语意识元素的声表示即拼音。显然,汉字意识元素表达为拼音时,混淆了大量同音字;属于多对一的对应关系。 以上两点为汉语构成的两个基本特点。 (在目前汉语拼音方案基础上的)汉语拼音化实质上是把汉语用一种不精确的方式表达,可读性大为下降。 江毅 语言学上,这是个基本概念,叫morpheme 送交者: liwei999999 于 2006-07-26, 04:41:11: 翻译成词素或者语素,它是语言中音义结合的最小单位。关于morpheme的理论和实践,有很多定论了。 不过还是很佩服你在显然没有怎么接触语言学的情况下,独立琢磨出近似语言学里面的概念和理论。不过,大多是重复劳动,用词不同而已。 你的思路是对的(但在语言学中是常识,Course 101一级),开始用汉字作为你思维成果的载体,虽有缺陷(所以你不得不放弃),也不无道理。 在古汉语,汉字、音节和语素有很大的重合面。最科学的概念,能够适应人类所有语言的概念,还是语素。研究语素构词的学问叫morphology (研究由词构句的学问叫 syntax)。 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|4667 次阅读|0 个评论
融智学导论:言本位与双语信息处理(第三稿)
geneculture 2011-9-20 03:38
ZouXiaohui 3:35:37 融智学导论: 言本位与双语信息处理 0.绪论: “第三脑智”如何可能? 1.普通语言学的言和语 2.自然语言数字化理解 3.广义的双语信息处理 4.论协同智能计算系统 5.融智学的协同智能观 6.创造性合作型生产式 7.谈文化基因系统工程 编后 历时六年的构思过程,今天笔者终于可以较为满意地给出了《融智学导论:言本位与双语信息处理》(第三稿)明确概念体系框架。这是一件值得庆幸的事情。还有一件同样值得庆幸的事情是本人已经在大学讲堂上系统地讲解它——从而可让二百来人的各个学科和专业的大学生、研究生以及年轻教师在第一时间了解到融智学的最新进展(其中涉及笔者在国内外第一流大学和第一流的学者们交流的某些情形——这对教学双方进一步协同探讨融智学的前沿问题具有特殊意义)。 本学科课程的准确称谓是:狭义融智学。 本学科的研究对象是虚拟的“第三脑智” 本学科的学科性质是数字化的复杂性科学 本学科的方法体系是间接形式化及其计算 本学科的概念体系是基于言和语的术语集 该专著的名称又可叫做《融智学导论:言本位与双语信息处理的基础》2011(第三稿) 其中言本位源于:邹晓辉在贝克莱大学的语言学讲堂上明确提出了自己的言本位观点 http://bbs.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=440119 这样就可以和早期所谓《融智学导论:字本位与中文信息处理的基础》2007(第二稿) 以及更早一些时候写的《融智学导论:字本位与中文信息处理的基础》2005(第一稿)衔接 它与现有学问体系的继承关系可由“语言、信息、知识、智(慧、力、能)”四个关键词来概括。
个人分类: 融智学导论|1916 次阅读|16 个评论
2011教育部人文社会科学研究项目评审结果公示一览表:语言学
carldy 2011-8-15 11:56
他山之石,可以攻玉。 这里录下的是2011年教育部人文社会科学研究项目评审结果一览表。 语言学 3492 安徽工业大学规划基金项目 中国法律翻译发展史研究 戴拥军 3493 北京航空航天大学规划基金项目 基于语料库的中外科学家学术论文话语特征对比研究 何宇茵 3494 北京师范大学规划基金项目 高等教育中的日语教育基础研究 - 关于国内日语学习者外语学习观的调查研究 冷丽敏 3495 北京语言大学规划基金项目 对外汉语语篇语法框架构建与研究 田然 3496 渤海大学规划基金项目 面向多种媒体的当代汉语流行语跟踪研究 夏中华 3497 大连海事大学规划基金项目 中国古代航海文献翻译研究 刘迎春 3498 电子科技大学规划基金项目 三维意义整体论:先验、构成与生成 王爱华 3499 东北师范大学人文学院规划基金项目 应用型日语口译人才市场需求现状调查及其培养模式 藤卷启森 3500 东南大学规划基金项目 “后方法时代”英语教学原理与实践探究 郑玉琪 3501 对外经济贸易大学规划基金项目 汉文化经典外译:理论与实践 徐珺 3502 对外经济贸易大学规划基金项目 大学外语专业学生跨文化能力培养研究 潘亚玲 3503 广东外语外贸大学规划基金项目 面向大学英语教学的自动作文分项评分和诊断性反馈研究 葛诗利 3504 广东外语外贸大学规划基金项目 外语教师话语行为的语用研究 莫爱屏 3505 广西大学规划基金项目 山东方言表体范畴的语法化音变研究 李仕春 3506 广西大学规划基金项目 东盟国家语言状况及广西语言发展战略研究 陈兵 3507 广州大学规划基金项目 广州方言词汇近二百年来的演变研究 黄小娅 3508 哈尔滨工程大学规划基金项目 基于历时语料库的中国英语学习者写作能力发展研究 郑玉荣 3509 哈尔滨工程大学规划基金项目 性别语言变体的认知社会语言学研究 梁红 3510 哈尔滨理工大学规划基金项目 认知理论与多模态外语教学的整合与同构姜毓锋 3511 杭州师范大学规划基金项目 认知语料库语言学视角的 EFL 构式习得研究 詹宏伟 3512 杭州师范大学规划基金项目 吴语处州方言的历史比较语言学研究 王文胜 3513 河南财经政法大学规划基金项目 RST中耗散结构的阈限:辞格的负熵流创生及其语篇建模 魏纪东 3514 河南师范大学规划基金项目 汉语构词的历史发展研究 崔应贤 3515 河西学院规划基金项目 河西简牍文字研究 何茂活 3516 贺州学院规划基金项目 湘、粤、桂三省区交界区域族群语言语音数据库建设与研究 陈才佳 3517 湖北第二师范学院规划基金项目 江淮官话与西南官话毗连带方言语法研究 盛银花 3518 湖南财政经济学院规划基金项目 英汉词汇形 - 名搭配对比的语料库考察及多视角研究 钟珊辉 3519 湖南大学规划基金项目 项目式英语专业翻译能力发展模式研究 王湘玲 3520 湖南工业大学规划基金项目 课堂语言学习中的社会行为特征研究 王晓燕 3521 湖南警察学院规划基金项目 谎言的识别研究 羊芙葳 3522 湖南理工学院规划基金项目 现代汉语时间词的语言类型学研究 余东涛 3523 湖南理工学院规划基金项目 大学英语网络交互教学及成效研究 欧阳建平 3524 湖南师范大学规划基金项目 汉文佛典与中近古字韵书疑难字研究 郑贤章 3525 湖南文理学院规划基金项目 “巨人的碰撞” -- 中美政治隐喻的对比研究 陈勇 3526 湖州师范学院规划基金项目 汉语动词重叠的历史研究 潘国英 3527 华南师范大学规划基金项目 徽州文书俗字的整理和研究 方孝坤 3528 华南师范大学规划基金项目 初级对外汉语语法创新教学模式的实验研究 李盛兵 3529 华中科技大学规划基金项目 面向计算机的现代汉语“得”字识别研究 骆琳 3530 华中科技大学规划基金项目 中国高校学术英语写作与批判性思维的培养 都建颖 3531 华中科技大学规划基金项目 基于语料库的中外英语科技期刊论文语篇对比研究 胡志清 3532 吉林大学规划基金项目 “核”语义辐射与句法 - 语义接口问题研究 刘艳茹 3533 吉首大学规划基金项目 英汉语序的认知类型学研究 丁志斌 3534 集美大学规划基金项目 新加坡英汉双语教育史:新加坡近三代华人使用汉语方言、“华语”及英语的历史演变 黄明 3535 暨南大学规划基金项目 殷商至秦汉形声字发展研究及字形辞例数据库建设 师玉梅 3536 暨南大学规划基金项目 二语认知表征机制的 fMRI 研究 卢植 3537 暨南大学规划基金项目 信息处理用粤语字词的标准和规 范彭小川 3538 暨南大学规划基金项目 英语学术语篇的合理性建构手段研究 王全智 3539 嘉应学院规划基金项目 汉语个体量词的产生与发展 麻爱民 3540 嘉应学院规划基金项目 广东客家话、潮汕话、粤方言词汇比较研究:以梅县话、潮州话、广州话为重点 温昌衍 3541 江南大学规划基金项目 基础教育阶段英语课程评价专业化研究 李健雪 3542 江苏大学规划基金项目 基于“卓越工程师教育培养计划”的国际化精英工程人才英语能力培养途径研究 陈欣 3543 江苏大学规划基金项目 中国大学生 EFL 书面纠错反馈效果研究 苏建红 3544 江苏科技大学规划基金项目 基于意义进化理论的语言构建性研究 赵霞 3545 喀什师范学院规划基金项目 新疆汉语方言语音的演变研究 欧阳伟 3546 兰州大学规划基金项目 语言意义认知的形式与语用推断法实验研究:汉语等级含意检验 刘思 3547 兰州大学规划基金项目 甘肃方言语音调查研究 刘伶 3548 丽水学院规划基金项目 无著道忠禅语考释集录与研究 王闰吉 3549 辽宁大学规划基金项目 基于认知音位与分解输入的英语语音教学模式研究 曲家丹 3550 鲁东大学规划基金项目 对韩汉语 8000 词认知编码度的标注及开放型偏误语料库的建设 焉德才 3551 鲁东大学规划基金项目 英、法、俄、日语文词典比较研究及其对汉语语文词典编纂的影响 于屏方 3552 鲁东大学规划基金项目 面向辞书编纂的大型通用语料库建设研究 亢世勇 3553 绵阳师范学院规划基金项目 坚守与超越:共和国高校英语专业本科教育演进的文化审视郭凤鸣 3554 南华大学规划基金项目 音译字选择与音译词规范研究 刘祥清 3555 南京大学规划基金项目 基于动态系统理论的二语学习频次效应模式构建 周丹丹 3556 南京航空航天大学规划基金项目 汉语与日语中否定与否定极性副词的对照研究 葛金龙 3557 南京审计学院规划基金项目 汉语非短语结构词的词汇化和语法化研究 刘顺 3558 南京师范大学规划基金项目 河西宝卷的音韵研究 徐朝东 3559 南京师范大学规划基金项目 国际化背景下以学科内容为依托的大学英语教学模式研究 陈莉萍 3560 南京师范大学规划基金项目 基于语料库的当代美国政治语篇的架构隐喻模式分析汪少华 3561 南京信息工程大学规划基金项目 中国方言音与日本字音体系的对照研究—与吴音汉音的对照侯锐 3562 南开大学规划基金项目 课堂纠错反馈对于汉语语法习得的作用 祖晓梅 3563 南开大学规划基金项目 汉语语法点教学案例研究 卢福波 3564 南通大学规划基金项目 南通方言的接触与演变研究 万久富 3565 齐齐哈尔大学规划基金项目 殷周金文动词词汇研究 寇占民 3566 青岛大学规划基金项目 翻译过程的语言学研究 徐莉娜 3567 曲阜师范大学规划基金项目 我国大学英语课堂教学有效性评价研究 任庆梅 3568 曲阜师范大学规划基金项目 谓词的非宾格性及其句法表现 王秀卿 3569 三峡大学规划基金项目 三峡工程外迁移民语言生活状况调查研究 周卫华 3570 三峡大学规划基金项目 语言接触与语言演变——瑶族勉方言湘南土语个案研究 谭晓平 3571 山东大学规划基金项目 维果茨基理论视角下反馈在外语写作中的作用的研究 王颖 3572 山东大学规划基金项目 敦煌藏汉对音研究 王新华 3573 山东大学规划基金项目 评价意义的句法研究 刘世铸 3574 山东大学规划基金项目 中国翻译批评研究: 80 年代以后 薄振杰 3575 山东建筑大学规划基金项目 多维视角下的语块及其成效评估 李继民 3576 山东科技大学规划基金项目 山东方言连读变调类型的实验语音研究及优选论分析翟红华 3577 山东科技大学规划基金项目 基于 ERP 技术的英汉心理词典中双语词汇名动分离机制研究 陈士法 3578 陕西师范大学规划基金项目 “四书”注释传意研究 杜敏 3579 上海财经大学规划基金项目 元末至民初汉语口语句式研究——以古代朝鲜、琉球、日本系列汉语会话教科书为中心 卢惠惠 3580 上海财经大学规划基金项目 中国英语学习者非宾格结构习得研究 张达球 3581 上海电机学院规划基金项目 多模态话语研究 --- 电视访谈的多模态话语特征代树兰 3582 上海海事大学规划基金项目 近代英美传教士英译汉语典籍活动研究 何绍斌 3583 上海交通大学规划基金项目 外国人汉语习得动态作文语料库建设及研究 宋春阳 3584 上海外国语大学规划基金项目 英汉新词语理据的认知研究 黄皓 3585 沈阳师范大学规划基金项目 基于语料库的高校英语专业学生词汇自主学习模式的构建研究 孙若红 3586 四川外语学院规划基金项目 社会文化理论与语用习得研究 段玲琍 3587 四川外语学院规划基金项目 内向型汉英学习词典多维释义模式的构建:基于心理动词的词典学研究 胡文飞 3588 天津大学规划基金项目 中国崛起与国家独特宏观外语资源需求理论及实证研究 李鸿斌 3589 天津大学规划基金项目 解构主义对中国翻译的影响研究 贾欣岚 3590 天津商业大学规划基金项目 语境的本体与认知研究 田海龙 3591 天津师范大学规划基金项目 中国大学英语学习者群体分类研究 王静 3592 天津外国语大学规划基金项目 大学生英语程式短语学习影响因素研究 魏梅 3593 同济大学规划基金项目 功能视角下语法与语篇的接面研究 何继红 3594 同济大学规划基金项目 任务型语言教学和多模态话语交际框架下的高级英语视听说课程研究 戴劲 3595 温州大学规划基金项目 近代汉语句式糅合现象研究 叶建军 3596 温州大学规划基金项目 外语教育语言学的多维思考夏侯富生 3597 西安外国语大学规划基金项目 基于认知的俄汉语时体系统对比研究 邓滢 3598 西昌学院规划基金项目 二王杂帖词汇研究 张俊之 3599 西南大学规划基金项目 东巴文谱系整理及历时演变研究 邓章应 3600 新疆师范大学规划基金项目 新疆塔塔尔语濒危现象研究 古丽米拉·阿不来提 3601 信阳师范学院规划基金项目 修辞学视角下词汇语义语用研究 章彩云 3602 信阳职业技术学院规划基金项目 外交语言“政治等效”翻译理论与实践杨明星 3603 徐州师范大学规划基金项目 中国学习者英语写作中语际翻译行为杂合现象研究 袁辉 3604 徐州师范大学规划基金项目 基于交际有效度的英语语调习得研究 穆凤英 3605 扬州大学规划基金项目 文化翻译观下的理雅各《尚书》译本研究 陆振慧 3606 云南大学规划基金项目 《说文解字》的阐释体系及其说解得失研究 蔡英杰 3607 湛江师范学院规划基金项目 《 汉语大字典 (第二版)释义问题研究 》朱城 3608 湛江师范学院规划基金项目 空间指示语的实验语用学研究 徐学平 3609 漳州师范学院规划基金项目 张斌语法理论与实践之研究 吴晓芳 3610 浙江财经学院规划基金项目 方言接触视域中的“黄孝片”方言语法调查研究 汪化云 3611 浙江财经学院规划基金项目 晚清科学小说在中国的译介研究 陈向红 3612 浙江大学规划基金项目 当代中国话语的基本特征研究 施旭 3613 浙江工业大学规划基金项目 汉日外来语吸收现状及其比较研究 -- 英语时代背景下日语字音词激增及汉语外来语吸收法徐萍飞 3614 浙江师范大学规划基金项目 国际化进程中的城市语言接触研究——以国际性商贸城市义乌的语言生活为例 毛力群 3615 浙江外国语学院规划基金项目 汉语话语标记语系统与认知研究 周明强 3616 中国政法大学规划基金项目 法律英语学科规划研究 李立 3617 中央民族大学规划基金项目 彝族史诗《勒俄特依》的语言学研究 胡素华 3618 重庆师范大学规划基金项目 现代汉语方言时间语词的多角度研究 何亮 3619 遵义师范学院规划基金项目 贵州境内仡佬族转用汉语西南官话研究 陈遵平 3620 安徽大学青年基金项目 基于语料库的中国英语学习者使役构式习得研究 胡健 3621 安徽工业大学青年基金项目 清季民国的古文字研究 王其秀 3622 安徽农业大学青年基金项目 现代汉语领主句研究 孙志农 3623 安徽师范大学青年基金项目 影响篇章时间推进的多因素分析 饶宏泉 3624 安阳师范学院青年基金项目 商代金文数据库的建设 苗利娟 3625 百色学院青年基金项目 多语环境下的桂西“高山汉话”研究 吕嵩崧 3626 北京大学青年基金项目 基于语篇与语体的连词主观性研究 张文贤 3627 北京第二外国语学院青年基金项目 中国英语学习者词汇习得与认知神经研究 吴建设 3628 北京第二外国语学院青年基金项目 汉日致使句式中役事论元隐现及其机制的对比研究 王鹏 3629 北京航空航天大学青年基金项目 基于语料库英汉指令言语行为对比与语力翻译研究 管兴忠 3630 北京林业大学青年基金项目 语用习得的实验研究 : 以等级隐涵与标记性焦点为切入点范莉 3631 北京师范大学青年基金项目 基于计算的汉语词汇筛选机制研究 谢永芳 3632 北京师范大学青年基金项目 句法与语用的接口:汉语句子信息结构研究 周士宏 3633 北京语言大学青年基金项目 第二语言学习者汉语疑问句系统的习得与认知研究 施家炜 3634 北京语言大学青年基金项目 基于认知语义学的口译传译单位研究 许明 3635 北京语言大学青年基金项目 非母语者汉语话语标记习得与使用情况研究 刘丽艳 3636 北京语言大学青年基金项目 汉语并立式复合词及其习得机制研究 李艳华 3637 常熟理工学院青年基金项目 基于语料库的汉英政治文本翻译研究 朱晓敏 3638 常熟理工学院青年基金项目 徽州地区方言语法比较研究 王健 3639 大连理工大学青年基金项目 语言类型学视角下的甲骨、西周金文动词研究 闫华 3640 大连外国语学院青年基金项目 认知语言学视角下的日语条件句习得研究 刘晓华 3641 大连外国语学院青年基金项目 中韩陪同口译过程中译员伦理意识的研究 李民 3642 东北财经大学青年基金项目 清末中国人使用的日语教材——一项语言学史考察 鲜明 3643 东北师范大学青年基金项目 英语教学视阈下语法隐喻能力的实证研究 曲英梅 3644 东北师范大学青年基金项目 类型学视野下现代汉语复句连续统的构建研究 张建 3645 对外经济贸易大学青年基金项目 现代汉语双音复合词前位形语素语义组合规律研究 周琳 3646 对外经济贸易大学青年基金项目 认知心理视角下的英语课堂反馈研究 杨颖莉 3647 佛山科学技术学院青年基金项目 《大明度经》及其异译经的语言对比研究 季琴 3648 福建师范大学青年基金项目 候选项链理论对汉语双向性变调的解释力研究 闫小斌 3649 福建师范大学青年基金项目 外语教师评课话语实景认知研究 毛浩然 3650 阜阳师范学院青年基金项目 近代汉语框式介词研究 张云峰 3651 复旦大学青年基金项目 日语中的依赖表现研究 赵彦志 3652 复旦大学青年基金项目 在中间语言习得理论框架下的日语语音习得研究 刘佳琦 3653 广东培正学院青年基金项目 语块教学法在我国基础教育阶段外语课程教学中的可行性研究 周正钟 3654 广东外语外贸大学青年基金项目 方言学视角下的汉语词语语法化现象研究——以汉语“着”类词研究 为例 王媛媛 3655 广东外语外贸大学青年基金项目 基于语义分析的中文主观题的自动评分研究 柯晓华 3656 广东外语外贸大学青年基金项目 基于语料库的汉英法律语篇信息组块的比较研究 陈金诗 3657 贵州大学青年基金项目 元代北曲用韵研究 李蕊 3658 哈尔滨工业大学青年基金项目 外语教学中跨文化交际能力评估体系研究 孟勐 3659 哈尔滨理工大学青年基金项目 基于自动问答技术的英语高频形容词深度知识习得研究 郎非 3660 哈尔滨理工大学青年基金项目 言外转喻的加强联想模式构建研究 邹春玲 3661 哈尔滨师范大学青年基金项目 拉林阿勒楚喀京旗方言岛调查研究 梁晓玲 3662 杭州师范大学青年基金项目 《〈史记〉篇章连接标记研究 》凌瑜 3663 河北工业大学青年基金项目 楚文字羡符研究 孙伟龙 3664 河北科技大学青年基金项目 依托项目的课程对英语专业学生研究能力影响的研究 张明芳 3665 河北师范大学青年基金项目 输入加工法的初始和迁移效应 ------ 语法习得的认知心理研究 张素敏 3666 河南大学青年基金项目 汉语假设性虚拟范畴及其句法实现方式 董秀英 3667 河南科技大学青年基金项目 湘方言重叠研究 蒋协众 3668 河南师范大学青年基金项目 战国出土文献同实异名异字辑考 樊俊利 3669 黑龙江大学青年基金项目 满语词源及文化研究 长山 3670 黑龙江大学青年基金项目 英语将来时助动词语义 - 语用界面意义研究 姜涛 3671 黑龙江大学青年基金项目 俄汉阐释动词词义的元语言释义对比 王洪明 3672 黑龙江大学青年基金项目 (俄汉)全译语境作用机制及其应用研究 关秀娟 3673 湖北大学青年基金项目 居都仡佬语与汉语关系研究 李霞 3674 湖北师范学院青年基金项目 与言说义相关的汉语话语标记研究 李治平 3675 湖北师范学院青年基金项目 现代汉语羡余否定构式研究 车录彬 3676 湖南文理学院青年基金项目 历史文化视阈下的《论语》英译研究 李钢 3677 华东交通大学青年基金项目 论证体篇章 " 结构与语义 " 协同分析方法研究 钟茂生 3678 华东师范大学青年基金项目 基于数字化平台的南北朝石刻文献引得及文字研究 郭瑞 3679 华东师范大学青年基金项目 空间认知视角下对举结构与“非法句”合法化研究 甘莅豪 3680 华东师范大学青年基金项目 《切韵》系韵书异读比较研究 赵庸 3681 华南师范大学青年基金项目 中国聋人手语的加工:来自认知神经科学的证据陆爱桃 3682 华南师范大学青年基金项目 从领属到比较:“有”字句的历时演进 董祥冬 3683 华侨大学青年基金项目 日语对古汉语词汇的借入研究 孙娜 3684 华中师范大学青年基金项目 明清曲韵书语音研究 陈宁 3685 华中师范大学青年基金项目 本用结合视野下的有标选择复句研究 尹蔚 3686 华中师范大学青年基金项目 韩国语与汉语被动语法的他者认识:以认知语言学为方法论 齐颖 3687 集美大学青年基金项目 中国新生代农民工的语言使用与社会认同 付义荣 3688 集宁师范学院青年基金项目 意义游走的术语 -- 《文心雕龙》所有英译本中单字术语及含术语双字的英译策略研究 解学林 3689 济南大学青年基金项目 可逆句式的认知研究 鹿荣 3690 济南大学青年基金项目 基于定量分析的汉语词素义生成与演化研究 张小平 3691 济南大学青年基金项目 基于社会语言学视角的网络交际中语码转换现象研究 柴磊 3692 暨南大学青年基金项目 元代以来北方方言能性述补结构研究 王衍军 3693 暨南大学青年基金项目 粤桂毗连地区汉语方言语音比较研究 ——以岭南古都封开方言为枢纽 侯兴泉 3694 暨南大学青年基金项目 汉语动量结构状补句位选择机制及跨语言比较 周娟 3695 嘉兴学院青年基金项目 新出青铜器铭文研究 陈荣军 3696 江南大学青年基金项目 韩礼德的计算语言学思想研究 李学宁 3697 江苏大学青年基金项目 中美贸易纠纷话语研究 吴鹏 3698 江西师范大学青年基金项目 基于专门用途英语语料库的语块研究 陈海员 3699 江西师范大学青年基金项目 哲学视角下语言评价理论的重建及验证 胡文辉 3700 喀什师范学院青年基金项目 维汉空间范畴表达对比研究 薛玉萍 3701 昆明理工大学青年基金项目 声调语言母语者的汉语特殊否定句语音习得研究——以泰、越、柬留学生为例 尹婷 3702 兰州大学青年基金项目 敦煌汉藏对音材料音系研究 史淑琴 3703 乐山师范学院青年基金项目 敦煌写本邈真赞词汇研究 杨晓宇 3704 辽宁师范大学青年基金项目 唐代笔记词汇研究 王虎 3705 聊城大学青年基金项目 基于《红楼梦》平行语料库的汉英隐性隐喻认知路径比较王敬媛 3706 鲁东大学青年基金项目 基于语法功能匹配的自动句法分析研究 徐艳华 3707 鲁东大学青年基金项目 基于词价理论的第二语言词汇教学的应用研究 苏向丽 3708 鲁东大学青年基金项目 基于语义类别的汉英中型语文词典释义研究 冯海霞 3709 洛阳师范学院青年基金项目 信息技术环境下大学英语教学的动态评价研究—理论、模式及实践张艳红 3710 洛阳师范学院青年基金项目 汉语欧化结构的立体考察 马春华 3711 内蒙古师范大学青年基金项目 蒙古文名词语义网设计与构建 哈斯 3712 南昌大学青年基金项目 基于大学英语课堂教学语料的教师会话修正研究 朱娅蓉 3713 南昌大学青年基金项目 赣语昌都片方言语音差异的历史层次及方言地理学研究 卢继芳 3714 南京大学青年基金项目 多语种名词习得:概念化视域下的中介语发展研究 朱叶秋 3715 南京师范大学青年基金项目 江苏省内方言声调的声学建模和感知实验研究 章婷 3716 南京师范大学青年基金项目 利用丰富的语言学信息预测语音合成中的重音事件 赵建军 3717 南京师范大学青年基金项目 文本世界与现实世界的交锋:翻译家的价值取向研究 胡牧 3718 南京信息工程大学青年基金项目 汉语致使范畴历时研究 张艳 3719 南京邮电大学青年基金项目 中国英语学习者英语否定句磨蚀的回归和阈值假说实证研究 于中根 3720 南京中医药大学青年基金项目 中医常用词系统研究 范崇峰 3721 宁波大学青年基金项目 中国人日语学习者词汇习得认知心理学研究 蔡凤香 3722 青岛大学青年基金项目 英汉语言学书评语篇中的负向评价研究 布占廷 3723 青岛科技大学青年基金项目 盖然率、精密阶与接近度——新闻英语语义制约吴建清 3724 清华大学青年基金项目 态度意义与人际关系研究 ——基于对态度意义的多维尺度分析的考察 宋成方 3725 山东理工大学青年基金项目 先秦篆体字体演变研究 张晓明 3726 山西大学青年基金项目 英语学术语篇中言据性的人际意义研究 杨林秀 3727 上海大学青年基金项目 一百六十年来的吴语语法历时类型学研究 林素娥 3728 上海对外贸易学院青年基金项目 英汉人体词语搭配建构的认知理据研究 程珊 3729 上海对外贸易学院青年基金项目 有些隐喻为什么不可能?—基于使用的汉英物性形容词隐喻拓展研究 唐树华 3730 上海交通大学青年基金项目 殷商甲骨文结构研究 陈婷珠 3731 上海交通大学青年基金项目 听觉注意控制能力与噪音背景下英语听力理解的关系杨小虎 3732 上海理工大学青年基金项目 对外宣传与翻译--外宣翻译的历时性研究 孔祥立 3733 上海师范大学青年基金项目 译者的文化身份与译者的职责 -20 世纪外籍代表译者英译中文著作之策略研究 王惠萍 3734 沈阳理工大学青年基金项目 俄汉语因果范畴对比研究 张雪莹 3735 首都师范大学青年基金项目 类型学视野中的汉语条件句研究 王春辉 3736 首都师范大学青年基金项目 现代汉语标记性构式研究 杨玉玲 3737 四川师范大学青年基金项目 英语世界的《孟子》研究 杨颖育 3738 苏州科技学院青年基金项目 中国英语词汇的语料库研究 周福娟 3739 苏州职业大学青年基金项目 汉语方位词句法语义演变史 施建平 3740 太原理工大学青年基金项目 基于动态语料库的新词语实时研究 刘荣 3741 皖西学院青年基金项目 《集韵》音切来源及其语音层次研究 刘华江 3742 温州大学青年基金项目 中古汉语附加式构词法研究 刘传鸿 3743 武汉工程大学青年基金项目 基于语义方法的汉语文本情感自动分析研究 杨江 3744 武汉理工大学青年基金项目 汉语动量构式的历时演变研究 金桂桃 3745 西安交通大学青年基金项目 中国学习者英语产出中的结构启动研究 王敏 3746 西安交通大学青年基金项目 名词性谓语句的认知研究 庞加光 3747 西安外国语大学青年基金项目 基于语料库实证分析的中日复合动词对比研究 陈曦 3748 西安外国语大学青年基金项目 基于 ERP 实验的隐喻认知神经机理研究 孙毅 3749 西安外国语大学青年基金项目 基于平行语料库的中国地方作家作品英译的翻译文体研究 ——以贾平凹作品英 译为个案 王瑞 3750 西北师范大学青年基金项目 基于语料库的楚简字义发展研究 雷黎明 3751 西藏大学青年基金项目 藏族学生英语学习过程中的语言迁移现象研究 李丽娟 3752 西华师范大学青年基金项目 1912-1949 年汉语新词新语研究 杨小平 3753 西南大学青年基金项目 甲骨文基本词汇分类整理与词义疏证 郭丽华 3754 西南大学青年基金项目 汉语方言合音现象研究 孙红举 3755 西南大学青年基金项目 走马楼吴简经济类词语研究 陈荣杰 3756 西南政法大学青年基金项目 再现与重构:社会转型期庭审话语中的法官身份构建研究 江玲 3757 湘潭大学青年基金项目 英汉数量名词短语的句法语义研究 吴庄 3758 孝感学院青年基金项目 现代汉语属性名词语义特征研究 许艳平 3759 新疆大学青年基金项目 维吾尔语动词形态自动生成系统研究 阿孜古丽·夏力甫 3760 延安大学青年基金项目 陕北方言文化与少数民族语言文化接触研究 孟万春 3761 燕山大学青年基金项目 中国古典文学四大名著汉法平行语料库的 创建及应用研究 刘超朋 3762 漳州师范学院青年基金项目 语素化:汉语单音词的历史传承与演化研究 陈练军 3763 肇庆学院青年基金项目 汉语对比范畴研究 严丽明 3764 浙江财经学院青年基金项目 基于楚系出土文献的上古楚方音史研究 杨建忠 3765 浙江财经学院青年基金项目 基于语料库的英语新词认知语义研究 邵斌 3766 浙江工商大学青年基金项目 古汉语变读构词问题的进一步探讨——变与不变、是语法还是词义 王月婷 3767 浙江工商大学青年基金项目 闽东话语音的比较研究 戴黎刚 3768 浙江工商大学青年基金项目 翻译价值的社会学阐释 俞佳乐 3769 浙江海洋学院青年基金项目 黄式三音韵学稿本整理与上古音研究 胡世文 3770 浙江理工大学青年基金项目 补缺假说对中介语石化现象的启示—基于大学生翻译和写作的纵向研究 杨柳 3771 浙江理工大学青年基金项目 礼貌原则在汉语中的语法化——以量范畴为例单宝顺 3772 浙江师范大学青年基金项目 域外汉文辞书《新撰字镜》研究 张磊 3773 浙江师范大学青年基金项目 二语写作评改中的语篇连贯性评价:基于向心理论的参数化实证研究 洪明 3774 浙江外国语学院青年基金项目 中古、近代汉语动词新义来源、演变的历史考察与认知分析 李倩 3775 郑州大学青年基金项目 “高邮王氏四种”汉语语义学研究 彭慧 3776 中国地质大学青年基金项目 中国大学生英语发音的国际可理解性研究 张伶俐 3777 中国地质大学青年基金项目 翻译对现代汉语发展的影响 -- 基于历时类比语料库 ( 1900-1949) 的研究 赵秋荣 3778 中国计量学院青年基金项目 江浙地区三峡移民语言的社会语言学研究 佟秋妹 3779 中南财经政法大学青年基金项目 清人小学注疏五种词源研究语料库建设及研究 甘勇 3780 中南大学青年基金项目 汉语疑问词的句法与语义不对称现象研究 薛小英 3781 中山大学青年基金项目 教学话语人际意义的多模态构建机制:基于英汉教学语境的比较研究 陈瑜敏 3782 中山大学青年基金项目 英德汉语中人际投射小句的系统功能类型学研究 辛志英 3783 中央民族大学青年基金项目 中国第一历史档案馆藏清代哈萨克语文献研究 杜山那里·阿不都拉西木 3784 重庆大学青年基金项目 项目学习法与英语专业学生批判性思维能力的培养 盘峻岚 3785 重庆邮电大学青年基金项目 汉英词序的认知功能对比研究 刘世英
个人分类: 语言学探讨 Linguistics|12185 次阅读|0 个评论
我的导师刘涌泉最近的短文
liwei999 2011-7-31 22:22
中国机器翻译之父,我的导师刘涌泉退休没事,也写点儿文字呢 刘涌泉老师50年代去苏联进修,学习机器翻译,当时世界上只有美国和苏联的科学家在搞机器翻译的研究。刘先生回国后就开展了这 方面的俄汉机器翻译实验,1959年成功上机调试,开创了这个学科。 他如今已是80-90高龄,退休在家。作为语言学家,他对急速变化的语言还是那么敏感,文字也很风趣,特转载于后。 刘老师和蔼可亲。逢年过节请学生到家里吃饭。 打电话说:你们过来吧,会宰鸡么?我家有活鸡。 不过,他上课语调特平缓,老北京腔调,下午正犯困呢,一堂课下来,我把大腿掐了无数次。一共就两个学生,围着他家小桌子坐着,阳光从窗户斜射过来,打瞌睡实在不像话啊。 机器翻译课上,就让我们做结构转换的标注,用所谓【中介成分】给句子标注,有点像语法课上画树,弄些复杂的英语句子,说你们的标注, 必须是机器可以模拟的,标注完了,翻译也就差不离了,譬如 【前介定B】 这个四元组是说这个介词短语翻译的时候要前置,它是定语,处于 B 层。这种简单甚至简陋的标注就是当年的MT中间语言,我们试验过很多句子,居然大体都可以对付,英汉翻译出来相当可读。这算是我的两位导师当年的发明创造。 刘老师的教导中,有一条我印象最深。在做标注的过程中,大多数手到擒来,我们英语系出身的人从来就擅长画树(diagramming),做这种标注跟玩似的。但也有卡壳的时候,于是请教刘老师。刘老师没有给答案,只是说:解构不出来,那人是怎么理解和翻译的呢?严格地说,当然有案例,人的认知过程很难算法化,人能翻译,不见得可以让机器翻译。但是我还是觉得他这句教导我受益良多。因为这是一种 mindset 的唤醒,促使我们琢磨人的认知过程如何形式化,哪怕不能完全形式化,也让我们明白卡在哪一个环节,常识、专业知识、还是什么?这种 mindset 跟了我一辈子,它实际上是一种反对智能神秘化的哲学,也就是我后来论过的 反伊莉莎(Anti-Eliza)效应 。 引用: 一个受众的反响 岁数大了没事干,不是看报,就是上网,或者听广播,看电视。还有时候记点东西或哼哼两句。 这样一来,我就成了一个听说读写看全方位的“受众”。 当今社会信息爆炸,怪事层出不穷,作一个合格的受众,真不容易。像最近许多国家“通涨inflation”,而美国却“通缩deflation”,我就弄不清是怎么回事。每年语言使用情况都有评选,今年中国使用最多的汉字是“涨”这个字。跟“涨”有关的词语出现了不少,您知道吗?“蒜你狠”、“豆你玩”、“姜你军”、“糖高宗”、“油他去”、“苹什么”。由此产生了“海囤族”,“省长抓米袋子”、“市长抓 菜篮子”。“族”是指一群人,除了“工薪族”、“银发族”、“月光族”、“丁克族”、“电脑族”、“啃老族”、“寄托族GTER”、“尼特族NEET”这些老字眼儿外,最近又出现了“蜗居族”、“蚁族”、“鼠族”、“傍傍族”、“网络淘课族”。带“族”字的词儿还可以,词义有褒有贬。如果带“门”字儿,那就坏了,没什么好事儿:“水门事件”、“召回门”、“艳照门”、“诈捐门”、“泼墨门”、“拉链门”,“罗生门”等等,不一而足。 随着“通胀”,字母词CPI(消费者物价指数)在各种媒体上随处可见。改革开放以来,中国话里吸收了不少外来语,CPI是利用汉语拼音字母转写的,另外也有用汉字写的, 如“秀”(show)、“晒”(share),等等。台湾最近报道的学校“霸凌”事件,也是来自外来语 bullying,不过为了显示语义而偏离了语音。这几年,国际上流行的一些词儿,也很有意思,如“金砖四国” (2010年12月又吸收了南非South Africa,成了“金砖五国BRICS”)。相对于这五国,最近出现了“欧猪五国” 。这些词的构成,除了音义,还加了诙谐。 另外,网语更厉害,什么“打酱油”、“俯卧撑”、“躲猫猫”,“我爸爸叫李刚”,每一个都是一个典故。据说,海外开了不少孔子学院,学汉语的已超过4000万人,真不知道他们碰到这些,受得了受不了。 最近,更有甚者,一些省市领导在给网友写贺信时,争先恐后地使用“灌水”、“拍砖”、“脖主”、“神马都是浮云”等网语*。这不仅会增加人们的学习负担,而且也会影响汉语规范化。真不知道这些领导怎么搞的。 *注释1)“灌水”=网上发帖子;2)“拍砖”=发表意见/骂人;3)“脖主”=微博作者;4)“神马都是浮云”=什么都不值得一提。
个人分类: 立委随笔|3918 次阅读|0 个评论
[转载]2011年度国家社科基金项目评审结果公布:语言学198项
carldy 2011-6-22 08:56
语言学(198项) 序号 项 目 名 称 负责人 所在省市 工作单位 项目类别 预期成果 计划完成时间 批准号 1 现代英汉法律大词典 肖云枢 重庆 西南政法大学 重点项目 工具书 2013-12-30 11AYY003 2 我国英语全程教育现状调查研究 杨敏 山东 山东师范大学 重点项目 研究报告 2013-8-16 11AYY001 3 人文社会科学汉英动态术语数据库的构建研究 魏向清 江苏 南京大学 重点项目 电脑软件 研究报告 2014-12-31 11AYY002 4 东汉佛经译者语言特点比较研究 方一新 浙江 浙江大学 重点项目 专著 专题论文集 2014-12-31 11AYY004 5 哈萨克语方言调查及有声数据库建设研究 武金峰 新疆 伊犁师范学院 重点项目 研究报告 电脑软件 2014-12-31 11AYY005 6 侗族大歌和侗语结构关系研究 杨通银 江苏 徐州师范大学 重点项目 专著 专题论文集 2014-8-31 11AYY006 7 西方汉语研究史: 16—20世纪西方汉语观之嬗变 姚小平 高校 北京外国语大学 一般项目 专著 2014-12-31 11BYY003 8 波兰语义学派与语义元语言理论方法比较研究 李炯英 江苏 南京邮电大学 一般项目 专著 2013-12-31 11BYY001 9 皮尔士语言学思想研究 曾凡桂 湖南 湖南大学 一般项目 专著 研究报告 2013-12-31 11BYY005 10 生物语言学概论:理论、方法及课题 宁春岩 天津 天津师范大学 一般项目 专著 2013-12-30 11BYY002 11 构式的论元实现——基于识解的压制研究 董成如 江苏 苏州大学 一般项目 专著 研究报告 2014-12-31 11BYY004 12 类型学视角下的英汉语序比较 席建国 浙江 浙江大学宁波理工学院 一般项目 专著 2014-12-30 11BYY017 13 汉英时间系统体现方式之系统功能语言学视角对比研究 何伟 高校 北京科技大学 一般项目 专著 专题论文集 2013-12-30 11BYY007 14 基于平行语音库的英汉韵律结构对比研究:语音、词汇、句法的交互 周卫京 江苏 江苏科技大学 一般项目 专著 2014-12-30 11BYY008 15 英汉语篇信息组织的句法过程 苗兴伟 高校 北京师范大学 一般项目 专著 专题论文集 2014-6-30 11BYY012 16 英汉语法中的高层转喻机制研究 陈香兰 高校 对外经贸大学 一般项目 专著 2014-5-30 11BYY010 17 英汉句式的类型学研究 邓云华 湖南 湖南师范大学 一般项目 专著 研究报告 2013-10-30 11BYY009 18 英汉语节奏类型对比研究 许希明 浙江 宁波大学 一般项目 专著 2014-3-31 11BYY011 19 德汉结果句式和非宾格句式的生成比较:投射与构式 常玲玲 江苏 南京大学 一般项目 专著 2014-6-30 11BYY006 20 英语的时间性特质与汉语的空间性特质研究 王文斌 浙江 宁波大学 一般项目 专题论文集 专著 2014-6-30 11BYY018 21 七月派翻译群体特征研究 桂清扬 浙江 浙江外国语学院 一般项目 专著 2014-6-30 11BYY019 22 高层次应用型翻译人才培养模式的探索与实践 仲伟合 广东 广东外语外贸大学 一般项目 专著 2014-6-30 11BYY014 23 广西壮学研究资料英译汇编研究 莫运夏 广西 桂林理工大学 一般项目 译著 2013-12-1 11BYY020 24 基于语料库的科技论文摘要的汉英翻译研究与对比研究 钱多秀 高校 北京航空航天大学 一般项目 专著 研究报告 2014-12-31 11BYY015 25 翻译教学理论、教学体系和教学模式的研究与翻译语料库的建设 邱鸣 北京 北京第二外国语学院 一般项目 专著 工具书 2014-6-1 11BYY013 26 古诗英译中西翻译流派比较研究 张保红 广东 广东外语外贸大学 一般项目 专著 2013-12-31 11BYY016 27 豫西三省过渡地带方言语法特点研究 张邱林 湖北 华中师范大学 一般项目 专著 2014-12-31 11BYY022 28 语言接触视域中湘北湘、赣语介词比较研究 胡云晚 湖南 湖南理工学院 一般项目 专著 2014-12-30 11BYY021 29 闽西北地区赣语和闽语的接触研究 龙安隆 江西 井冈山大学 一般项目 专著 2013-12-25 11BYY024 30 海南闽语语汇特征 符其武 海南 海南大学 一般项目 专著 2014-6-30 11BYY023 31 粤西湛茂地区粤、客、闽方言接触研究 邵慧君 广东 华南师范大学 一般项目 专著 2014-12-31 11BYY026 32 语言接触视角下的湖南赣语语音研究 李冬香 广东 韶关学院 一般项目 专著 2013-12-30 11BYY025 33 中国境外汉语云南方言调查研究 涂良军 云南 云南师范大学 一般项目 研究报告 2014-8-30 11BYY028 34 陕南方言的接触与历史层次研究 郭沈青 陕西 宝鸡文理学院 一般项目 专著 2014-12-30 11BYY027 35 泰国语言政策、外语竞争及其对汉语国际传播的启示研究 郭熙 广东 暨南大学 一般项目 研究报告 2013-6-30 11BYY029 36 新时期国家利益视角下的语言规划研究——中美个案对比 蔡永良 上海 上海海事大学 一般项目 专著 研究报告 2013-12-31 11BYY030 37 青海河湟地区多民族走廊语言生态调查研究 马梦玲 青海 青海师范大学 一般项目 专著 专题论文集 2014-12-31 11BYY031 38 上海市区方音演变的社会语言学研究 陶寰 上海 复旦大学 一般项目 专题论文集 研究报告 2014-12-31 11BYY032 39 汉语通用社交称谓语的嬗变与称谓原则研究 李树新 内蒙 内蒙古大学 一般项目 专著 2013-12-31 11BYY033 40 汉语网络语篇的互文性调查与研究 郑庆君 广东 广东外语外贸大学 一般项目 专题论文集 研究报告 2014-12-30 11BYY034 41 中国当代犯罪隐语数据库建设及犯罪隐语在刑事侦查中的应用研究 王卉 广东 广东警官学院 一般项目 研究报告 电脑软件 2014-12-31 11BYY035 42 听障学生自然语言学习研究 吕明臣 吉林 吉林大学 一般项目 专著 2014-12-31 11BYY038 43 从二语歧义加工角度看中国英语学习者英语能力的发展 赵晨 广东 广东外语外贸大学 一般项目 专著 研究报告 2013-12-31 11BYY036 44 汉语儿童早期范畴分类能力的发展研究 曾涛 湖南 湖南大学 一般项目 专题论文集 研究报告 2014-6-30 11BYY037 45 汉英双语者敌人语言语法加工的影响因素研究 陈宝国 高校 北京师范大学 一般项目 研究报告 2014-12-31 11BYY039 46 英语词汇对比研究:认知语义视角 卢卫中 山东 曲阜师范大学 一般项目 研究报告 2015-1-1 11BYY114 47 语言前耳聋者中国手语理解的神经机制研究 李强 天津 天津理工大学 一般项目 研究报告 专题论文集 2013-7-31 11BYY040 48 外语教师在线自主发展:反思、合作、研究 王琦 甘肃 西北师范大学 一般项目 研究报告 专题论文集 2014-6-20 11BYY041 49 中国英语教师专业发展环境研究 顾佩娅 江苏 苏州大学 一般项目 专题论文集 研究报告 2014-12-31 11BYY042 50 认知语言学与外语教学新理论研究 刘正光 湖南 湖南大学 一般项目 专著 2013-12-31 11BYY043 51 英语文学体验阅读与语言创新思维研究 黄远振 福建 福建师范大学 一般项目 专题论文集 研究报告 2013-12-22 11BYY044 52 基于实证方法的对外汉语教学模式创新研究 付玉萍 北京 首都师范大学 一般项目 研究报告 2013-12-31 11BYY045 53 基于作文语料库的韩国学生汉语中介语系统研究 肖奚强 江苏 南京师范大学 一般项目 专著 2014-8-31 11BYY048 54 汉语和非汉语母语者加工普通话声调的 ERP研究 王韫佳 高校 北京大学 一般项目 专题论文集 2014-12-31 11BYY047 55 国际汉语教学中的基本层次范畴词库建设研究 杨吉春 高校 中央民族大学 一般项目 专题论文集 电脑软件 2014-12-31 11BYY046 56 《史记》和《汉书》汉英平行语料库建设与术语英译检索系统的研发 李秀英 辽宁 大连理工大学 一般项目 研究报告 电脑软件 2014-12-30 11BYY049 57 多层偏误标注的国别化汉语中介语动态语料库建设与研究 胡晓清 山东 鲁东大学 一般项目 研究报告 电脑软件 2014-6-30 11BYY050 58 通用型汉语中介语语料库标注规范研究 张宝林 高校 北京语言大学 一般项目 研究报告 2013-9-30 11BYY054 59 基于规则的复句关系标记自动标识方法和实现策略研究 胡金柱 湖北 华中师范大学 一般项目 专题论文集 电脑软件 2013-12-31 11BYY052 60 基于平行语料库的术语自动抽取及双语术语词典编纂研究 邓耀臣 辽宁 大连海事大学 一般项目 专著 电脑软件 2013-12-30 11BYY053 61 服务信息检索的自然语言 熊文新 高校 北京外国语大学 一般项目 研究报告 2014-6-30 11BYY051 62 商务英语学习词典研编 何家宁 广东 广东外语外贸大学 一般项目 专著 工具书 2014-6-30 11BYY055 63 明清以来徽语的发展演变研究──徽语区抄本方言韵书音系研究 周赛华 湖北 湖北大学 一般项目 专著 专题论文集 2014-12-30 11BYY058 64 汉字今音审订研究——以 “《辞源》 再修订” 为平台 蔡梦麒 湖南 湖南师范大学 一般项目 专著 2014-10-30 11BYY057 65 汉语音韵学百年学术源流 张玉来 江苏 南京大学 一般项目 专著 2014-12-31 11BYY056 66 现行盲文隐性标调问题研究 钟经华 北京 北京联合大学 一般项目 专题论文集 工具书 2013-9-30 11BYY095 67 建国以来的汉字异体字整理研究 邵文利 山东 山东大学 一般项目 专著 工具书 2013-12-31 11BYY059 68 宋元以来契约文书俗字研究 储小旵 安徽 安庆师范学院 一般项目 专著 2014-12-31 11BYY060 69 汉语外来词的历时发展演变研究 原新梅 辽宁 辽宁师范大学 一般项目 专著 研究报告 2013-12-31 11BYY064 70 汉语农业词汇历时演变与共时分布研究 李润生 高校 北京语言大学 一般项目 专著 研究报告 2013-9-30 11BYY063 71 汉语核心词的历史与现状研究 汪维辉 浙江 浙江大学 一般项目 专著 2013-12-31 11BYY062 72 清代藏学汉文文献词汇研究 王宝红 西藏 西藏民族学院 一般项目 专著 2013-6-30 11BYY065 73 汉译佛经词语的佛教化和本土化演变研究 杨同军 甘肃 西北师范大学 一般项目 专著 2013-7-1 11BYY061 74 敦煌西域所出法制文书语言研究 王启涛 四川 西南民族大学 一般项目 专著 工具书 2014-12-31 11BYY067 75 清以前汉语音训材料汇编与研究 吴泽顺 浙江 浙江师范大学 一般项目 专著 2014-5-30 11BYY070 76 汉语医学名物词研究 王育林 高校 北京中医药大学 一般项目 专著 2013-12-31 11BYY068 77 《考工记》名物新证 汪少华 上海 复旦大学 一般项目 专著 2014-8-30 11BYY066 78 黑水城文献语言研究 张秀清 甘肃 西北民族大学 一般项目 专著 2013-12-30 11BYY069 79 上古汉语指示代词的语用学研究 洪波 北京 首都师范大学 一般项目 专著 2013-12-31 11BYY096 80 汉语构式语法化的历时研究 龙国富 高校 中国人民大学 一般项目 专著 2014-9-30 11BYY072 81 汉语 “X来”式双音词词汇化及语法化研究 陈昌来 上海 上海师范大学 一般项目 专著 2013-12-31 11BYY071 82 基于语料库的历时构式语法研究 文旭 重庆 西南大学 一般项目 专著 2013-12-31 11BYY073 83 《左传》篇章零形回指研究 殷国光 辽宁 大连理工大学 一般项目 专著 2014-6-30 11BYY074 84 语法化视野下的介词更新研究 何洪峰 湖北 华中科技大学 一般项目 专著 2014-12-31 11BYY075 85 汉语疑问词形态——句法界面研究 张和友 高校 北京师范大学 一般项目 专著 专题论文集 2014-12-31 11BYY077 86 汉语非自足构式蕴含的句法语用机制 陈一 黑龙江 哈尔滨师范大学 一般项目 专著 2013-6-30 11BYY076 87 事件链框架固化为汉语动词动相结构的规律的研究 左思民 上海 华东师范大学 一般项目 研究报告 2014-9-30 11BYY078 88 汉语使成表达的类型学研究 项开喜 社科院 中国社科院 一般项目 专著 其他 2013-12-31 11BYY081 89 汉语谓词性主语与谓词性宾语的不对称现象研究 张德岁 安徽 宿州学院 一般项目 专著 2013-12-31 11BYY082 90 语言结构异态范畴的功能表现研究 王海峰 高校 北京大学 一般项目 专著 研究报告 2013-12-31 11BYY087 91 汉语普通话儿童句末助词习得研究 杨小璐 高校 清华大学 一般项目 专著 2013-12-30 11BYY080 92 现代汉语类词缀的定量与定性研究 曾立英 高校 中央民族大学 一般项目 专著 专题论文集 2013-12-31 11BYY085 93 现代汉语时间表述中的时间量研究 匡鹏飞 湖北 华中师范大学 一般项目 专题论文集 2014-6-30 11BYY086 94 汉语表达列举义的语法形式研究 丁加勇 湖南 湖南师范大学 一般项目 专著 2013-10-30 11BYY079 95 现代汉语句子复杂化问题的研究 马清华 江苏 南京大学 一般项目 专著 专题论文集 2014-6-30 11BYY084 96 现代汉语结构助词隐现规律及其分合理据研究 徐阳春 江西 南昌大学 一般项目 专著 专题论文集 2014-6-30 11BYY083 97 语典编纂的理论与实践 温端政 山西 山西省社科院 一般项目 专著 2013-5-30 11BYY089 98 词典释义的完备性描述研究 王馥芳 上海 华东师范大学 一般项目 专著 2014-1-30 11BFX142 99 现代汉语辞格语料库建设研究 曾毅平 广东 暨南大学 一般项目 研究报告 电脑软件 2014-12-30 11BYY090 100 郑韩故城出土东周陶文整理研究 樊温泉 河南 河南省文物考古研究所 一般项目 专著 研究报告 2014-6-30 11BYY092 101 西周青铜重器铭文集释(西周早期) 周宝宏 天津 天津师范大学 一般项目 专著 2013-12-30 11BYY091 102 汉语句法中的指称问题研究 王红旗 天津 南开大学 一般项目 专题论文集 2014-7-1 11BYY093 103 汉语语篇衔接连贯规律的描写与解释研究 曹德和 安徽 安徽大学 一般项目 专著 专题论文集 2014-12-30 11BYY094 104 濒危满语的调查描写及其与清代满文的历史比较研究 赵杰 宁夏 北方民族大学 一般项目 专著 工具书 2014-6-30 11BYY097 105 朝鲜语动态电子腭位 和语音数据库以及相关研究 李英浩 吉林 延边大学 一般项目 研究报告 电脑软件 2014-6-30 11BYY111 106 中国人口较少民族语言实地调查——保安语使用现状与演变研究 哈申格日勒 内蒙 内蒙古大学 一般项目 专著 2014-12-31 11BYY101 107 撒拉语参考语法 米娜瓦尔·艾比布拉 高校 中央民族大学 一般项目 专著 2013-12-31 11BYY099 108 基于语料库的维吾尔语语篇回指研究 帕提古力·麦麦提 甘肃 西北民族大学 一般项目 研究报告 2014-12-31 11BYY098 109 中国俄罗斯族语言研究—— 以新疆、内蒙俄罗斯语田野调查材料为依据 白萍 高校 中央民族大学 一般项目 专著 2014-4-30 11BYY100 110 吐蕃碑刻汇编译校注 巴桑旺堆 西藏 西藏自治区社科院 一般项目 专著 2013-12-10 11BYY102 111 苗语台江话参考语法 姬安龙 贵州 贵州省民族研究所 一般项目 专著 2013-12-20 11BYY105 112 基于开放式数据库的古壮字字符与文献的搜集整理与研究 林亦 广西 广西大学 一般项目 研究报告 电脑软件 2014-12-31 11BYY103 113 云南少数民族语言有声数据库建设研究 和丽峰 云南 云南省民语委 一般项目 研究报告 2013-6-30 11BYY106 114 黎语方言之比较研究 王彩 海南 琼州学院 一般项目 专著 2013-12-20 11BYY104 115 中缅跨境孟高棉语研究 陈国庆 社科院 中国社科院 一般项目 专著 专题论文集 2014-12-31 11BYY107 116 壮语语法化研究 黄平文 广西 广西民族大学 一般项目 专著 2014-6-28 11BYY108 117 桂西南地区多语接触研究 卞成林 广西 百色学院 一般项目 研究报告 2014-9-30 11BYY110 118 贵阳周边地区苗、布依、汉语接触研究 龙海燕 贵州 贵州民族学院 一般项目 专著 2014-6-30 11BYY109 119 深层回指的语篇表述理论 消解失效问题及其解决研究 张旭红 黑龙江 哈尔滨师范大学 一般项目 专著 研究报告 2013-6-30 11BYY113 120 英语名词词组组合规律认知阐释研究 秦裕祥 湖南 湖南师范大学 一般项目 专著 2013-10-30 11BYY115 121 论元体现构式进路和词汇进路的互补研究 程琪龙 上海 上海大学 一般项目 专著 电脑软件 2013-12-28 11BYY112 122 语篇 “文化性”的理论建构研究 赵劲 上海 同济大学 一般项目 专著 2014-9-30 11BYY117 123 基于语料库的军事英语综合研究 王岚 军队 解放军外国语学院 一般项目 专题论文集 电脑软件 2014-12-30 11BYY126 124 汉英报纸新闻中转述言语的语篇和语用功能比较研究 辛斌 江苏 南京师范大学 一般项目 专著 2014-12-31 11BYY116 125 日语句群研究与应用研究 陈百海 黑龙江 黑龙江大学 一般项目 专著 2014-5-30 11BYY120 126 基于话语礼貌理论的日语敬语教学方略研究 毋育新 陕西 西安外国语大学 一般项目 专著 2014-9-30 11BYY118 127 清末报纸与译著中的日语借词研究 朱京伟 高校 北京外国语大学 一般项目 专著 研究报告 2014-12-31 11BYY119 128 俄语功能交际语法研究 郭淑芬 高校 北京外国语大学 一般项目 专著 2014-3-1 11BYY124 129 俄罗斯功能语法理论与西方系统功能语言学对比研究 姜宏 上海 复旦大学 一般项目 专著 专题论文集 2014-12-31 11BYY122 130 俄汉语中的 “级次”与“标准”研究 杨家胜 黑龙江 哈尔滨师范大学 一般项目 专著 2013-6-30 11BYY121 131 俄语动词隐喻机制研究 彭玉海 黑龙江 黑龙江大学 一般项目 专著 2014-5-30 11BYY123 132 俄语话语词的多维研究 许宏 上海 上海外国语大学 一般项目 专著 2014-6-30 11BYY125 133 认知心理范式下的俄罗斯语言学研究 郅友昌 军队 解放军外国语学院 一般项目 专著 2013-12-30 11BYY127 134 汉藏语系语言话题结构的类型学研究 李洁 云南 云南师范大学 青年项目 专著 2013-6-30 11CYY002 135 汉藏语连动结构的对比研究 彭国珍 浙江 浙江工业大学 青年项目 专著 2013-12-31 11CYY001 136 局域理论下英汉位移现象的对比研究 张孝荣 安徽 安徽师范大学 青年项目 专著 2013-12-31 11CYY003 137 英汉乏词义构式的认知对比研究 仇伟 山东 济南大学 青年项目 专著 2014-12-31 11CYY004 138 西学翻译与晚清 “救国良策”的探索 卢明玉 高校 北京交通大学 青年项目 专著 研究报告 2014-6-30 11CYY006 139 基于语料库的英汉翻译对当代汉语影响的研究( 1980-2010) 朱一凡 上海 上海交通大学 青年项目 专著 2014-12-31 11CYY005 140 基于语料库的翻译认知模型研究 胡显耀 重庆 西南大学 青年项目 专著 2014-7-1 11CYY010 141 专用英汉互译机助评分系统的研制 江进林 高校 对外经贸大学 青年项目 专题论文集 研究报告 2013-12-31 11CYY007 142 《聊斋志异》英译研究 李海军 湖南 湖南文理学院 青年项目 专著 2013-12-30 11CYY008 143 中国当代文学在法国的翻译与接受研究 杭零 上海 华东师范大学 青年项目 专著 2013-12-31 11CYY009 144 基于实验语音学的湖南方言发声态类型研究 彭建国 湖南 湖南大学 青年项目 专著 2013-12-31 11CYY011 145 黄河沿线方言的社会与地理 研究 周晨萌 高校 对外经贸大学 青年项目 专著 2013-12-30 11CYY013 146 广西汉语方言同源词研究 唐七元 广西 广西大学 青年项目 专著 专题论文集 2013-12-31 11CYY012 147 陕西关中西府和甘肃陇东(平凉、庆阳)方言连读变调研究 吴媛 陕西 陕西师范大学 青年项目 专著 2013-12-31 11CYY014 148 中国少数民族语言互联网络发展状况的研究 王志娟 高校 中央民族大学 青年项目 专著 2013-12-31 11CYY016 149 刑侦领域中汉语方言与语言规范化研究 黄萍 黑龙江 黑龙江大学 青年项目 研究报告 2014-5-30 11CYY015 150 新疆维吾尔语言态度调查研究 卡米力·阿不都克力木 新疆 新疆大学 青年项目 研究报告 2014-12-31 11CYY018 151 城镇化进程中新疆少数民族语言使用与语言适应情况调查研究 刘宏宇 新疆 新疆师范大学 青年项目 研究报告 2014-6-30 11CYY017 152 自媒体影响下语言文字热点舆情量化研究及语言舆情库建设 张挺 高校 教育部 青年项目 研究报告 电脑软件 2013-5-31 11CYY019 153 再论聋人手语的语言地位——基于手语符号任意性的实验研究 刘润楠 北京 首都经贸大学 青年项目 研究报告 2014-6-30 11CYY020 154 中国大学生英语产出中的母语迁移历时研究 蔡金亭 军队 解放军外国语学院 青年项目 专著 2013-12-31 11CYY021 155 留学生汉语词汇学习的认知机制研究 李利 广东 华南师范大学 青年项目 专题论文集 2014-6-30 11CYY023 156 汉语儿童语言发展障碍研究 梁丹丹 江苏 南京师范大学 青年项目 专著 专题论文集 2013-12-31 11CYY022 157 英语师范生教研能力培养一体化模式构建研究 黄慧 江西 江西师范大学 青年项目 专著 研究报告 2014-6-30 11CYY024 158 基于语料库的蒙英双语专业大学生英语写作能力发展研究 张汉彬 甘肃 西北民族大学 青年项目 专著 2014-12-31 11CYY025 159 语块教学策略对提高学生会议口译能力的实证研究 王建华 高校 中国人民大学 青年项目 研究报告 2014-5-1 11CYY026 160 汉语口语测试任务难度研究 聂丹 高校 北京语言大学 青年项目 专著 2013-5-31 11CYY027 161 非汉字文化圈国家学生错别字数据库建设及错字类型研究 戴媛媛 高校 北京语言大学 青年项目 电脑软件 专题论文集 2013-12-20 11CYY029 162 不同母语背景的留学生汉语句法发展模式研究 常辉 上海 上海交通大学 青年项目 专题论文集 2014-6-30 11CYY028 163 基于隐喻计算的词义自动发现研究 唐旭日 湖北 武汉纺织大学 青年项目 专题论文集 电脑软件 2014-6-30 11CYY030 164 基于语义方法的汉语文本情感自动分析研究 杨江 湖南 湖南科技大学 青年项目 研究报告 电脑软件 2013-12-15 11CYY032 165 基于语言特征的中文意见挖掘研究 张莉 江苏 南京大学 青年项目 专题论文集 电脑软件 2013-12-31 11CYY031 166 马礼逊《汉英英汉词典》研究 杨慧玲 高校 北京外国语大学 青年项目 专著 2014-3-1 11CYY033 167 古重纽的类型及其历史演变 李秀芹 河南 郑州航空工业管理学院 青年项目 专著 研究报告 2014-9-30 11CYY034 168 宋代江浙吴音研究 钱毅 湖南 邵阳学院 青年项目 专题论文集 研究报告 2014-12-31 11CYY035 169 重韵及其相关问题研究 马德强 江苏 扬州大学 青年项目 专著 2014-12-31 11CYY036 170 当代大型字典未收字整理与考释研究 梁春胜 河北 河北大学 青年项目 专著 2013-12-30 11CYY037 171 晋方言词汇史研究 白云 山西 山西大学 青年项目 专著 研究报告 2014-12-31 11CYY038 172 法律专科词语的词义属性及释义研究 李智 河北 河北师范大学 青年项目 专著 2014-9-30 11CYY039 173 中古文献异文的语言学考察 真大成 浙江 浙江大学 青年项目 专著 2013-12-31 11CYY052 174 汉语常用构式的词汇化和语法化研究 雷冬平 湖南 湘潭大学 青年项目 专著 2014-12-30 11CYY040 175 汉语受事话题句的历史演变及其相关问题研究 袁健惠 山东 烟台大学 青年项目 专题论文集 研究报告 2014-6-30 11CYY041 176 基于大规模语料的北京话语法系统历时演变研究 刘云 高校 对外经贸大学 青年项目 研究报告 2014-5-1 11CYY042 177 现代汉语的依附性否定句及其语用功能 郝琳 北京 北京第二外国语学院 青年项目 专著 专题论文集 2014-5-31 11CYY044 178 汉语时间标记成分的羡余功能研究 金晓艳 吉林 东北师范大学 青年项目 专著 2014-7-1 11CYY043 179 现代汉语动趋式致使性研究 周红 上海 上海财经大学 青年项目 专著 2014-6-30 11CYY045 180 形容词性同义词群的基本词与释义元语言研究 于峻嵘 河北 河北师范大学 青年项目 专著 2013-12-20 11CYY047 181 汉语词汇存在状态的层级研究 赵川兵 江苏 苏州科技学院 青年项目 专著 2014-6-30 11CYY046 182 殷墟子卜辞的文本整理与字词研究 姚萱 上海 复旦大学 青年项目 专著 2014-6-30 11CYY049 183 战国各系文字字词关系比较研究 周波 上海 复旦大学 青年项目 专著 2014-3-1 11CYY050 184 商周金文辞类纂 秦晓华 广东 华南师范大学 青年项目 专著 2014-6-30 11CYY048 185 现代汉语话题标记的功能研究 李秉震 北京 首都师范大学 青年项目 专题论文集 2013-12-31 11CYY051 186 《现代蒙古语名词义素词典》的设计与开发研究 林八鸽 内蒙 内蒙古民族大学 青年项目 专著 电脑软件 2013-12-30 11CYY053 187 基于语料库统计分析的现代维吾尔语名词研究 阿依克孜·卡德尔 新疆 新疆大学 青年项目 研究报告 电脑软件 2014-12-30 11CYY054 188 首部藏文全集类《目录加持速降》翻译校勘研究 先巴 机关 中国民族图书馆 青年项目 专著 2013-6-30 11CYY056 189 藏语甘孜话现状与历史研究 燕海雄 社科院 中国社科院 青年项目 专著 2012-12-31 11CYY055 190 拉祜族苦聪话调查与比较研究 常俊之 山东 聊城大学 青年项目 专著 2014-11-30 11CYY057 191 基于语言类型差异的汉维语言接触研究 杜兆金 兵团 石河子大学 青年项目 专著 研究报告 2013-12-31 11CYY058 192 语言接触对聋人手语发展演变的影响研究 郑璇 重庆 重庆师范大学 青年项目 研究报告 2013-12-30 11CYY059 193 话语标记语的社会语用研究 郑群 机关 中国科学院 青年项目 专著 2014-12-31 11CYY060 194 英语学术语篇的评价资源研究 张大群 江西 南昌大学 青年项目 专著 专题论文集 2014-12-30 11CYY061 195 认知语言学角度的日汉语省略对比研究 朱立霞 军队 解放军外国语学院 青年项目 专著 2013-12-31 11CYY062 196 日语助数词的历时考察与认知研究 王鼎 江苏 苏州大学 青年项目 专著 研究报告 2014-12-31 11CYY065 197 面向信息处理的俄汉语副词对比研究 靳铭吉 黑龙江 黑龙江大学 青年项目 专著 2014-5-30 11CYY064 198 俄汉机器翻译系统中 “C+N5” 结构的语义识别 孙爽 黑龙江 东北林业大学 青年项目 专著 专题论文集 2014-5-30 11CYY063
个人分类: 语言学探讨 Linguistics|4444 次阅读|0 个评论
自然语言处理研究国际文献分析报告 1960-2011年
热度 1 xupeiyang 2011-6-3 09:09
自然语言处理是 计算机 科学领域与 人工智能 领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融 语言学 、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的 计算机系统 ,特别是其中的 软件系统 。因而它是计算机科学的一部分。 Natural Language Processing http://www.gopubmed.org/web/gopubmed/1?WEB1mOWEB10O00d000j10020001000h00100090000 Top Terms Publications ‍ Language 1,251 ‍ Humans 1,105 ‍ Nature 1,049 ‍ Algorithms 735 ‍ Evaluation Studies as Topic 632 ‍ Knowledge 553 ‍ Database Management Systems 398 ‍ Patients 393 ‍ Medical Records Systems, Computerized 391 ‍ Genes 332 ‍ Computational Biology 267 ‍ Proteins 266 ‍ Electrons 238 ‍ Electronics 233 ‍ Medical Records 231 ‍ Learning 215 ‍ learning 206 ‍ Technology 197 ‍ United States 166 ‍ Biomedical Research 160 附件 信息分析报告 Natural Language Processing.docx
个人分类: 信息分析|1783 次阅读|0 个评论
[转载]廖美珍教授的学术情思分享:语言学话题
carldy 2011-6-2 17:08
【备注】 今天浏览了华中师范大学外国语学院廖美珍教授的个人主页,有许多探讨语言的话题蛮有意思的,特对几则《学术情思》引录如此,供大家欣赏。如有不同观点,可以登录廖教授个人主页 http://www.liaomz.com 。 学术情思:为什么要学一点语言哲学 http://www.liaomz.com/article-16-306.aspx 我们不一定要当语言哲学家。我们也不一定要专门从事语言哲学 研究,但是一定有必要学一点语言哲学。理由如下: ( 1 )人活一生,需要一种世界观,或者人生观。同理,我们研究语 言,特别是把研究语言作为自己的生涯,也需要一种语言观。这种语言观会帮助(使)我们形成自己对语言的观点,指导我们从事语言研究。因此,我们即使不专门 研究语言哲学,但也要学习一点语言哲学。因此,学习语言哲学的目的,不只是为了了解语言哲学这门学科,更重要的是形成自己的语言哲学观。 ( 2 )语言学大师都是有自己语言观的人。索绪尔有自己的语言哲学 观,乔姆斯基有自己的语言哲学观 …… 如果我们要做出有个人体系的、独特的、成气候的语言研究,就必须有自己的语言观。 ( 3 )如果我们要能够持之以恒地研究语言,也要有语言观的支持。 人生不会一帆风顺的,人的职业生涯也不会是一帆风顺的。语言观如同人生观一样,是人生的一种支撑和信念,能帮助人克服困难,不断前进。 ( 4 )学习一点语言哲学,可以帮助我们更好地把握现有的一些主要 的语言学理论。因为一些语言学理论就来自语言哲学家的研究成果。 ( 5 )学习语言哲学,有四个特别重要的问题要回答或者面对: ( A )本体论问题:语言究竟是什么? 我们每个严肃从事语言研究的人,都得面对这个问题,都得回答 这个问题。 ( B )实体论问题:我们研究语言的什么? 由第一个问题会自然而然地产生第二个问题:我们研究语言的什 么? ( C )方法论问题:我们怎么研究语言? 第二个问题自然又导致第三个问题:我们如何研究语言? ( D )我们为语言学研究做出什么贡献? 最后,我们不得不面对一个非常重要的问题:我们对语言的研究 做出了什么贡献? http://www.liaomz.com 学术情思:我的语言研究的语言哲学观照 人是什么?人是语言。语言是什么?语言是人。研究语言就是研究人。语言不是人的工具。只有当人不把语言当作工具的时候,人才成为真正意义上的人。当人把语言当作工具的时候,人以为自己是主人,其实人是奴隶。当人无论是在显意识还是潜意识中都不把语言当作工具的时候,人 才能真正地得到解放,否则人永远是奴隶。只有当人无论是在显意识还是在潜意识中都不把语言当作工具的时候,人文精神才能真正地实现。解决语言工具性的问题,才是语言哲学研究的最高成就。把语言看作工具永远无法得到语言和语言研究的真谛。迄今为止,哲学研究的最大成就和哲学语言转向的根本意义在于确立语言的本体地位。哲学和哲学语言转向的最大不足——无论是在理论层面还是实践层面——在于还没有彻底地批判分析、摆脱语言工具论。哲学语言转向的根本任务就是推进这一研究,加速这一摆脱的过程和彻底性。 学术情思 : 再论 “ 人是语言,语言是人 ” 2010 年 12 月 1 日 星期三 有朋友光临我的抑扬斋,并在“我的语言研究的语言哲学观照”夜话后留言。斋主表示感谢。兹择留言三 个,移置于斯,一并简复如下。 留言 1 :不知所云。人是什么?人是语言?语言是什么?语言是人?想好再说出来, ok? 基点错了,你总是不知道自己再说什么! 留言 2 :“语言工具论”这个概念过于宽泛,其内涵应当加以限定 或分类,可以将它分为多个层次,比如人与人之间的交际工具、不同种族之间的跨语言工具等等;我们是否可以把语言视为另外一种工具——使人得以出场的工具;人和语言和人地位平行之间,二者不存在奴役和被奴役的关系。廖老师意下如何? 留言 3 : 语言在任何时候都不仅仅只是工具。但要摆脱语言工具论绝非易事。在批判语言工具论的时候,不可避免地会用到语言,我们似乎在批判着我们正在使用的东西。我 一直很欣赏中国的语言观 ---- 言外之意。 重述我的观点:“人是语言,语言是人”亦即语言非工具。强调的是人和语言的不可分离性、不可分裂性、统(同)一性。 我坚定不移地认为,这是语言哲学研究和发展的方向、未来和希望。 人和语言的统(同)一性问题要从哲学(语言哲学)的层面去理解。否则就会让人觉得不可思议(比如留言一)。其实,凡是认真读过或者研究过语言哲学的人,应该知道不少语言哲学家表达过类似的观点。学者之间学术研讨,如果不能在同一个平台上进行,或者从同一个层面出发并展开,往往就有很多麻烦,甚至令人哭笑不得。 语言使人得以出场 —— 其实这是语言哲学上的一种观点 —— 因此,语言就是一种工具(留言三)。这可以说是最高层面(哲学层面)的语言工具论。遗憾的是,我仍然不能同意这一说法。既然反对和批判语言工具论,就要贯彻到底。 我们批评的是语言工具观,或者语言工具论,而不是批评语言。如果我们批评语言,那就是批评我们自己,自己跟自己过不去。其实,我们做不到这一点。 批评语言工具论,不仅具有(语言)哲学上的意义和价值,也有重要的应用价值和现实意义。这一点我会专门撰文论述。遗憾的是,因为太忙,早已拉好框架的文章一直没能充实和丰满。 学术情思 : 三论 “ 人是语言,语言是人 ” 2010 年 12 月 3 日 星期五 http://www.liaomz.com/article-16-439.aspx “人是语言,语言是人”意味着:研究人要研究语言,研究语言就是研究人——人的生命、人的气息、人的思维、人的精神、人的活动、人的生存现状、人的存在方式、人的 ------ 在这个意义上说,语言学是所有学科当中最富有人文精神和生命气息的学科,语言学是人文学科之皇冠 , 或者皇冠上最明亮的和耀眼的明珠。 “人是语言,语言是人”,还意味着:就人的个体而言,只有当人和语言都死亡的时候,我们才能够说,这个人真的死亡。如果,语言存在,人便活着。在这个意义上说,上帝没有死,从来没有死;作者没有死,从来没有死。我们借此提醒那些解构主义者:小心点!上帝正盯着你呢!作者正盯着你呢! “人是语言,语言是人”对我本人从事语言研究的指导意义在于:我更喜欢研究使用中的语言,动态的语言,活生生的语言,你会觉得语言像一个可爱极了的活蹦乱跳的小精灵:你好像时刻能够抓住他,但又总是抓不住。 学术情思:法律语言学的法哲学观照 研究语言和语言学,需要一种语言哲学的观照。同样,研究法律语言和法律语言学, 也需要一种法哲学的指导。指导法律语言(学)研究的法哲学应该是这样的: 人类从无法的社会走来,人类必将回归无法的社会,这是不以任何人的意志为转移的历史规律(当然这不是回到起点,而是在更高层面的回归)。最好的社会不是法治的社会,而是无需法治的社会。和谐社会不是法治社会,而是无需法治的社会。立法是为了废法——立法同时就是废法;司法是为了废法——司法同时就是废法;执法是为了废法——执法同时就是废法。法治是为了走向无需法治。所以,立法者、司法者、执法者、法学家不是企图如何使法律永恒,而是努力让法律尽快死亡和消失——越快越好。法律和 法律人的使命是彻底埋葬自己、埋葬法律,埋葬自己的行业——越快越好。如果我们的法律人从这一最高 层面的法哲学的角度去看待法、研究法、实践法,我们这个多灾多难的世界才真的有希望,我们的这个丑陋的世界一定会一天比一天更美好! 法律语言(学)研究的一个重要目的和宗旨,就是帮助立法者通过立法有效地而且更 快地废掉法律,帮助司法者通过诉讼活动有效地而且更快地废掉法律,帮助执法者通过执法有效地而且更快地废掉法律 。
个人分类: 语言学探讨 Linguistics|2221 次阅读|0 个评论
语义标注软件及其网址Annotation Tools
热度 1 carldy 2011-5-25 22:51
这里链接的是部分语义标注软件及其网址,供大家参考。 引用请注明出处: http://annotation.semanticweb.org/annotationtool_view Annotation Tools The best known tools around annotation and authoring are listed here. If you have a new tool please let us know.Simply write a mail and tell us about it. SHOE Knowledge Annotator Annotea Annozilla SMORE Yawas Melita GATE Briefing Associate SemanticWord Semantic Markup Plug-In for MS Internet Explorer OntoMat Annotizer KIM Semantic Annotation Platform MnM
个人分类: 个人收藏 My favorites|4048 次阅读|0 个评论
匠人做好了,就是鲁班,就是爱迪生,就是造福人类
热度 3 liwei999 2011-5-25 19:10
回答:把立委语言学家的帽子给扔了,换一个,语言学匠 语言学匠的帽子甚好,恰如其分。 作者: 立委 日期: 05/23/2011 12:01:45 在多少年的等待以后, 汉语的电脑处理已经提到了我的日程表上。英语已经做烦了,反正没有人比我做得好,再往下做既没有多少余地(diminishing returns),也没有足够的挑战。没劲儿! 老板说,肯定会上马,先做可行性研究。正式上马前的问题是谁买单合适?DoD,还是跨国公司?这是老总要厘清的事儿。 甚好,不至于到退休了后悔没有机会伺候汉语。 回答: 那就好好戴着,看以后有没有机会摘帽 才不要!宁做无产阶级的匠,不做资产阶级的家。 作者: 立委 (*) 日期: 05/23/2011 18:00:04 匠人做好了,就是鲁 班,就是爱迪生,就是造福人类。 家呢?那谁说了,天上下一滴雨,也会砸在一个名家的头上。家做稳了,这个世界上无非又增加了一个大忽悠儿。 教授满地走,工匠贵如油。
个人分类: 其他杂碎|2723 次阅读|1 个评论
Google告诉你词与物的历史Books Ngram Viewer
gothere 2011-5-13 01:50
Books Ngram Viewer 上线了,不仅有http://ngrams.googlelabs.com/可供在线检索,还有大量的data可供下载。 测试了几个词,真是很有趣,首先是“机器翻译”,1966年的alpac报告果然使得词频下降,很准。而后几经周折,起伏均合于历史。 然后是“语言学”,蛮好,现代语言学的发展可见一斑 然后是北京的翻译,英文翻译此消彼长啊。 没错,汉语等多种语言皆可检索,看看大名鼎鼎的日语外来词“同志”。先有后无,再从日本传入,厉害厉害。 最后见识下百年来伟大的“中国制造”
个人分类: Computational Linguistics|8384 次阅读|0 个评论
[转载]2011年SSCI收录语言学学科期刊155种目录
tsgxxb 2011-5-12 16:17
2011年SSCI收录语言学学科期刊155种.doc 2011年SSCI收录语言学学科期刊155种.doc 来自万跃华老师的博客 http://blog.sciencenet.cn/home.php?mod=spaceuid=57081do=blogid=438305 SSCI 、 AHCI 均收录语言学期刊, 2011 年 SSCI 收录语言学学科期刊 155 种( 2008 年 SSCI 收录语言学学科期刊 71 种),其中被 SCI 、 SSCI 、 AHCI 共同收录期刊 3 种如 Computational Linguistics 《计算语言学》、 Natural Language Engineering 《自然语言工程》、 Phonetica 《语音学》, SCI 、 SSCI 共同收录期刊 3 种, SSCI 、 AHCI 共同收录期刊 117 种。详细情况请见附件。 最近2年 Thomson Reuters新收录了许多语言学期刊。 2009 年 JCR 收录语言学学科期刊 93 种,其中影响因子 3 以上有 1 种、影响因子 2 以上有 7 种、影响因子 1.5 以上有 8 种,语言学期刊影响因子前 10 名期刊如下: 1. Journal of Memory and Language 《记忆与语言杂志》, ISSN:0749-596X , 1962 年创刊, 2009 年影响因子 3.221 、 5 年影响因子 3.814 2. Brain Language 《大脑与语言》, ISSN:0093-934X , 1974 年创刊, 2009 年影响因子 2.937 、 5 年影响因子 3.105 3. Language Learning Technology 《语言学习与技术》, ISSN: 1094-3501 , 2009 年影响因子 2.531 、 5 年影响因子 3.575 4. Journal of Speech Language and Hearing Research 《言语、语言与听觉研究杂志》, ISSN:1092-4388 , 1958 年创刊, 2009 年影响因子 2.347 、 5 年影响因子 2.714 5. Computational Linguistics 《计算语言学》, ISSN:0891-2017 , 1974 年创刊, 2009 年影响因子 2.212 、 5 年影响因子 3.722 6. Journal of Fluency Disorders 《口吃病杂志》, ISSN:0094-730X , 1975 年创刊, 2009 年影响因子 2.188 、 5 年影响因子 2.425 7. Mind Language 《思维与语言》, ISSN:0268-1064 , 1986 年创刊, 2009 年影响因子 2.091 、 5 年影响因子 2.173 8. Language and Cognitive Processes 《语言与认识过程》, ISSN:0169-0965 , 1986 年创刊, 2009 年影响因子 2.000 、 5 年影响因子 2.233 9. Modern Language Journal 《现代语言杂志》, ISSN:0026-7902 , 1916 年创刊, 2009 年影响因子 1.914 、 5 年影响因子 2.040 10. Language 《语言》, ISSN:0097-8507 , 1925 年创刊, 2009 年影响因子 1.886 、 5 年影响因子 2.794
个人分类: 期刊投稿|2686 次阅读|0 个评论
[转载]Wiley-Blackwell 3种A&HCI收录语言学期刊投稿指南(转)
tsgxxb 2011-5-12 16:13
来自浙江工业大学万跃华老师博客 http://blog.sciencenet.cn/home.php?mod=spaceuid=57081do=blogid=438835 3 种 Wiley-Blackwell 出版社 AHCI 收录语言学期刊已经为读者做了链接,您可以直接点击期刊名称进入期刊主页,阅读下载全文,了解该期刊的作者指南并在线投稿。 1 、 Studia Linguistica 《语言学研究》英国 ISSN: 0039-3193 , 1947 年创刊,全年 3 期, Wiley-Blackwell 出版社 , AHCI 收录期刊。 刊载拉丁语系语言与文字的研究,包括普通语言学和比较语言学方面的论述,如语法,构词,音韵学,语义学,语用学,心理语言学和计算语言学领域的高品质的原创论文,用英、德、法或西班牙文发表。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9582 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9582/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9582/homepage/ForAuthors.html 2 、 Transactions of the Philological Society 《语义学学会汇刊》英国 ISSN: 0079-1636 , 1842 年创刊 ,全年 3 期, Wiley-Blackwell 出版社 , AHCI 收录期刊。 英国语言学会的会刊( The Philological Society ) ,是语言学学会出版最早、发行最长的期刊,也是 历史最悠久的学术期刊 。主要刊载英语普通语言学方面的研究论文,兼及其他语言学的研究。包括音韵学,形态学,句法,语义,语用学和社会语言学的各个分支学科的视角。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-968X 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-968X/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-968X/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/tphs 3 、 World Englishes 《世界英语》英国 ISSN: 0883-2919 , 1982 年创刊,全年 4 期, Wiley-Blackwell 出版社, SSCI 、 AHCI 收录期刊 ( 2009 年被 SSCI 收录,目前没有影响因子)。教授第二外语英语的教师阅读的刊物,刊载英语教学与英语研究文章及评论,涉及语言教学方法与技巧、词汇、语法、成语、俚语及语言游戏等。该杂志提供了来自非洲、亚洲、欧洲、大洋洲和美洲最近的研究,经常刊登座谈会的辩论论文,最近的一期就刊登了在香港城市大学举行了话语与创新主题的研讨会,特别提到了在香港和中国环境创新的问题。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/weng
个人分类: 期刊投稿|1971 次阅读|0 个评论
看近些年语言学国家社科基金项目研究成果有感
热度 1 cuilanzi 2011-5-9 14:07
在全国哲学社会科学规划办公室网站上( http://www.npopss-cn.gov.cn/chgxj/yy/yy.html )可以看到2003年至今已经结项的部分课题成果简介,共有27项,如下: · 19世纪以来汉语词汇的演变研究——《150年间现代汉语词汇的演变》成果简介 (2011.3.9) · 虚词理论与出土战国文献虚词研究——《虚词理论与出土战国文献虚词研究》成果简介 (2011.2.14) · 蒋藏本《唐韵》研究——《唐五代韵书研究》成果简介 (2010.11.5) · 鄂东方言量范畴研究——《鄂东方言量范畴研究》成果简介 (2010.9.15) · 入湘三峡移民语言及其交际问题研究——《入湘三峡移民的语言交际问题研究》成果简介 (2010.1.5) · 汉语词缀研究——《汉语词缀研究》成果简介 (2009.12.30) · 魏晋南北朝隋唐五代词源研究史略——《魏晋南北朝隋唐五代词源学史研究》成果简介 (2009.12.30) · 中古汉译佛典词汇研究——《中古汉语词汇研究——汉译佛典词汇研究》成果简介 (2009.12.8) · 《同音文海宝韵合编》整理与研究——《黑水城西夏文辞书同音文海合编整理与研究》内容简介 (2009.11.10) · 20世纪西方修辞学理论研究——《当代西方修辞学的流派与汉语修辞学发展研究》成果简介 (2009.11.10) · 十九世纪的福州方言及其一个多世纪以来的演变发展研究——《福州方言自十九世纪以来的历史演变》成果简介 (2009.10.27) · 俄罗斯语言学通史研究——《俄罗斯语言学通史》成果简介 (2009.10.14) · 隋唐五代碑志楷书构形系统研究——《隋唐五代楷书整理与研究》成果简介 (2008.5.30) · 计算语言学方法研究——《计算语言学方法研究》成果选介 (2008.5.30) · 现代汉语的历时发展演变研究——《现代汉语的历时发展演变研究》成果简介 (2008.5.30) · 湘西苗语、土家语与汉语接触研究——《湘西鄂西杂居区少数民族语言受汉语影响研究》成果简介 (2008.5.30) · 形式语言学研究:理论、方法与课题——《形式语言学研究:理论、方法与课题》成果简介 (2008.5.30) · 语言世界图景的文化阐释:理论与方法——《语言世界图景的文化阐释》成果简介 (2008.5.30) · 汉语体貌研究的类型学视野——《汉语体貌系统的类型比较研究》成果简介 (2007.12.7) · 传抄古文字编——《传抄古文的整理与研究》成果简介 (2006.11.13) · 濒危语言研究的新突破 (2004.7.12) · 汉语水语的历史关系及相关问题 (2004.9.3) · 中日对译语料库的研制与应用研究 (2004.4.29) · 中国境内的语言关系与语言分类 (2004.4.29) · 先秦语言哲学研究 (2004.1.19) · 《论衡》语法特点研究 (2004.1.19) · 宋元明文字学史稿 (2003.12.11) 而每年立项的课题有一百多,比如,2010年语言学立项课题有157项:重点项目有7项,一般项目有103项,青年项目有47项。已经结项并能被选择作为成果简介的课题,一般都是被专家们审定为优秀的。语言历时研究和共时研究的互补,语言资料的开拓和语言理论的总结相结合,成为较多课题得以立项的共性。 2010年语言学中被立为重点项目的课题有:汉语词汇通史研究、汉语方言俗语语料库建设研究、近八十年来关中方言微观演变研究、汉语科技语料库建设研究、三百年来北京话的历史演变和现状研究、维吾尔语、哈萨克语、柯尔克孜语言资料平台建设研究、数字多媒体记录汶川县羌语资料库的开发与应用研究,光各种类型语言资料库或语料库建设的项目就有3项,语言通史或断代史研究的有3项,剩下的1项是贴近时代发展而设定的课题,性质等同语言资料库建设,换言之,目前语言学方面的立项研究更着重于语言资料的建设和积累,史的研究也应是建立在语言资料的基础上得以延伸的。 万丈高楼平地起,任何理论的确立怎离得了基础资料的积累和研究,从立项的课题来看,此言不虚,这也表明中国语言学界的研究越来越扎实了……
个人分类: 学海语言|1538 次阅读|4 个评论
科网群英烩 杨文祥 从关于汉字的哲学-语言学对话到跨学科研究的
readnet 2011-5-7 11:19
杨文祥 http://blog.sciencenet.cn/u/pww1380 学坛杂俎:从关于汉字的哲学-语言学对话到跨学科研究的现实困境 已有 173 次阅读 2011-3-11 18:33 | 个人分类: 各抒己见(Airing Our views) | 系统分类: 科研笔记 | 关键词:汉字 哲学-语言学 对话 跨学科研究 现实困境 杨文祥 学坛杂俎:从关于汉字的哲学 - 语言学对话到跨学科研究的现实困境 杨文祥整理 三月四日,与王号和贾利军两位老师进行了一次关于汉字与中国科学的网络对话。考虑到这一对话具有一定的普遍意义,也许会对日后的相关探索提供某些参考,略作文字上的整理后存记如下。如此,也方便与朋友们在此基础上作进一步交流与探讨。 杨: 王号老师撰写的两篇博文(详见参考文献 1.2. )颇富现代人生哲理。长期以来,世界上风靡一股久盛不衰的哲学思潮。这就是所谓的 后现代哲学。 在我看来,这股哲学思潮实际上就是中华古典哲学理念在当今时代历史条件下的历史回归和中华文明历史智慧的走向世界 。 王: 杨老师一开头都是哲学高度 ——“ 后现代哲学 ” 。祖先造字时已经预见到今日之国际大潮流了啊,不容易。 杨: 汉字是一种表意文字。所谓表意,就是表达世界相对于人的价值与意义。这样,通过字形来表达语义,通过字形来表达世界的本真与运动机理和机制,就是汉字字形的基本功能之一。如果对语言文字学研究感兴趣沿此方向探索下去,一定会不断取得可观的学术成就。 语言文字在人类文明史上的历史作用就是人类智慧的记录工具和表达手段。 所谓智慧,就是对世界的本真及其运行的内在机理与机制的深层把握。 今人的智慧往往仅在于对先人古典智慧的理解与发现 。 王: 说滴好,不能只看眼前,回头看才是成功的关键。 (详见参考文献 3. ) 王: 感觉中华文化是全息文化,随便一个字,都包含中华文化的全部线索。因为全息,也容易给人玄妙、 玄虚、 玄奥之感。 贾: 同感。 杨 :“感觉中华文化是全息文化,随便一个字,都包含中华文化的全部线索。”这个感觉十分正确。 汉字的全息在于其整体性和系统性 。即汉字不是以单个字存在的,是以数万个汉字构建的文字系统整体存在的。就是说,其中每个单字,都是在这个字与其他数万个单字之间的相对关系中存在的。 汉字的全息性、整体性和系统性与中华文明和中华文化在哲学上对世界的整体把握在文化结构和思维方式上是同构的。这样,如果用系统论的思想对中华古典文化与汉字的关系和中华传统文化对天人关系的哲学认识作一分析,一定能对中华文化形成更为清晰的理论把握。 “ 中华文化是全息文化 …… 因为全息,也容易给人玄妙 玄虚 玄奥之感。 ” 所谓全息,就是对客观事物各方面关系的整体把握。 客观事物的整体关系是一种形而上的抽象关系。 正是这种无影无形难以把握的整体关系,给人以“玄”的感觉。也只有在这一整体关系中,才有可能充分表述和把握人类所置身其中的这一完整的宏观世界 。 对整体关系感到“玄”,这个感觉来自于我们日常的思维习惯和当下社会心理环境下的思维方式,或曰思维定势。正是这种思维习惯所形成的思维定势,把我们的日常思维局限在感性认识的层次上和对具体的和微观事物的关注上,使我们既不习惯于深层次的理论抽象,也不习惯于整体性的宏观思维。 这就构成了我们为数众多的中国人在科学研究过程中的思维障碍。而这种思维障碍是我们今天的中国科学和中华学术难有大的和整体性突破的重要原因之一 。 整体关系所关注的是事物的普遍性,即普遍规律和共性。事物的这种普遍性和共性隐秘在事物的内在结构和内在运行机制之中,而不是表现为事物的表象。因此它属于那种“道可道,非常道”的抽象层次。 这种抽象的不可言说的非常之道,只可意会,不可言传,这就必然给人以玄、模糊和捉摸不定的感觉。一旦追求清晰,必然走向具体,走向微观,走向表象。这样,微观的特殊性和表象性必然干扰你对宏观普遍真理的理解与把握,在这种情况下,尽管在感觉上可能会清晰得多也具体得多,可是,我们所得到的认识却只能是对微观事物和表层现象的感性关注,而不是对事物深层次的理性把握。 语言是具体的表达工具,它只能直接表述相对具体的事物。而宏观的真义,只能透过文字的具体字形和有限的字义去体会。这就是古代真人时常强调“可意会不可言传”,“天机不可泄漏”的道理之所在。 另外,从直观层面上对中华文化所形成的玄妙、 玄虚、 玄奥的感性认识,恰恰说明了中华文明对天人关系的认识所达到的理论抽象层次的高度。“玄”即抽象,抽象是理论的本质属性。如果不抽象,不“玄”,就说明相关的认识只停留在对表象和外在特征的描述上。这里的“玄”是指对完整世界的整体把握。由于作为认识主体的人本身就置身于这个世界之中,因此在人类的眼睛里,这个整体世界是不存在的,人们所能够直观地感觉到的只是具体的山水林木,而绝不是一个完整的世界。这样,对这个完整的世界的认识,对人来讲,是一种超经验的认识,那么,对这种超验认识的感受,就只能是一个“玄”字。 王: 嗯。同感。文以载道。字以载文 。 杨: 很高兴我们在哲学和语言学等多领域共同语言良多。 王: 那是那是。科学院士(是)不会拨经费了。靠大家自发研究了。 杨: 几十年的历史证明,主流研究渠道的科研管理行政化日益严重,不仅条块分割,而且思想僵化,急功近利,不可能获得具有突破性意义的基础研究成果。中国科学基础研究的重大突破,特别是象这里所讨论的这种横跨自然科学和社会科学的基础性、原创性多学科综合研究,只有靠大家自发研究了。 参考文献: 1 .王号.混 —— 像两个人在河边晒太阳(正文与评论). http://bbs.sciencenet.cn/home.php?mod=spaceuid=45556do=blogid=418468 2 .王号.混世魔王的人生哲学 —— 两条道路,同一结果(正文与评论). http://bbs.sciencenet.cn/home.php?mod=spaceuid=45556do=blogid=418652 3 .王号.不能只看眼前,回头看才是成功的关键(正文与评论). http://blog.sciencenet.cn/home.php?mod=spaceuid=45556do=blogid=418668from=space 4 .杨文祥. 网海泛舟:泛舟偶得,明白一 “ 混 ”—— 读王号博文一得 (正文与评论). http://bbs.sciencenet.cn/home.php?mod=spaceuid=496942do=blogid=418669 发表评论 评论 ( 2 个评论) 举报 jsnjjlj 2011-3-12 10:26 谢谢杨老师对汉字的表述 我始终认为从传递信息的完整性、能动性而言,象形文字是远远优于字母文字的 博主回复(2011-3-12 10:43) : 是这样,完全正确。今后计算机智能化技术的开发绝对离不开表意的汉字系统的技术支持。 举报 sheep021 2011-3-11 21:15 杨老师辛苦了 整理的非常好 博主回复(2011-3-11 21:21) : 谢谢朋友的鼓励。 !--form id="quickcommentform_421246" action="home.php?mod=spacecpac=commentop=comment" method="post" autocomplete="off" onsubmit="ajaxpost('quickcommentform_421246', 'return_qcblog_421246');doane(event);"-- 加为好友 给我留言 打个招呼 发送消息 举报 | Archiver | 科学网 ( 京ICP备07017567 ) var _gaq = _gaq || ); _gaq.push( ); _gaq.push( ); (function() { var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true; ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js'; var s = document.getElementsByTagName('script') ; s.parentNode.insertBefore(ga, s); })(); GMT+8, 2011-5-7 09:58 Powered by ScienceNet.cn Copyright 2007-2010 科学时报社 修改头像 个人资料 积分 用户组 隐私筛选 密码安全 积分 526, 距离下一级还需 积分
个人分类: 科网群英烩|0 个评论
立委微博:抄袭否定的是整个语言学
热度 2 liwei999 2011-5-5 17:06
回答: 对事实的陈述不算抄,不抄怎么表述同样的事实呢? 你一句话否定了整个语言学!!! 作者: 立委 日期: 05/04/2011 10:17:58 如果同一个事实或者思想,只有同一种表达,必须抄袭,语言完蛋了,语言学完蛋了,语言学家都去喂狗吃。 看样子,应该写篇语言学科普《立委科普:逻辑表达式》,说的就是同一个思想(所谓逻辑表达式)与多种语言表达的对应关系。想写这个题目很久了,一直没顾上。 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|2494 次阅读|1 个评论
邹晓辉在伯克利分校的语言学讲堂上明确提出了自己的言本位观点
geneculture 2011-5-4 02:12
邹晓辉在伯克利分校的语言学讲堂上明确提出了自己的言本位观点
言本位的语言观,是笔者在修订2009年汉语独特性理论与教学国际研讨会论文期间明确的一个基本观点。它是在对汉语理论界不同时期提出的几个理论或语言观,如:词本位(马建忠《马氏文通》)、句本位(黎景熙《新编国语文法》)、短语本位(朱德熙《语法讲义》)和字本位(徐通锵《语言论》)系统研究的基础之上,经过2009年在上海外国语大学举办的汉语独特性理论与教学国际研讨会期间笔者展示自己提出的“八大字类”和“八大语类”的基本关系图(分三层两个界限)讲述清楚“语言的字即言”和“文字的字即(大小字符的)符”之后,可以说已经明确地澄清了字词之争的一个非常根本而关键问题,即:在汉语中,文言的言即字,白话的言除了字还增加了从外语引进的词——而这正是学界长期争论不清的地方。由此可以下这样一个断言:以汉语为例,采用汉英比较的方式进行的普通语言学理论研究将有可能发生一个转向——言本位转向。这就是笔者在那篇论文“字与词的义项分析——论汉语研究的逻辑起点”和美国加州大学伯克利分校(贝克莱大学)语言课堂上对语言学教师们讲述的一个中心论点。 下面结合一组示意图和课堂上讲授的照片来加以加以介绍: 在语言哲学基本问题及其解决它的“语义三棱”大背景之下,普通语言学的语和言以及字之间的两组基本分类框架及其相互关系示意图 普通语言学的语言、语和言以及字之间的两组基本分类框架示意图 邹晓辉在贝克莱大学语言课堂上对语言学教师们介绍自己的语言学基础研究成果(普通语言学部分) 邹晓辉在贝克莱大学语言课堂上对语言学教师们讲述自己对语言学界大师们的几种不同的基本语言观的比较研究成果 邹晓辉在贝克莱大学语言课堂上对语言学教师们介绍自己的语言学基础研究成果(形式语言学部分) 摘自: 邹晓辉.字本位与汉语形式化 徐通锵、潘文国、杨自俭主编《字本位理论与应用研究》 山东教育出版社2008年3月 ISBN 9787532859153 邹晓辉在贝克莱大学语言课堂上对语言学教师们介绍自己的语言学基础研究成果(由形式语言学如何推广到形式信息学的部分) 摘自:邹晓辉. 信息学基础研究 马蔼乃、苗东升、姜璐、闫学杉主编《信息科学交叉研究》 浙江教育出版社 2007年 ISBN 9787533870 “语义三角”如何被邹晓辉发现问题并进一步提出了“语义三棱”的语言哲学新观点。 摘自:邹晓辉. 重构“概念分类体系”的新思路与新方法 苏新春、王惠主编《第六届汉语词汇语义学研讨会论文集》新加坡出版机构 2006年1月 ISBM 981-05-5217-3 Zou Xiao Hui(邹晓辉).Intelligence Means Information Processing.VII International Ontology Congress 2006 邹晓辉在贝克莱大学语言课堂上对语言学教师们介绍自己的语言学基础研究成果——普通语言学的语言、语和言以及字之间的两组基本分类框架
个人分类: 语言学基础研究|2809 次阅读|0 个评论
融智学导论(修订版)
geneculture 2011-4-30 19:14
融智学导论(修订版)
字本位与中文信息处理的基础 ——解析“字与字组的关系”探索“汉语形式化”新路 (典型实例:由“一字精解”到“字字精解”) 著作者:邹晓辉 Geneculture 目录 序言 前言 引言 第一章 绪论: 言本位 转向( 普通语言学 基础)单音节字,双音节辞,多音节语,比较棋谱。 第二章 综述: 汉语形式化 ( 形式信息学 基础)间接计算,测序定位,语言定位,知识定位。 第三章 方法: 间接形式化 ( 工程融智学 基础)双字棋盘,电脑数字,人脑文字,双脑协同。 第四章 结果:孪生图灵机 (狭义融智学基础)集合序位,一一对应,约定俗成,文意筛选。 第五章 结论: 第三类脑智 ( 理论融智学 基础)一个假设,两个框架,三个定律,无数用例。 第六章 议论:入门和提高(应用融智学基础)语言瓶颈,知识瓶颈,软件瓶颈,融智化解。 结语 引言 本专著旨在通过人机互助、协同融智的科学预言和技艺处理以及哲学反思,论述汉语形式化新路的探索历程及结果。其意义在于言本位及其基于它的宏观本体与微观序位的间接计算对语言学、信息学、高等教育学以及高校管理学几个领域的理论建构具有指导作用。 长期以来,普通语言学和形式信息学均无汉语及中文信息处理两方面理论的基础地位,其问题主要出在汉语基础理论尤其是中文信息处理的基础理论均未能科学地建立起来;在语言教学和信息处理两个主要的实际应用方面,加之高等教育学和高校管理学不仅缺乏具有独立科学地位的学科概念体系而且它们相互间的关系也都一直没有理顺。这些对当今人助机(如语言教学软件的开发)和机助人(如语言教学软件的应用)如何向人机互助(即:人机之间合理分工、优势互补;高度协作、优化互动)进一步快速稳定而健康地发展相当不利。 融智学理念,即:“合理分工、优势互补;高度协作、优化互动”(16字方略)。 本专著两作者在美国谷歌公司总部驾驭四轮七座自行车的过程就是一种“人际-人机-机际”相互协作的初级融智过程。 ZouXiaohui 12:02:28 祝愿本博客网页的各位读者五一快乐! 分享我们的喜悦之余,请就本专著的融智学理念、16字方略和全书目录以及简短的ppt引言乃至这幅有趣的插图提出您宝贵的意见或建议!
个人分类: 融智学前期探索|1599 次阅读|3 个评论
Wiley-Blackwell 3种A&HCI收录语言学期刊投稿指南
wanyuehua 2011-4-30 06:27
3 种 Wiley-Blackwell 出版社 AHCI 收录语言学期刊已经为读者做了链接,您可以直接点击期刊名称进入期刊主页,阅读下载全文,了解该期刊的作者指南并在线投稿。 1 、 Studia Linguistica 《语言学研究》英国 ISSN: 0039-3193 , 1947 年创刊,全年 3 期, Wiley-Blackwell 出版社 , AHCI 收录期刊。 刊载拉丁语系语言与文字的研究,包括普通语言学和比较语言学方面的论述,如语法,构词,音韵学,语义学,语用学,心理语言学和计算语言学领域的高品质的原创论文,用英、德、法或西班牙文发表。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9582 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9582/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9582/homepage/ForAuthors.html 2 、 Transactions of the Philological Society 《语义学学会汇刊》英国 ISSN: 0079-1636 , 1842 年创刊 ,全年 3 期, Wiley-Blackwell 出版社 , AHCI 收录期刊。 英国语言学会的会刊( The Philological Society ) ,是语言学学会出版最早、发行最长的期刊,也是 历史最悠久的学术期刊 。主要刊载英语普通语言学方面的研究论文,兼及其他语言学的研究。包括音韵学,形态学,句法,语义,语用学和社会语言学的各个分支学科的视角。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-968X 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-968X/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-968X/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/tphs 3 、 World Englishes 《世界英语》英国 ISSN: 0883-2919 , 1982 年创刊,全年 4 期, Wiley-Blackwell 出版社, SSCI 、 AHCI 收录期刊 ( 2009 年被 SSCI 收录,目前没有影响因子)。教授第二外语英语的教师阅读的刊物,刊载英语教学与英语研究文章及评论,涉及语言教学方法与技巧、词汇、语法、成语、俚语及语言游戏等。该杂志提供了来自非洲、亚洲、欧洲、大洋洲和美洲最近的研究,经常刊登座谈会的辩论论文,最近的一期就刊登了在香港城市大学举行了话语与创新主题的研讨会,特别提到了在香港和中国环境创新的问题。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/weng
个人分类: A&HCI投稿|5213 次阅读|0 个评论
普通语言学和形式语言学为何至今仍无汉语及中文应有的适当地位?
热度 1 geneculture 2011-4-29 02:45
实践方面,同英美等国的英语教学和英文信息处理相比较,汉语教学和中文信息处理两方面都有很大的差距,尤其是缺乏应有的足够先进的普通语言学和形式语言学(含:计算语言和程序语言)或形式信息学理论指导。 理论方面,西方的普通语言学和形式语言学(含:计算语言和程序语言)或形式信息学均缺乏基于汉语或以汉语为例的基础性研究突破——至少学界主流在普通语言学和形式语言学领域仍然没有获得实质性的重大突破。 附件: http://blog.sciencenet.cn/home.php?mod=spaceuid=2696do=blogid=35167 张小平 :华人的语言劣势(不能不转贴并评论) 已有 1293 次阅读 2008-8-15 11:21 | 个人分类: 生活点滴 推荐到群组 邹晓辉原贴: 十几亿华人在自然语言和程序语言两方面处于不利地位 我们知道,从结构语言学到形式语言学乃至到计算机程序语言与计算语言学,都是基于西方语言(尤其是英语)的实际情形和需要而发展起来的,可以说几乎没有考虑汉语及中文的实际情形和需要。我认为,这样的语言学和信息学的基础地位对广大华人是非常不利的。 试问:十几亿华人在人际交流的自然语言和人机沟通的程序语言两方面处于不利地位,从何而谈在文化、教育、科技、经济、政治乃至宗教等问题上的平等? 试问:印度可全民学英语且能达到相当熟练的程度,甚至可大批量地学习计算机程序语言且也能达到相当熟练的程度,中国的广大民众可能像印度人那样吗? 试问:按照现在这种汉语理论和语法及其中信息处理技术发展水平,究竟还需要几代人的努力才可能设计并制造出具有足够智力的高质量的全自动翻译系统? 如果这三个最基本的问题都解决不了,那么,就不可能谈在教育和科技上的全面赶超。 这是一个“恶性循环”。如不打破这个“恶性循环”中国在赶超问题上就很难有真正的出路。 本博主评论:这是一个很现实而又棘手的问题,我在想,凡事都会有利有弊,难道在这件事上就只有弊而没有利?中国现在的发展很快,但是我却感觉到瓶颈已经就在眼前了,其中,语言就是一个大的要素,在这件事上,需要全国人民集思广益,现在看来只能希望多出几个李阳,把全国人民的英语水平给弄上去,毕竟人家日本韩国也处在同样的不利地位,但是却上去了。 geneculture 2011-4-29 02:32 本人不同意采用博主仅仅从不利因素这方面所概括的“华人的语言劣势”这样的说法。 因为, 首先,有利与不利是相辅相成的,不能以偏概全。 第二,本人指出至今“这样的语言学和信息学的基础地位对广大华人是非常不利的”旨在提醒本国这两方面的研究人员面对这样一个事实,即:西方普通语言学和形式语言学(含:计算语言和程序语言)或形式信息学两个方面均缺乏基于汉语或以汉语为例的基础性研究突破。具体涉及或影响以下两个方面: 一方面,现在我国的大学和中小学乃至幼儿园虽然都在学英语,但是,国人还是必须要学汉语(含:文言和白话以及现代汉语)的,然而,大家的母语到底学得怎么样呢?暂且不说各自的外语学得怎么样,暂且也不说外国人的汉语又学得怎么样。另一方面,各方面都需要计算机编程和计算机辅助,在信息时代的国人又有多少人能够精通基于英语的编程语言呢?暂且也不说究竟又有多少人可直接采用基于英语的各种程序语言而编写软件。 最后,必须指出:同国外的英语教学和英文信息处理两方面相比较,现在的汉语教学和中文信息处理两方面都有很大的差距。 geneculture 2008-12-25 10:43 日常语言(口语)好学;但是,哲学和前沿科学的许多内容(书面语)就不好学。例如:本体、存在、此在、理解,几个词就是专家也很难解释或翻译的令人满意。 博主 张小平 回复:听说过译不准原理:) geneculture 2008-12-9 06:20 感谢张小平,感谢各位! geneculture 2008-12-9 06:18 首先,我要感谢张小平先生!因为,如果没有他关注并转载我2007-4-28 在奇迹论坛首页 - 信息科学(前沿学术问题探讨专栏)贴出的关于“十几亿华人在自然语言和程序语言两方面处于不利地位”的原帖,那么,也就不会有以上各位在这里一起热烈地谈论上述这番话题。 接下来,我要感谢各位先生和女士!因为,看到大家都关心这个很现实而又棘手的问题,我很欣慰。 最后,我希望大家能把它讨论的再深入些!因为,我认为至少可从实用(自然人与计算机以及人机协作的英语学习、理解和使用)和实证(自然人与计算机以及人机协作的语言学理论)两个方面来继续展开这个话题。 附录1: 可以说,英语及其理论的形式化早在20世纪50年代就已形成,相比之下,而汉语及其理论的形式化却姗姗来迟(至今仍没有获得根本性突破的其他先例)。这不仅严重地制约着汉语及其理论的发展,而且,也延缓了中西语言形式化体系乃至完整的形式信息理论的形成。 http://qkxue.com/bbs/viewthread.php?tid=812extra=page%3D1 附录2: 类似于粒子物理学的微观语言学(micro-linguistics)不仅对“实证”(自然人与计算机以及人机协作的语言学理论)有效,而且,对“实用”(自然人与计算机以及人机协作的英语学习、理解和使用)也相当有效。 http://www.sciencenet.cn/blog/user_content.aspx?id=50331 博主 张小平 回复:我倒是没想到汉语形式化的问题,我只是想到自然语言这个劣势,您的想法有价值。
个人分类: 语言学基础研究|1812 次阅读|1 个评论
2011年SSCI收录语言学学科期刊155种目录
热度 1 wanyuehua 2011-4-28 15:17
SSCI 、 AHCI 均收录语言学期刊, 2011 年 SSCI 收录语言学学科期刊 155 种( 2008 年 SSCI 收录语言学学科期刊 71 种),其中被 SCI 、 SSCI 、 AHCI 共同收录期刊 3 种如 Computational Linguistics 《计算语言学》、 Natural Language Engineering 《自然语言工程》、 Phonetica 《语音学》, SCI 、 SSCI 共同收录期刊 3 种, SSCI 、 AHCI 共同收录期刊 117 种。详细情况请见附件。 最近2年 Thomson Reuters新收录了许多语言学期刊。 2009 年 JCR 收录语言学学科期刊 93 种,其中影响因子 3 以上有 1 种、影响因子 2 以上有 7 种、影响因子 1.5 以上有 8 种,语言学期刊影响因子前 10 名期刊如下: 1. Journal of Memory and Language 《记忆与语言杂志》, ISSN:0749-596X , 1962 年创刊, 2009 年影响因子 3.221 、 5 年影响因子 3.814 2. Brain Language 《大脑与语言》, ISSN:0093-934X , 1974 年创刊, 2009 年影响因子 2.937 、 5 年影响因子 3.105 3. Language Learning Technology 《语言学习与技术》, ISSN: 1094-3501 , 2009 年影响因子 2.531 、 5 年影响因子 3.575 4. Journal of Speech Language and Hearing Research 《言语、语言与听觉研究杂志》, ISSN:1092-4388 , 1958 年创刊, 2009 年影响因子 2.347 、 5 年影响因子 2.714 5. Computational Linguistics 《计算语言学》, ISSN:0891-2017 , 1974 年创刊, 2009 年影响因子 2.212 、 5 年影响因子 3.722 6. Journal of Fluency Disorders 《口吃病杂志》, ISSN:0094-730X , 1975 年创刊, 2009 年影响因子 2.188 、 5 年影响因子 2.425 7. Mind Language 《思维与语言》, ISSN:0268-1064 , 1986 年创刊, 2009 年影响因子 2.091 、 5 年影响因子 2.173 8. Language and Cognitive Processes 《语言与认识过程》, ISSN:0169-0965 , 1986 年创刊, 2009 年影响因子 2.000 、 5 年影响因子 2.233 9. Modern Language Journal 《现代语言杂志》, ISSN:0026-7902 , 1916 年创刊, 2009 年影响因子 1.914 、 5 年影响因子 2.040 10. Language 《语言》, ISSN:0097-8507 , 1925 年创刊, 2009 年影响因子 1.886 、 5 年影响因子 2.794 附件: 2011年SSCI收录语言学学科期刊155种目录.doc
个人分类: SSCI投稿|7685 次阅读|3 个评论
[转载]计算语言学(Computational linguistics )
geneculture 2011-4-27 10:35
http://www.coli.uni-saarland.de/~hansu/what_is_cl.html H ANS U SZKOREIT W HAT IS C OMPUTATIONAL L INGUISTICS ? Computational linguistics (CL) is a discipline between linguistics and computer science which is concerned with the computational aspects of the human language faculty. It belongs to the cognitive sciences and overlaps with the field of artificial intelligence (AI) , a branch of computer science aiming at computational models of human cognition. Computational linguistics has applied and theoretical components. Human language is a most exciting and demanding puzzle. Theoretical CL takes up issues in theoretical linguistics and cognitive science. It deals with formal theories about the linguistic knowledge that a human needs for generating and understanding language. Today these theories have reached a degree of complexity that can only be managed by employing computers. Computational linguists develop formal models simulating aspects of the human language faculty and implement them as computer programmes. These programmes constitute the basis for the evaluation and further development of the theories. In addition to linguistic theories, findings from cognitive psychology play a major role in simulating linguistic competence. Within psychology, it is mainly the area of psycholinguistics that examines the cognitive processes constituting human language use. The relevance of computational modelling for psycholinguistic research is reflected in the emergence of a new subdiscipline: computational psycholinguistics. We teach computers to communicate with people. Applied CL focusses on the practical outcome of modelling human language use. The methods, techniques, tools and applications in this area are often subsumed under the term language engineering or (human) language technology. Although existing CL systems are far from achieving human ability, they have numerous possible applications. The goal is to create software products that have some knowledge of human language. Such products are going to change our lives. They are urgently needed for improving human-machine interaction since the main obstacle in the interaction beween human and computer is a communication problem. Today's computers do not understand our language but computer languages are difficult to learn and do not correspond to the structure of human thought. Even if the language the machine understands and its domain of discourse are very restricted, the use of human language can increase the acceptance of software and the productivity of its users. Friendly software should listen and speak. Natural language interfaces enable the user to communicate with the computer in French, English, German, or another human language. Some applications of such interfaces are database queries, information retrieval from texts, so-called expert systems, and robot control. Current advances in the recognition of spoken language improve the usability of many types of natural language systems. Communication with computers using spoken language will have a lasting impact upon the work environment, completely new areas of application for information technology will open up. However, spoken language needs to be combined with other modes of communication such as pointing with mouse or finger. If such multimodal communication is finally embedded in an effective general model of cooperation,we have succeeded in turning the machine into a partner. Machines can also help people communicate with each other. Much older than communication problems between human beings and machines are those between people with different mother tongues. One of the original aims of applied computational linguistics has always been fully automatic translation between human languages. From bitter experience scientists have realized that they are still far away from achieving the ambitious goal of translating unrestricted texts. Nevertheless computational linguists have created software systems that simplify the work of human translators and clearly improve their productivity. Less than perfect automatic translations can also be of great help to information seekers who have to search through large amounts of texts in foreign languages. Language is the fabric of the web. The rapid growth of the Internet/WWW and the emergence of the information society poses exciting new challenges to language technology. Although the new media combine text, graphics, sound and movies, the whole world of multimedia information can only be structured, indexed and navigated through language. For browsing, navigating, filtering and processing the information on the web, we need software that can get at the contents of documents. Language technology for content management is a necessary precondition for turning the wealth of digital information into collective knowledge. The increasing multilinguality of the web constitutes an additional challenge for our discipline. The global web can only be mastered with the help of multilingual tools for indexing and navigating. Systems for crosslingual information and knowledge management will surmount language barriers for e-commerce, education and international cooperation. Our discipline combines ambitious visions and realistic applications. We still do not know very well how people produce and comprehend language. Yet our understanding of the intricate mechanisms that underly human language processing keeps growing. Modelling such mechanisms on a computer also helps us to discover and formally describe hidden properties of human language that are relevant for any kind of language processing including many useful software applications. Our long term goal is the deep understanding of human language and powerful intelligent linguistic applications. However, even today's language technologies full of clever short cuts and shallow processing techniques can be turned into badly needed software products. The young field's appeal is its diversity. For many students and practitioners of computational linguistics the special attraction of the discipline is the combination of expertise from the humanities, natural and behavioural sciences, and engineering. Scientific approaches and practical techniques come from linguistics, computer science, psychology, and mathematics. At some universities the subject is taught in computer science at others it belongs to linguistics or cognitive science. In addition there is a small but growing number of programs and departments dedicated solely to computational linguistics. 1996, 2000 Hans Uszkoreit
个人分类: 双语信息处理|1 次阅读|4 个评论
[转载]认知语言学(Cognitive Linguistics)
geneculture 2011-4-27 08:04
Fall 2008 Cognitive Linguistics Linguistics 423/640G Tu, Th 10:30-11:45; Moore 119 Ben Bergen Course description Cognitive Linguistics is the study of the mind through language and the study of language as a cognitive function . Cognitive Linguistics has two main goals : (1) to study how cognitive mechanisms like memory, categorization, attention, and imagery are used during language behavior; and (2) to develop psychologically viable models of language that cover broad ranges of linguistic phenomena, including idioms and figurative language. Research in Cognitive Linguistics is multi-disciplinary; evidence is drawn from text analysis, language acquisition, language change, psycholinguistic experimentation, and brain imaging, among other sources. The purpose of this course is to provide a general orientation in Cognitive Linguistics, an understanding of its central themes and assumptions, and exposure to its empirical methods. Prerequisites An undergrad introduction to linguistics and upper division or graduate status, or instructor consent. Requirements Students enrolled for full credit will be expected to complete 4 homework assignments and a research project, to present a reading to the class, and to participate in class meetings. All assignments are to be turned in at the beginning of class on the day they are due. Homework assignments will evaluate student understanding of course materials through new work related to course topics. The term paper is a novel piece of independent research on any topic related to the course, negotiated beforehand with me. I will be very happy to discuss possible paper topics with you throughout the semester. A term paper proposal will be submitted about a month before the paper is due. Students will select a reading at the beginning of the semester to present collaboratively. All enrolled students are expected to attend and participate in every class meeting, having read assigned readings for that meeting. Grades are assigned according to the following distribution: Homework assignments (4): 40% Term paper: 40% Reading presentation 10% Class participation 10% Consultation Please take full advantage of my office hours, at times to be determined, in Moore Hall 581. You can also email me: bergen@hawaii.edu. Lecture notes, an up-to-date course schedule, links to online versions of course readings, and links to relevant resources will appear through the semester at: http://www2.hawaii.edu/~bergen/ling640G/ Lecture, reading, and assignment schedule (provisional) Part I. Theoretical Bases Date Topic Reading Work 8.26 Introduction 8.28 Language and the mind § 1-4; ( §5-9) 9.2 Categorization 9.4 Polysemy and homonymy ; ( ) Hw #1 Distributed 9.9 Metaphor 9.11 Metonymy ; ( ) 9.16 Construal Hw #1 Due 9.18 Mental simulation ; ( ) Part II: Empirical Methods 9.23 Empirical methods I Hw #2 Distributed 9.25 Empirical methods II 9.30 Metaphor II 10.2 Mental simulation II ; Hw #2 Due Part III: Linguistic relativism: How language affects cognition 10.7 Linguistic relativism 10.9 Space 10.14 Metaphors for time Hw #3 Distributed 10.16 Gender 10.21 Containment 10.23 Writing systems , Hw #3 Due Part IV: Cognitive grammars 10.28 Grammatical constructions 10.30 Network models of grammar 11.4 Election Day – no class 11.6 Constructions in sentence processing Hw #4 Distributed Term Paper Prop Due 11.11 Veterans' day - no class 11.13 Constructions in sentence production 11.18 Embodied Construction Grammar Hw #4 Due Part V: Bottom-up language acquisition 11.20 Usage-based language acquisition 11.25 Words 11.27 Thanksgiving – no class 12.2 Grammatical classes 12.4 Grammatical constructions 12.9 Comparative acquisition 12.11 Summing up 12.12 Student mini-conference Term Paper Due Readings (Some papers require a login and password, available from the instructor.) Evans, Vyvyan, Benjamin K. Bergen and Jrg Zinken. 2006. The Cognitive Linguistics Enterprise: An Overview. In The Cognitive Linguistics Reader , London: Equinox. http://www.port.ac.uk/departments/academic/psychology/staff/downloads/filetodownload,68131,en.pdf Rosch, Eleanor. 1978. Principles of categorization. In: E. Rosch, B. Lloyd (eds.): Cognition and categorization. Hilldale, NJ: Lawrence Erlbaum. http://www2.hawaii.edu/~bergen/ling640G/papers/rosch1b.doc Wikipedia entries for Polysemy and Homonyms. http://en.wikipedia.org/wiki/Polysemy , http://en.wikipedia.org/wiki/Homonyms Klepousniotou, E. 2002. The processing of lexical ambiguity : homonymy and polysemy in the mental lexicon. Brain Lang. Apr-Jun;81(1-3):205-23. http://www2.hawaii.edu/~bergen/ling640G/papers/klepousniotou.pdf Lakoff, George. 1993. The contemporary theory of metaphor. In Andrew Ortony (Ed.) Metaphor and thought (2nd edition). Cambridge: Cambridge. http://www.cardiff.ac.uk/encap/clcr/gordon/lakoff.pdf Wikipedia entry for Metonymy. http://en.wikipedia.org/wiki/Metonymy Radden, Günter. 1999. Towards a Theory of Metonymy. In Klaus-Uwe Panther and Gunter Radden (ed.). Metonymy in Language and Thought, pp. 17-66. John Benjamins. http://www2.hawaii.edu/~bergen/ling640G/papers/RaddenKovecses.doc /span Croft, William and D. Alan Cruse. 2006. Cognitive Linguistics. Cambridge University Press. Ch. 3 http://www2.hawaii.edu/~bergen/ling640G/papers/cog03.pdf Zwaan, R.A. (1999). Embodied cognition, perceptual symbols, and situation models. Discourse Processes, 28, 81-88. http://www.brain-cognition.eu/publications//zwaan-dp-99.pdf Zwaan, R.A. (2004). The immersed experiencer: toward an embodied theory of language comprehension. In B.H. Ross (Ed.) The Psychology of Learning and Motivation (pp 35-62). Academic Press, New York. http://www.brain-cognition.eu/publications//LearningMotivation.pdf González-Márquez, Mónica , Raymond B. Becker, and James Cutting. To appear. An Introduction to Experimental Methods for Language Researchers. In M. Gonzalez-Marquez, I. Mittelberg, S. Coulson, and M. J. Spivey (eds.) Methods in Cognitive Linguistics: Ithaca. http://www2.hawaii.edu/~bergen/ling640G/papers/gonzalez-marquez.doc Núez, Rafael. To appear. Inferential Statistics in the Context of Empirical Cognitive Linguistics. In Monica Gonzalez-Marquez, Irene Mittelberg, Seana Coulson, and Michael J. Spivey (eds.) Methods in Cognitive Linguistics: Ithaca. http://www2.hawaii.edu/~bergen/ling640G/papers/nunez/ Boroditsky, L. (2000). Metaphoric Structuring: Understanding time through spatial metaphors. Cognition, 75(1), 1-28. http://www-psych.stanford.edu/~lera/papers/metaphors.pdf Zwaan, R.A., Stanfield, R.A., Yaxley, R.H. 2002. Do language comprehenders routinely represent the shapes of objects? Psychological Science, 13, 168-171. http://www.brain-cognition.eu/publications//shapes.pdf Benjamin Bergen. To appear. Experimental methods for simulation semantics. In M. Gonzalez-Marquez, I. Mittelberg, S. Coulson, and M. J. Spivey (eds.) Methods in Cognitive Linguistics. http://www2.hawaii.edu/~bergen/papers/BergenEMCLchapterdistrib.doc Boroditsky, L. (in press). Linguistic Relativity. Encyclopedia of Cognitive Science. MacMillan Press. http://www-psych.stanford.edu/~lera/papers/ECS-proofs.pdf Majid, A., Bowerman, M., Kita, S., Haun, D. S. Levinson (2004). Can language restructure cognition? The case for space. Trends in Cognitive Sciences, 8(3), 108-114. http://silccenter.org/bibliography_pdfs/the_case_for_space.pdf Boroditsky, L. (2001). Does language shape thought? English and Mandarin speakers' conceptions of time. Cognitive Psychology, 43(1), 1-22. http://www-psych.stanford.edu/~lera/papers/mandarin.pdf Boroditsky, L., Schmidt, L., Phillips, W. (in press). Sex, Syntax, and Semantics. To appear in Gentner Goldin-Meadow (Eds.,) Language in Mind: Advances in the study of Language and Cognition. http://www-psych.stanford.edu/~lera/papers/gender.pdf McDonough, L., Choi, S., Mandler, J. (2003) Understanding spatial relations: Flexible infants, lexical adults. Cognitive Psychology , 46, 229-259. http://www2.hawaii.edu/~bergen/ling640G/papers/koreanenglish.pdf Maass, A., Russo, A. (2003). Directional bias in the mental representation of spatial events: Nature or culture? Psychological Science, 14, 296 –301 http://www2.hawaii.edu/~bergen/ling640G/papers/writingdirectionMaasRusso.pdf Ting Ting Chan and Benjamin Bergen. 2005. Writing Direction Influences Spatial Cognition. In Proceedings of the Twenty-Seventh Annual Conference of the Cognitive Science Society. http://www2.hawaii.edu/~bergen/papers/f895-chan.pdf Goldberg, Adele. 2003. Constructions: A new theoretical approach to language. Trends in Cognitive Science. http://www3.isrl.uiuc.edu/~junwang4/langev/localcopy/pdf/goldberg03constructions.pdf Diessel, Holger. 2004. A dynamic network model of grammatical constructions. In The Acquisition of Complex Sentences. Cambridge University Press. http://www.personal.uni-jena.de/~x4diho/The%20usage%20based%20model.pdf Kaschak, Michael P. and Arthur M. Glenberg 2000, Constructing meaning: The role of affordances and grammatical constructions in sentence comprehension, Journal of Memory and Language 43: 508-529. http://www.psy.fsu.edu/~kaschaklab/ConstructingMeaning.pdf Kaschak, M. P., Loney, R. A., Borreggine, K. (2006).Recent experience affects the strength of structural priming. Cognition. http://www.psy.fsu.edu/~kaschaklab/RecentExperience.pdf Benjamin Bergen, Nancy Chang, and Shweta Narayan. 2004. Simulated Action in an Embodied Construction Grammar. Proceedings of the Twenty-Sixth Annual Conference of the Cognitive Science Society. http://www2.hawaii.edu/%7Ebergen/papers/BCN04.pdf Tomasello, Michael. 2000. A Usage-Based Approach to Child Language Acquisition. Proceedings of the Berkeley Linguistics Society. http://www2.hawaii.edu/~bergen/ling640G/papers/BLS.doc Bloom, P. (2001). Precis of "How children learn the meanings of words." Behavioral and Brain Sciences, 24, 1095-1103. http://www.yale.edu/langcoglab/papers/bloom-precis.pdf Adele E. Goldberg, Devin Casenhiser and Nitya Sethuraman. 2003. A lexically based proposal of argument structure meaning. Chicago Linguistic Society. http://www.princeton.edu/~adele/CLS-03-final.doc Choi, Soonja. 2000. Caregiver input in English and Korean: use of nouns and verbs in book-reading and toy-play contexts. J. Child Lang. 27:69-96. http://www2.hawaii.edu/~bergen/ling640G/papers/choi2000.pdf
个人分类: 语言学基础研究|2 次阅读|3 个评论
106 的语言学
liwei999 2011-4-4 04:43
106 的语言学 (41573) Posted by: liwei999 Date: December 16, 2006 03:57AM 对于科普,原则上不存在抄袭问题,就如对于广告,原则上不存在误导问题一样,这是我一贯的观点。所以我对方文抄袭与否的立论前提,就不感兴趣。 不过,原文是107,怎么变成了106,是个很有意思的语言学问题。我不相信是眼睛看花了的“无心之失”,应该是“推敲所得”。 英译汉时,in+duration, 通常有两种译法:“...以内”,“...以后“。我们当年编制英汉翻译软件时候,琢磨过这种现象,编制了如下规则: (1) 如果是未来时态,则翻译成 “...之后“: I will come back in 106 days. -- 我106天以后回来。 (2)否则,翻译成 “...之内”: This process was completed in 106 days. -- 此过程在106天以内完成了。 对于第一种情形,其所以翻译成“以后”,并非英文的歧义问题,而是中文的“以后”有歧义。试比较: I will come back in 106 days. vs. I will come back (shortly/long) after 106 days. 前者是到了106天就回来,后者可以是在106天以后的某个日子回来(比如 in 107 days or in 110 days)。除非为了抬杠(相声演员常玩的花招,“你不是说106天后回来么,怎么变成110天了?”“是啊,我是说106天‘以后’”!),汉语在表达第一种语义时,所用的表达形式是“以后”,default sense 没有歧义。 现在来看两个人的107翻译是怎么回事。 原文:“Zidovudine(AZT) was approved in 107 days,without cutting any corners.”。 颖文:该药的临床试验只进行了(大约) 106天就获准结束。 方文: AZT 的临床试验在只进行了106天之后,发现它能显著增加病人的存活率,美国食品药品管理局立即提前中止了该临床试验,并在批准其上市之前允许它被用于治疗 4000多名艾滋病患者。 颖文的翻译思路可以大体看清,信达如何可以讨论,他确实是“推敲所得”。他知道 in 107 days 是 107 天以内(不超过107天)的意思,为了保险起见,翻译成“(大约) 106天”,算是个很尽心的翻译人员了。因为他如果翻译成107天,“以内”的意思就出不来了。(也可以这样翻译:该药的临床试验在107天以内就告结束,被批准可以上市。) 方文的翻译大概也是这个思路。显然,方也是个审慎的译者。 以无罪推定之普世原则作为指导,初步结论:英雄所见略同,颖方二位都是翻译好手,很细心。(白先生相当于举报人或检察官,跟新语丝打假类同,大概用的是有罪推定。角色不同,结论不同,也可以理解。) 106 的语言学(续) (41955) Posted by: liwei999 Date: December 18, 2006 12:46AM 呆子问得好。当时写得匆忙,没有完全解释清楚。希望这一帖清楚一些,而不是越来越糊涂(由于语言现象的微妙和fuzzy, 这种risk还是有的)。 引用: 我认为(1)的翻译实际上是不准确的,应该和(2)的翻译“之内”一样才行,为什么要有所区分呢? I will come back in 5 days. 说的也是在5天之内回来呀,当然1,2,3,4天内回来 的可能性,隐含意思肯定是小于5天之内回来,但也不是说完全不可能啊。 不同意把(1)的译法等同于(2)。 in 106 days 结构在跟未来时态时其所以翻译成“106天以后”(或者如鹏归指出的“过106天”)而不是“106天以内”是因为汉语中“106天以内”通常指“106天以内的任何时候(但绝不会超过106天)”,强调的是106的大限。与此对应的英语是:(some time)within 106 days. 与此相反,汉语中“106天后”/“过106天”通常就指106天的当口,而不是“106天以后任何时候”的意思(相声中的抬杠不算)。 换句话说,by default (抬杠不算),汉语“106天以内”有“任何时候”(只要不超过106)的意思,而“106天以后”没有“任何时候”的意思。选择后者是因为英语中的跟未来时态的 "in 106 days" by default 是排除“任何时候”的意义的。 I will be back in a couple of days. 我两天后就回。/ 我过两天回来。 *我两天以内回来。 这种现象的深层原因,我以为是时态的语义和介词短语语义交互作用的结果。“未来时”内涵有计划的意思,计划和数字相结合,意味着某种确定性,所以就隐形地排除了“some time within 106 days” 的意义,使得时间确定在106左右,不能早于105天。这种分析得到如下非未来时态但是有计划意义的句子的印证: I plan to come back in 106 days. 我计划106天后回来。/我计划过106天就回。 *我计划106天以内回来。 过去时或完成体说的是已经发生的事实,具体何时发生无法更变,所以"in 106 days"只有灵活一点,采“任何时候,只要不超过106天”的意义(相当于“some time within 106 days”),才能跟各类事件的描述保持一致,避免可能的自相矛盾。这种情形正好跟汉语“以内”的译法相吻合。 语言现象很微妙,不知道上述解释合理否,请呆子及网友指正。 至于说到统计,最好是找一个人工翻译的双语语料库去做,看不同时态该表达法的译法。Personally, 我对我们编制的机器翻译的规则还是很有信心的。(原帖中的两条规则还是看了上下文的条件,具体说是看该介词短语所修饰的动词的时态的条件。) 引用: 另外,你后面的举例没有说清楚:既然,中文的“以后”有歧义,为什么你还要把它翻译成“以后”呢? 是没有说清楚。by “default sense 没有歧义”, 我本来想说:中文“以后”by default没有歧义(而“以内”却有歧异。)“106天以后回来”就是指“过106天就会”,而不包括“过107天,或过200天回来”。其所以说by default, 是因为如果人要抬杠,硬说”以后“有这种歧义,也没辙。 在翻译实践上,我有信心它们的不同译法是被广泛认同的(可以做统计证实之)。困难在解释为什么应该采用不同译法。我的解释算一家之言吧。语感好的,或常做翻译的,如狐狸三跳无理芒果呆子鹏归诸位,请指正吧。 牵狗了一下: “天以后” "in * days",第一个hit就是英语介词in+将来时的翻译: 将来时态in...以后   例: They will come back in 10 days. 他们将10天以后回来。   I'll come round in a day or two. 我一两天就回来。   We'll be back in no time. 我们一会儿就回来。   Come and see me in two days' time. 两天后来看我。(从现在开始)   after... (从过去开始) 见: -------- 相关文章: 白字秀才:神秘的106天—-扒开骗子的画皮: http://www.tianya.cn/publicforum/content/no01/1/291226.shtml
个人分类: 立委随笔|3087 次阅读|0 个评论
信息学基础研究之一:理论融智学明确物意文之后第四范畴道理法义
geneculture 2011-3-12 10:01
信息学基础研究之一:理论融智学明确物意文之后第四范畴道理法义
如果说在《普通语言学教程》中语言学之父索绪尔是为了探寻“语言系统”而描绘了“语义三角”,而在“意义和指称”中语言哲学之父弗雷格则是为了探寻“数字逻辑”而涉及了“语义三角”,那么,我们就可以说他们均在“物”和“意”之后殊途同归地在“语义三角”中引出了“文”这个第三范畴,而这正是哲学“语言转向”的深意。其后,早、晚期的维特根斯坦之所以能吸引两大系列相互对立的追随者,实质上只是“文”的两种形式(即:科学语言和人文语言,或:形式语言与自然语言)分别展开的两大群体。这之后不断精细化的研究或探讨,其实已进入“道理法义”的第四大类范畴。这正是理论融智学之通论所说的“物、意、文、道(即:道理法义的简称)”在宏观上驾驭错综复杂的人类整个知识体系大夏的基本结构框架。该宏观分类框架不仅在科学哲学上具有重大意义,而且,在高等教育的顶级学科分类体系的建构以及对整个学科体系的人才知识管理的考虑等方面也具有宏观指导作用。 注:在AAAS美国科学年会展示高教管模型及学科宏观分类体系和上下两极专业导向两个子模型在交流中已引起学界广泛关注。
个人分类: 信息学基础研究|55 次阅读|2 个评论
[转载]“十二五”规划选题建议摘编---语言学
timy 2011-3-6 23:10
语言学 语言理论研究;汉语与亲属语言比较研究;濒危语言研究;语音和语言技术应用研究; 汉语词汇中文信息处理研究;句法和语义的互动研究;语言类型特征调查分析;语言接触研究;地理语言学研究; 历史语法与方言语法、少数民族语法的结合研究;现代汉字系统研究;汉字历史及理论研究;汉语语音史研究;音韵学研究; 专书和断代训诂研究;词源研究;对外汉语研究;汉字认知与学习规律研究;城市语言研究;方言岛研究;网络语言调查研究; 汉语失语症语言能力测查量表研制;计算语言学理论和语言工程研究;知识推理和语义计算研究; 民族语言类型学研究;民族语言生态调查研究; 多语对比研究;语料库研究;语言学各分支学科数据库建设。
个人分类: 自然语言处理|0 个评论
Wiley-Blackwell出版社SSCI收录6种语言学期刊投稿指南
热度 2 wanyuehua 2011-3-5 08:50
Wiley-Blackwell出版社SSCI收录6种语言学期刊投稿指南
读者留言希望了解 SSCI 收录的语言学期刊,为了帮助读者了解高水平语言学期刊,向 SSCI 收录的语言学期刊投稿,本博客特向各位读者推荐 Wiley-Blackwell 出版社的 6 种 SSCI 收录语言学期刊。 6 种 Wiley-Blackwell 语言学期刊已经为读者做了链接,您可以直接点击期刊名称进入期刊主页,阅读下载全文,了解该期刊的作者指南并在线投稿。 Wiley-Blackwell 出版社语言学 6 种期刊推荐: 1 、 Mind Language 《思维与语言》英国 ISSN: 0268-1064 , 1986 年创刊,全年 5 期, Wiley-Blackwell 出版社 , SSCI 收录期刊, SSCI 2008 年影响因子 1.327 , 2009 年影响因子 2.091 , 5 年影响因子 2.173 , 2009 年 JCR 语言学科排名第 7 位( 93 种), Q1 (一区)。 刊载研究思维与语言、思维与心理活动现象问题的论文、评论和札记。读者对象为哲学家、语言学家、心理学家和人工智能研究人员。 国内订购该数据库读者 可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1468-0017 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1468-0017/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1468-0017/homepage/ForAuthors.html 2 、 The Modern Language Journal 《现代语言杂志》美国 ISSN: 0026-7902 , 1916 年创刊,全年 4 期, Wiley-Blackwell 出版社 , SSCI 收录期刊, SSCI 2008 年影响因子 1.044 。 2009 年影响因子 1.914 , 5 年影响因子 1.538 , 2009 年 JCR 语言学科排名第 9 位( 93 种), Q1 (一区)。 刊载外语教学的方法和经验方面的文章、札记和书评。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1540-4781 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1540-4781/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1540-4781/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/mlj 3 、 Journal of Sociolinguistics 《社会语言学杂志》英国 ISSN: 1360-6441 , 1997 年创刊,全年 5 期, Wiley-Blackwell 出版社, SSCI 收录期刊, SSCI 2008 年影响因子 0.920 , 2009 年影响因子 1.174 , 5 年影响因子 1.464 , 2009 年 JCR 语言学科排名第 28 位( 93 种), Q2 (二区)。 该刊主要刊登语言和社会的多学科研究论文,鼓励刊登建立或批判社会语言学理论和社会理论的最新数据和语言的应用问题的论文。 国内订购该数据库 读者可以阅读 1997 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9841 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9841/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-9841/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/jslx 4 、 Foreign Language Annals 《外国语言纪事》美国 ISSN: 0015-718X , 1967 年创刊,全年 4 期, Wiley-Blackwell 出版社 , SSCI 收录期刊, SSCI 2008 年影响因子 0.260 , 2009 年影响因子 0.378 , 5 年影响因子 0.577 , 2009 年 JCR 语言学科排名第 68 位( 93 种), Q3 (三区)。 该刊为美国外语教学委员会( American Council on the Teaching of Foreign Languages )会刊,刊载外语研究和外语教学方法方面的文章。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1944-9720 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1944-9720/homepage/EditorialBoard.html 作者指南: http://www.actfl.org/i4a/pages/index.cfm?pageid=3321 在线投稿: http://www.editorialmanager.com/fla/ 5 、 Journal of Linguistic Anthropology 《语言人类学杂志》美国 ISSN: 1055-1360 , 1991 年创刊,全年 2 期, Wiley-Blackwell 出版社, SSCI 收录期刊 ( 2009 年被 SSCI 收录,目前没有影响因子) 。 该刊为语言人类学学会( Society for Linguistic Anthropology )会刊,探讨了在何种语言的形状社会生活的许多方面,刊登包括话语分析、社会语言和认知语言的研究论文、综述、社论、书评、会议论文。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1548-1395 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1548-1395/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1548-1395/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/jla 6 、 World Englishes 《世界英语》英国 ISSN: 0883-2919 , 1982 年创刊,全年 4 期, Wiley-Blackwell 出版社, SSCI 、 AHCI 收录期刊 ( 2009 年被 SSCI 收录,目前没有影响因子)。教授第二外语英语的教师阅读的刊物,刊载英语教学与英语研究文章及评论,涉及语言教学方法与技巧、词汇、语法、成语、俚语及语言游戏等。 国内订购该数据库 读者可以阅读 1996 至今的全文。 网址: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X 编委会: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X/homepage/EditorialBoard.html 作者指南: http://onlinelibrary.wiley.com/journal/10.1111/(ISSN)1467-971X/homepage/ForAuthors.html 在线投稿: http://mc.manuscriptcentral.com/weng 说明:影响因子的四分位区间是指将一个学科领域内所有期刊影响因子大小顺序排列后,将所有期刊分成四等份,从而形成四个区间并分别标记为 Q1 , Q2 , Q3 , Q4 。
个人分类: SSCI投稿|10454 次阅读|2 个评论
证素概念的逻辑缺陷
热度 1 fqng1008 2011-3-2 22:01
很早就开始采用证素分析的方法来归纳各种传染病不同时期的主要病机和次要病机,最近读到朱文峰教授的《证素辨证学》,才发现自己对证素的理解与作者有较大差异,从而修正了许多错误认识。但是,细读之后,发现作者的证素概念也值得推敲。 一、证素不是词素 不排除偶然巧合,“证素”概念有移植于“词素”之嫌。但是,词素是一语言学概念,而提出“证素”的原旨是构建一科学概念,二者有明显不同。 所谓词素( morpheme ) ,是具有独立含义、有构词能力的最小语言单位。这个定义非常严谨,完全符合形式逻辑 “ 种加属差 ” 定义法:这一概念最近的 “ 种概念 ” 是“语言单位”,但仅仅这样是不够完整的,它还与其它 “ 属概念 ” (句子、词组、词)之间具有 “ 差异 ” ( 属差),即必须具有独立含义、 构词能力、级别最低(最小)等的限制。对比一下就会发现,无论证素是“证名的要素”还是“证的要素”, 其定义都相差甚远 。 其实,作者在文中有一个比较符合逻辑规则的定义:证素是辨证诊断不能再分的诊断单元。我非常赞成这样的定义,推测没有采用的原因是作者对证素在中医诊断规范化研究中寄予太高的期望,为了让内涵与外延达到一致,而不得不采取模糊其内涵的办法。 二、证素定义的模糊性 在形式逻辑里,定义具有严格的规则:(1)种概念和属概念的外延要相称;(2)不应循环;(3)一般不应是否定的判断;(4)“属差”应尽可能详细确切。 作者将证素简单地定义为“证(名)的要素”,缺乏严谨性:(1)根本就没有种概念和属概念的划分,更谈不上外延相称;(2)具有循环的特征,即证素是证的要素,反过来也可以说“证的要素是证素”,谁也说明不了谁;(3)作者列举了证素不等于证候、证素不等于证名、证素中为何不讲病因、证素不宜称病机、无必要称病势等等,这样说毫无意义,如同定义“人不是狗”一样。 三、证素外延的随意性 作者通过搜集整理,发现古今论著中所提出的证素概念有120项左右,于是根据证素的基本特征、文献资料、临床实际需用、证素要精、约定俗成等原则,对其进行分析辨别,从中筛选出统一、规范的证素项目50项左右。其中, 病位证素19项:心、神(脑)、肺、脾、肝、肾、胃、胆、小肠、大肠、膀胱、胞宫、胸膈(上焦)、下焦(少腹)、表、半表半里、经络、肌肤(皮肤、肌肉)、筋骨(关节); 病性证素31项:(外)风、寒、暑、湿、(外)燥、火(热)、痰、饮、水停、虫积、食积、毒、脓、气滞、气闭、血瘀、血热、血寒、气虚、气陷、气不固、气脱、血虚、阴虚、亡阴、阳虚、亡阳、精(髓)亏、津(液)伤、阳浮、阳亢、动(内)风; 五官专科病位9项:目——肉轮、血轮、气轮、风轮、水轮,耳,鼻,咽(喉),齿(龈);待定或暂作特殊者9项:气逆、喜、怒、忧思、悲、惊恐,燥屎、结石、毒。 1. 证有那些要素? 研究这个具体内容包括病位和病性的所谓“证的要素”的时候,我们不禁要问:证的要素有那些?根据中医理论,证的要素包括临床表现(症状、体征,或主要证候、次要证候)和病机(病因、病位、病性、病势,或主要病机、次要病机)。如果宽泛一些,根据理法方药的一致性和方证对应原则,还可以将治法、方剂和药物组成纳入证的要素。显然,这不是作者对证素概念的期望。 2. 如何理解证名要素? 那么,作者定义的应该是证的命名要素。古代医籍汗牛充栋,既有八纲、脏腑、六淫、气血津液辨证,也有三焦、卫气营血、六经辨证,辨证体系不同,证的命名各异。概括起来,命名有根据病机、经络、方剂等等,病机的基本的。就病机而言,病因、病位、病性、病势是基本要素,根据绝大多数证名由病位和病性(包含病因和病势)构成的实际情况,作者因此定义了证素并硬性规定了它的外延。其结果,我们不得不抛弃许多驾轻就熟、约定俗成的证侯名称。 3. 什么是不能再分的诊断单元? 为了剔除 辨证中均属于纲领性、较笼统、可以再分的“类”概念,提出 证素是不能再分的具体诊断单元。所谓证侯诊断中不能再分诊断单元,作者也明确指出可称为基础证,实际上就是单一证侯,如脾气虚、心血虚等,而大多数证侯属于复合证,如肝郁脾虚、气滞血瘀等等。本来,将证素理解为基础证、单一证,可能更符合证素的本质,但是作者太难接受,因为其创新性大打折扣,只好丢下一个符合规则的定义。 四、证素概念的应用价值 在中医学中,外感病都有发生、发展和演变的过程,现代传染病学则根据强调病程,那么不同的疾病阶段是否具有导致一定临床表现的主要病机、次要病机呢?我们采用临床流行病学方法进行证侯学调查,试图构建一种分期辨证模型并分析不同阶段的病因病机。结果,证素的概念对我们的工作很有帮助。我们对多种传染病如肺结核、手足口病、H1N1甲型流感、慢性乙型肝炎、慢性乙型重型肝炎、肝炎肝硬化等进行证侯学调查,将高频率的症状、体征列为主要证侯,低频率的症状、体征列为次要证侯,并通过证素(不能再分的诊断单元)分析,得出疾病相应阶段的主要病机和次要病机,从而构建某一疾病的分期辨证模式,取得了初步成果。下一步的工作,是扩大病例数,进一步推广到所有传染病领域,建立一种传染病的分期辨证体系,以代替目前正在应用的与临床实际多有冲突的分型辨证。 附:《证素辨证学》内容简介 本书是研究中医辨证的专著。在继承中医辨证精华,整合八纲、脏腑、六经辨证等实质内容的基础上,创立“证素辨证”新方法。提出中医辨证的思维规律是根据证候,辨别证素,组成证名。以症为据、从症辨证,遵循中医学理论,进行整体综合评判,是中医辨证的原则。证素是构成证的基本要素,是辨证的核心。全书分为辨证方法的研究,证候辨证素量表,证素诊断标准,常见证诊断标准,证素辨证诊疗软件五章,其具体内容规范、准确,系研究的最新成果,具有重大学术意义,用之于临床,能提高中医辨证论治水平。 适用于广大临床中医师,中医学本专科学生、研究生,中医、中西医结合科研人员学习参考。 附:《证素辨证学》目录 引 言 第一章 辨证方法的研究 第一节 “证”有关概念的辨析 一、“证”有关概念的源流 二、“证”有关概念的约定 三、病、证、证候等概念的辨析 第二节 中医辨证学沿革 一、《内经》在辨证学上的贡献 二、张仲景及“六经辨证” 三、八纲辨证的沿革与意义 四、温病辨证的发展 五、脏腑辨证的完善 六、病性辨证的内容 七、经络辨证有待发扬 第三节 辨证思维原理 一、辨证思维原理 二、“证”的三阶双网结构 第四节 通用证素的选定 一、证素的基本特征 二、证素内容的挖掘 三、通用证素的筛选 第五节 证素辨证研究 一、遵循辨证思维原则 二、证候规范研究 三、计量辨证研究 四、建立辨证数据库 五、信息挖掘处理方法 第六节 证素辨证体系 一、证素辨证体系的结构 二、证素辨证的意义 三、证素辨证歌 第二章 证候辨证素量表 一、始因等 二、寒热 三、汗出 四、疼痛部位 五、疼痛性质 六、头身不适感 七、睡眠情志声音 八、咳痰喘黔 九、饮食口味 十、大便 十一、小便 十二、经带精液等 十三、出血 十四、神志面色 十五、头面五官体征 十六、颈胸腹部体征 十七、形体肌肤体征 第三章 证素诊断标准 第四章 常见证诊断 第五章 证素辩证诊疗软件
个人分类: 思考中医|7070 次阅读|0 个评论
[转载]苏联语言学史上不应被忘却的一页
gothere 2011-2-8 23:12
苏联语言学史上不应被忘却的一页 傅杰 转自:南方周末 2007-01-05    已届晚年的斯大林为什么会插手语言学问题?马尔的学说为什么如此引起领袖的关注?马尔又是一个什么样的人物?作为中央机关报的《真理报》展开的语言学讨论是学术分歧,还是政治斗争?请看———      如果不是一些要籍———如高名凯先生写在20世纪60年代初的《语言论》——— 中的大量引录,现在即使是中文系或外文系语言专业的学生,也未必知道时常是一身戎装的斯大林还写过一本曾被列为经典———而且不仅仅是语言学经典的《马克 思主义与语言学问题》。20多年前我还是大学生时参与语言学兴趣小组,我们的导师、一位刚从北方调来的教授首先让我们精读的,不是当时已有中译本的索绪尔 和布龙菲尔德,而正是这本斯大林。至于它在五六十年代的影响,更是只要随便翻翻当时出版的语言学书籍和语言学杂志,就可见一斑———它无疑是当时引用率最 高的“专业文献”。1991年,外研社出版了《许国璋论语言》,集中所收这位1960年代起即名扬全国的英语教材主编的语言学论文却都是1978年以后写 就的,在此之前则是一片空白。许先生自述这并不是由于自悔少作作了删削,而是少而无作,原因即在于1950年代之后,“时以某人某言为训,探索无从”。这 “某人某言”对后来者,也许会成为需要加注的古典;而对过来人,则是不言自明的今典。   但,仅仅把《马克思主义与语言学问题》从专业必读文献中清除出去是不够的。已届 晚年的斯大林为什么会插手语言学问题——或者说是什么促使他对语言学中的马克思主义问题产生了兴趣?这当中有什么前因,又有什么后果?斯大林在书中严词批 驳的马尔学说为什么如此引起领袖的关注?作为中央机关报的《真理报》展开的语言学讨论是学术分歧,还是政治斗争?马尔又是一个什么样的人物?这都是语言学 史或不仅仅是语言学史所不能也不应放过的问题。   俄罗斯语言学博士米哈伊尔·维克多罗维齐·戈尔巴涅夫斯基教授于1988年在 《文学报》上发表了被称为檄文的《关于泰斗的提纲:斯大林关于语言学的那些文章给科学做出了什么贡献》,戳穿了斯大林作为“伟大的语言学泰斗”的神话,第 一次披露了苏联语言学问题讨论的背景和内幕。文章发表之后产生了强烈的反响,既有读者加以鼓励,证实或补充相关事实;也有读者“甚至差一点儿要与我决 斗”。无论哪一类读者都是作者应该报答的,于是作者再接再厉,经过两年的艰苦工作,利用相继解密的包括克格勃档案在内的苏联时期众多内部材料,写就了这部 20余万言的专门著作——《世初有道——揭开前苏联尘封50年的往事》(民主与建设出版社,2002)。   作者在引言中说:“细心的读者根据《约翰福音》的续篇,能读出本书书名的潜台 词:‘太初有道,道与神同在,道就是神。创世之初,道与神同在,世间的一切都由道而开始,没有道,世间的一切便无从开始……’”中译者专门就书名的翻译与 作者作了探讨,综合《约翰福音》汉译本中“太初有道”的“有道”之意和俄语中该句话的表达方式,译为《世初有道》,企图揭示两个层面的意义:一是从创世之 初,语言就作为交际的工具,在人类社会的发展历史中始终占有独特的地位,因此语言问题历来都受到执政者的关注;二是自从有了人类社会,人世间就有了自己的 “道”:人类历史上无论发生过和将要发生什么,世间的“道”始终存在,历史终将恢复其本来的面目,而人类众生中的一切忠奸善恶最终也会是非清楚,泾渭分 明。      马尔在苏联语言学界的统治地位,正是借助斯大林的专制形成的   读过《马克思主义与语言学问题》的人,都会记得斯大林的主要批判对象——马尔;但不一定会知道马尔在苏联语言学界的统治地位,却正是借助斯大林的专制而形成的。   尼古拉·雅科夫列维奇·马尔(1865-1934)是一位很有天赋的学者,在历 史考古和具体语言研究领域作出过重要贡献。但缺乏语言学理论素养的他,偏偏有意把语言科学变成实现他个人思想的实践,试图征服整个世界语言学界。由征服的 欲望带来的自负和因征服的不可能而产生的自卑,使他立誓要与俄国革命前的语言学和国外语言学彻底决裂,而当时苏联的政治形势和政治需要给他带来了前所未有 的契机。他把以前的语言学传统都定性为资产阶级的,把不让资产阶级的语言学说入侵苏联科学当作自己的神圣使命———而保证了苏联语言科学的纯洁性,也就等 于保证了他的“语言新学说”的权威性。   马尔的“语言新学说”认为,语言不是没有阶级性的交际工具,而是上层建筑,人类语言的基础是由4种原始要素组成的:   当人类不仅拥有物质文明,而且拥有上层建筑文明时,便产生了有声语言。譬如,就 像在手势语言占绝对统治时期,即在整个古石器时期形成一定的世界观一样。因此,在劳动和巫术过程中产生的4个声音单元成了语言学的元素,成为重新形成的有 声语言的基础。这时候,人类的生存环境已出现社会性分化,有声语言就成了阶级的语言,并和后来的文字一起都成了统治阶层手中阶级斗争的工具。   从这短短的引文中我们就可以看出,马尔的理论充满矛盾和臆想,完全经不起推敲和 追问。但他既给它们披上了马克思主义的、唯物主义的、无产阶级的法衣,那么质疑者就当然是非马克思主义的、唯心主义的、资产阶级的了。当被追问到4个元素 的来源,当四元素方法受到批评时,这位科学院院士居然强硬蛮横地宣称:“有些东西是不需要证明的,而只能展示!”   马尔十分清楚,在当时,科学领域的许多事情都依赖于职位的影响,而且与职位的影 响力范围相关。据1926年苏联科学院记事手册的记载,马尔的行政头衔不下10个。1930年,他还被授权代表“全苏积极参加社会主义建设的科技工作者协 会”向联共第十六次代表大会宣读贺信,就坐在主席台上的斯大林满意地听着这位科学院副院长慷慨激昂的表白:   苏维埃政权给予科学充分的自由,鼓励和支持在真正的唯物主义世界观的领域中进行 最勇敢、最果断的科学探索。在这样充分自由的条件下,我曾努力发展关于语言的理论学说,在这一领域从事着自己的科学工作,我将与新型科技干部———共产党 员科技工作者和坚定的非党工作者一道继续发展这一理论学说。在经历着尖锐的阶级斗争考验的关键时刻,我认识到不问政治的虚伪性,并很自然地把这种虚伪抛 开。我坚定地站在科学文化战线一名战士的岗位上,捍卫准确的无产阶级科学理论的总路线,捍卫共产党的总路线。   一本1940年代出版的为马尔歌功颂德的传记这样记载:“斯大林在联共(布)十 六大上所作的报告中提出要在无产阶级专政条件下在一个国家内繁荣形式上是民族的、内容上是社会主义的文化,以便使这些文化联合成一种共同的社会主义的文化 并拥有一种共同的语言。这一提纲激发了马尔的新的朝气和力量,他成了斯大林思想的坚定不移的和热情激昂的宣传者。马尔在他自己的著作中不止一次地指出了斯 大林的这些思想的惊人的鲜明和深邃。”马尔的忠心得到了领袖的赏识。会议刚一开完,马尔就被接受为联共(布)党员,而且没有预备期。一年之后,成为全俄中 央执行委员会成员。稍晚经斯大林同意和支持,马尔被苏维埃政府授予列宁奖章,全俄中央执行委员会主席团又授予他功勋科学工作者称号。   马尔的“语言新学说”获得了广泛的宣传和推广,马尔主义者“很快就明白了在与学 术上的反对派进行的斗争中,斯大林的专制为他们提供了无限的可能”。反对马尔新学说的学者被扣上一顶顶政治帽子,遭到批判、解职、流放甚至被迫害致死,从 科学界消失或干脆从生活中消失。书中提供了不止一个让人惊心动魄的例证。“马尔主义的烧瓶中炮制出了有毒的热汤,其剂量足够给所有的反对派服用。”面对这 样的历史,作者写道:   科学上的理论和意见可以有很多,也应该有很多,否则就不可能接近真理,但是只要 有一种理论宣布它是例外,声明说,只有它,只有它一个才是真正的马克思主义理论,而将自己的反对派都贴上政治标签,并采用各种形式的告密手段,那么,事实 上科学就已经停止了自身的发展,发生了最严重的停滞。   这样“最严重的停滞”,在苏联还将持续许多年。      斯大林对语言学问题产生兴趣,并在马尔死后拿他开刀   马尔于1936年病逝。之后他的学生们接替了他的位置,借各种机会继续推行马尔 学说,也继续着他们对持不同观点的语言学家的批判。1949年,苏联科学院主席团召开专门会议,讨论“语言学战线的形势”,并通过决议:马尔院士的“新学 说”是惟一的马克思主义语言学理论,与其相悖的任何其他理论都应坚决予以肃清。一批语言学者被点了名,其中包括格鲁吉亚语言学家契科巴瓦·阿尔诺利德·斯 捷潘诺维奇。但这一次厄运没有再次落到马尔的反对者头上,而是很快就出现了相反的局面。   斯大林为什么对语言学问题和马尔学说产生兴趣,并在马尔死了十多年后拿他开刀? 这是一个难解之谜。在作者看来,其中既有具体的政治原因,又有复杂的心理因素。这或许是为巩固自己的科学泰斗地位(正如中央党报所指出的那样:“他毫不犹 豫地承担起决定许多门科学命运的最高法官的重任”);或许是出于对被视为马克思主义理论权威的马尔的嫉恨(斯大林后来在文章中明确表示了他对马尔说话口气 的厌恶,称“马克思和恩格斯都比他谦虚得多”)。而契科巴瓦则说,斯大林对语言学问题的兴趣实质上跟民族问题有一定的关系。   正是在1949年,契科巴瓦根据格鲁吉亚共产党中央委员会第一书记恰尔克维阿尼 的建议,写了一份《马尔院士的语言阶段分类》的报告。恰尔克维阿尼是当时正在编纂的《格鲁吉亚语详解词典》的主编,而按马尔的语言阶段学说,格鲁吉亚语要 比犹太语和印欧语族中诸语言低一个等级。格鲁吉亚党的领导人关心马尔学说,或许与此有关(契巴科瓦在报告中强调了这一点)。这份报告被呈给了斯大林。作者 推测这个犹太语要高于格鲁吉亚语的理论,有可能使斯大林本人和他的民族感情受到直接的侮辱。次年,契科巴瓦和恰尔克维阿尼带着刚出版的《格鲁吉亚语详解词 典》第一卷在斯大林的别墅受到接见,斯大林与客人讨论了马尔的语言新学说,并授意契科巴瓦把意见“先写出来,我们看看,如果可行,就印刷出版”。   一个月后,《真理报》发表了契科巴瓦的《论苏联语言学的若干问题》,对马尔的语言新学说提出了尖锐的批评。按照斯大林的旨意,报纸宣称将就此展开公开的、自由民主的讨论。   马尔的学生、当时苏联语言学界的头面人物、苏联科学院语言与思维研究所所长麦夏 尼诺夫立刻撰文回击,标题是“为创造性地发展马尔院士的遗产而努力”,声明要建立没有马尔的马克思主义语言学是不可接受的,并强调契巴科瓦的文章是“资产 阶级语言学基本观点的重复”。当时——本书作者描述说——“麦夏尼诺夫的政治嗅觉没能帮助他察觉到,在契科巴瓦文章的字里行间都散发着领袖烟草的甜香味。 其他马尔主义者也没有觉察到危险性,他们已陶醉在即将来临的被尊奉为神的日子里了,习惯地、带有挑衅性地,并毫不犹豫地向对‘新学说’的任何怀疑和批评给 予断然反击。”   契科巴瓦遭到了围攻。一大批学者对他展开了严厉抨击。支持他的人屈指可数,其中 一位是后来成为院士、但在当时还是无名小卒的莫斯科大学语言学副博士谢列勃林尼科夫,他差一点被开除;还有一位是苏联科学院通讯院士、乌克兰学者布拉霍夫 斯基,但他发表文章后却一直惊恐不安,疑心自己站错了立场。这种局面持续到6月20日,语言学的“伟大泰斗”诞生——斯大林的《关于语言学中的马克思主 义》发表。   大讨论结束了。   相关文章源源不断,但不再有任何支持和捍卫马尔学说的只字片语,见报的是以麦夏尼诺夫为主要代表的马尔主义者的忏悔,至少有两位马尔的信徒或因迷惘、更可能是因为恐惧而引发了精神病。著名记者、赫鲁晓夫的女婿阿朱别依概括说:“失败者后悔莫及,胜利者洋洋得意。”   7月4日,斯大林发表了《论语言学的几个问题》,8月2日,又发表了《答同志们》。这些文章的结集,就是《马克思主义与语言学问题》。      领袖的铁掌砸烂了马尔的大棒,一场轰轰烈烈的大批判开始了   斯大林的著作为苏联语言学界摆脱马尔主义的教条扫清了道路。他在文中义正辞严地指责:   在语言学各机构中,无论是在中央还是在其他各加盟共和国,一种与科学和科学工作 者极不相称的制度占据着统治地位。对苏联语言学的状况稍微作一点批评,甚至想对所谓的“语言新学说”做出哪怕是最谨小慎微的批评的表示,都会遭到来自语言 学界领导层的迫害和阻挠,因为对马尔的遗产持批评态度,因为对马尔学说有点不赞同,许多在语言学界举足轻重的语言学家和研究人员被撤了职或降了职。而有些 语言学家被提拔到很重要的岗位,并不是根据他们的业务水平和工作能力,而是因为他们无条件地认同马尔的学说……在语言学界,形成了一个封闭的、自视一贯正 确的领导集团,它能保证自己不受任何可能的批评,它可以在这一领域为所欲为,恣意横行。   斯大林肯定语言学大讨论的意义,“首先是因为它把这种军警式统治制度揭露出来, 并彻底将其打碎”,这是完全正确的。领袖的铁拳砸烂了马尔的大棒,但这丝毫没有改变专制的体制———新的军警式统治形成了,只是更换了旗手而已。对斯大林 思想的更狂热的崇拜,同样严重地影响了苏联语言学的发展。“如果你的文章中没有提到斯大林的小册子,你就连一行文字也别想发表”。因此当时的科学工作者都 必须按照“斯大林学说的精神”来写自己的文章和专著。一本著名的《语言学导论》教科书,有一章引录斯大林的话比自己的论述更多。不仅如此,马尔的得意门生 们也纷纷倒戈,抛弃了自己的导师,开始颂扬和阐释斯大林的语言学说。苏联改组了以马尔命名的语言与思维研究所,解除了麦夏尼诺夫院士的工作,语言新学说在 一系列的会议上遭到批判,一大批人被罢免领导职务、被撤离重要的科研和教学岗位。   作者指出,斯大林并没有给语言学理论作出任何贡献,他对马尔学说的批判,只是重 复了许多俄国和苏联学者早已用各种方式表述过的结论;而他试图表现自己创造力的一些见解,则是可笑和荒谬的。但以权势之大,地位之尊,他的话却成了不容置 疑的权威结论,被作为发现和创造而得到了广泛接受。例如斯大林称库尔斯克-奥尔洛夫斯克方言是俄罗斯语言的基础,这与客观事实相去甚远,语言学家甚至弄不 明白他是从哪里得来的这一假设。但由于这是斯大林的假设,于是在很多年中,引出了诸多毫无结果的科学猜想。一位善于投机的所谓学者还以惊人的快速度炮制出 博士论文,专门证明斯大林的这一“发明”是科学的。就凭这篇论文,他顺利地进入了莫斯科,并在苏联科学院身居要职。   轰轰烈烈的对斯大林的赞颂已远远超出了语言学界,变成群众性的狂热。所有的人都 努力地领会着伟大领袖关于语言问题的论述,其他专业的学者们也迫不及待地用伟大领袖的新理论来武装自己。在莫斯科大学的生物系,贴出了“用斯大林关于语言 学问题的理论观点来研究马拉尔的乌鸦种群问题”这类“科学讲座”的海报。《真理报》出版社出版了维诺格拉多夫院士主编的《论斯大林关于语言学问题的著 作》,宣告:“用斯大林的天才思想武装起来的苏联语言学,开始沿着新的道路前进。语言学理论研究所和各高等院校语文系科研工作的整个计划都作了重新安排。 重新组建的苏联科学院语言学研究所,承担起了以斯大林的指示为指针,改造苏联语言学的方法论基础和语言学的具体研究课题等重大任务。”苏联科学院出版社也 出版了文集《斯大林〈马克思主义与语言学问题〉中的辩证唯物主义和历史唯物主义》,篇目包括:   亚历山大罗夫:《斯大林的〈马克思主义与语言学问题〉———创造性的马克思主义的伟大典范》   维诺格拉多夫:《用斯大林关于语言的学说发展苏联语言学》   尤金:《论斯大林关于语言学的著作对社会科学发展的意义》   斯杰潘尼扬:《用斯大林语言学著作的观点看科学共产主义理论的某些问题》   切尔特科夫:《用斯大林论语言学著作的观点研究辩证法的某些问题》   特罗申:《论斯大林的〈马克思主义与语言学问题〉一书对自然科学的作用》   等等。文集称颂斯大林为“创立了先进科学史上史无前例的学说的科学泰斗”,他的 著作“完成了语言学的转折,开创了苏联整个科学的新纪元”。作者对这本文集给予了高度评价,因为“无论从哪个角度看,特别是从科学历史与专制制度特点的联 系的角度来看,每一篇文章都十分有意义”。一切大大小小的马屁家们或可从中获得激励:他们也是有机会名垂青史的———今天的垃圾,可以成为明天的史料。      警惕斯大林制度的后遗症   回顾历史,作者的心情是沉痛的:“我们的科学和知识分子的命运是多种多样而又错 综复杂的,是悲剧性和自我矛盾的。科学就像一面镜子,映照出我国各族人民曾陷入的那种危机是多么深重。危机的重要原因之一就是制度本身,是斯大林制度及其 遗产。这种危机的后遗症直到现在我们仍然能感受到。”他引录了作家塔尔哈诺夫在回忆录中的沉思:   我联想到一种最毒、最难以制伏的莠草———飞廉草,无论你锄刨得多么深,无论你 怎么用力踩踏,无论怎么折毁它的茎杆,只要它的根还活着,一切都是徒劳的。同样,我们在揭露出斯大林的个人崇拜时,形象地说,只是在日常生活的土壤上除掉 了祸害的茎杆,它的根仍然还活着,并会不断生长。这就使得它们在后来的勃列日涅夫时期还能够再次复发,再次猖獗。   是的,人类历史中的一切都在惊人地重复着。正因如此,历史才是值得我们回忆和反 思的。正因如此,作者才记录下了苏联语言学史上这沉重的一页,“无论这一切有多么荒唐,在过去那些令人悲哀的教训中,除了痛苦以外,还包含有另一番滋味: 那就是对未来的期待和希望———期待真正的自由的到来,希望理性终将获得胜利。正如英明的彼得·恰达耶夫所说:我们无法改变过去,却可以把握未来”。而 “要想把握未来,就必须了解过去”。也正因如此,《世初有道》才值得我们翻译出版,值得我们郑重推荐。   斯大林以权势之大,地位之尊,介入语言学争论,他的话立即成为不容置疑的权威结论,斯大林的著作为苏联语言学界摆脱马尔主义的教条扫清了道路。但对斯大林思想的更狂热的崇拜,同样严重地影响了苏联语言学的发展。   尼古拉·雅科夫列维奇·马尔是一位很有天赋的学者,在历史考古和具体语言研究领域做出过重要贡献。但他的“语言新学说”充满矛盾和臆想,完全经不起推敲和追问。
个人分类: Linguistics|2575 次阅读|0 个评论
镜某也要“革命”了,革师姐的命了。
liwei999 2011-1-4 09:34
立委按:镜子作为语言学的门外汉和哲学家,要挑战专业人士师姐,实际上也是对立委的挑战(不论书上如何讲,镜某对汉语语法的理解是如此。如果国人没有这样的理解,那就要文革了)。本来是应该应对的,词类词性、语言逻辑都是我琢磨了一辈子的问题了,哪里容哲学家来踢场子。可气的是,哲学家的话,用的是另一套符号系统和参照系,而且虽然幼稚可笑而且误导,也不是全无道理。真要有理有节批判镜子,还是需要找对下口的地方,运用相同的符号系统。算了,这次且放过。现在体会到,专业人士遇到哲学家,真有些秀才遇到兵,有理讲不清的感觉,呵呵。说到此,有些开始同情被镜子横扫过的专家们了。 镜某也要革命了,革师姐的命了。 (157421) Posted by: mirror Date: May 30, 2008 07:41PM Shijie: 明明白白:形容词;问题:名词;回答:动词;的、地:助词。 如果说这种语法是师姐科班学来的话,再来个文化革命的理由还是相当充分的。 如何断句明明白白的问题明明白白地回答?师姐给出了个分析。至少是道理不足,或者是说分类方法不妥。明明白白的/问题,明明白白地/回答是个第一近似分析。的、地、得的用法是近代汉语中才确立的。因此单分出来,认为是明明白白/的/问题不妥。应该考虑/明明白白的/是形容词,的的助词作用不是要一个词的分类名目,而是要作到助词--把明明白白这样一个并不明白的、不很确定的词助成了形容词。 与助学金的再助了学之后消失了一样,的即便是助词,与明明白白结合后就消失了本体,助产了明确的明明白白的这样一个形容词了。 不论书上如何讲,镜某对汉语语法的理解是如此。如果国人没有这样的理解,那就要文革了。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 又及: 右派是打出来的、划出来的,并非天然。 (157432) Posted by: mirror Date: May 30, 2008 08:04PM 同理,汉语的词性分类也是打出来的、划出来的。的、地、得就是就是划成分通知书了。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 相当令人震惊的语言学问题:大众错了,常识还能对么? (159033) Posted by: 笑笑 Date: June 04, 2008 09:46PM 寇前候补的指导责任问题很严重哈。。。 引用: mirror 也许是大众的选择错了,这也是常发生的事情。但是,所谓的科学说也同样的不可靠。这是镜某要主张的常识了。 三十年河东,四十年河西。可谓常识也。 (159036) Posted by: mirror Date: June 04, 2008 09:50PM 纳粹的登场,美国人的禁酒,就是大众选择错误的事例了。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 Mammography不知如何翻译的。称为馒馍图像应该是很不错了。-- mirror 更年、忧郁不是到了一定的年纪才会有。 (158607) Posted by: mirror Date: June 03, 2008 07:44PM 随时可能发生。客气是个策略,很多问题可以在客气当中得到解决。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 1)整本《西游记》所述。 (157424) Posted by: mirror Date: May 30, 2008 07:45PM 2)不必灌输,点滴即可。 3)既然是灌输,成功灌输了的,就是应该的。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 因为是神话,中国的神话。 (157439) Posted by: mirror Date: May 30, 2008 08:17PM 都到了神话的份上了,还用解释么?比如悟空为什么要系个虎皮围裙?这个答案在中国文化里有解释。 书中的一招一式都是经过设计的,依照着中国文化,没有丝毫的偏差。据考证,也不是一个人写的,是一个班子人马按图纸设计的故事。 -------- 就是论事儿,就事儿论是,就事儿论事儿。
个人分类: 镜子大全|2485 次阅读|0 个评论
2009国家社科基金项目及西部项目一览表
carldy 2010-12-24 15:17
【备注】这里引用来自2009年国家社科基金项目及西部项目一览表,供研究参考;其中划线的是采用语料库作为研究工具的。 国家社科基金项目语言学类2009年项目共150项 面上项目共124项 序号 项目名称 负责人 所在省市 工作单位 项目类别 预期成果 计划完成时间 一般项目 1 脑功能成像视角下的汉语隐喻认知神经机制研究 王小潞 浙江 浙江大学 专著 2012-6-30 2 面向文本内容提取的生成性组件库研究与建设 穗志方 北京大学信息科学技术学院 研究报告电脑软件 2011-12-31 3 认知语言学方法比较研究 束定芳 上海外国语大学科研处专著 2011-12-30 4 汉语和英语儿童对语义逻辑习得的对比研究 高立群 北京语言大学对外汉语研究中心专著论文集 2012-12-31 5 对外汉语考试的理论框架与测试模型研究 刘壮 首都师范大学国际文化学院 研究报告专著 2010-12-31 6 大学英语教学发展现状调查及对我国外语人才培养政策制定的影响研究 蔡基刚 复旦大学外国语言文学学院 专著研究报告 2010-12-31 7 汉语复杂网络研究 刘海涛 中国传媒大学 研究报告电脑软件 2012-6-30 8 基于语法化理论的汉语兼类虚词习得顺序研究 高顺全 复旦大学国际文化交流学院 专著 2012-6-30 9 基于有声语料库的实验方言学构建 刘俐李 南京师范大学文学院 专著电脑软件 2012-6-30 10 我国大学生英语句法能力与句法多样性的相关研究 夏伟蓉 西南交通大学外语学院 论文集研究报告 2012-12-31 11 中国学生英语树库建设与研究 梁茂成 北京外国语大学 电脑软件研究报告 2010-3-9 12 建构《俄汉平行对照语义关系词典》的理论与实践 张家骅 黑龙江大学俄语语言文学研究中心 论文集工具书 2012-6-30 13 楚简与秦简的古文字学比较研究 陈伟武 中山大学中文系 专著 2012-6-30 14 基于数据库的零形回指解析方式实证研究 蒋平 南昌大学外国语学院 专著论文集 2012-6-30 15 三百种明清小说俗字研究 曾良 厦门大学中文系 专著 2012-12-30 16 语义参照下的汉语生成句法研究 曹道根 浙江大学语言与认知研究中心 专著论文集 2012-6-30 17 多视角下的中古汉译佛经词语特质研究 陈文杰 南京大学文学院 论文集 2010-10-1 18 功能性言语的类型学研究 娄琦 牡丹江师范学院 专著 2011-6-30 19 基于事件过程结构的汉英表达式对比研究 税昌锡 贵州师范大学文学院 专著 2011-12-31 20 中国学生英汉语心理词库构建模式对比研究 张萍 东南大学外国语学院 论文集专著 2011-12-31 21 人口跨域流动中的语言问题及对社会语言生活的影响研究 武小军 西华大学人文学院 研究报告 2012-12-31 22 信、达、雅接受史中的中西译理融合研究 谢思田 对外经济贸易大学外语学院 专著论文集 2012-7-30 23 晚清翻译史论 王晓元 上海大学外国语学院 专著 2012-12-30 24 河北方言语法比较研究 吴继章 河北师范大学文学院 专著 2012-8-31 25 豫北方言语法音变及其类型学研究 辛永芬 河南大学 专著研究报告 2011-6-30 26 广西平话方言地图集 李连进 广西大学文学院 专著 2012-7-31 27 湘南濒危土话抢救性研究 谢奇勇 湖南科技大学人文学院 研究报告专著 2012-12-31 28 江苏东北部多方言交界地区方言的语言地理学研究 苏晓青 徐州师范大学语言所、文学院 专著论文集 2012-12-31 29 和平繁荣视野下中国和东盟国家外语政策的对比研究 王晋军 云南大学外语学院 专著 2012-7-30 30 大学生英语学习社会心理:高年级阶段跟踪研究 高一虹 北京大学外国语学院英语系研究报告 2011-12-31 31 在城市化进程中的方言接触与城郊方言的演变 薛才德 上海大学文学院 专著 2012-6-30 32 基于网络媒体监测语料库(汉语)的性别语言比较研究 李向农 华中师范大学 专著研究报告 2010-3-17 33 台湾海峡两岸三地法律文本汉/英双语平行语料库建设和研究 陈伟 武汉理工大学 专著电脑软件 2012-12-31 34 方言儿童的元语言意思及其双语效应和迁移 李荣宝 福建师范大学外国语学院 论文集 2012-8-30 35 二语习得视角维吾尔族大学生英语学习现状调查研究 李睿 西北民族大学 研究报告专著 2011-12-31 36 依托项目的外语教育模式及本土化研究 张文忠 南开大学外国语学院英语系 论文集研究报告 2012-6-9 37 网络环境下大学英语自主学习有效干预模式的研究 谢福之 首都师范大学大学英语教研部 研究报告论文集 2011-9-1 38 新兴本科翻译专业课程体系及教学模式的构建研究 贺学耘 湖南衡阳师范学院 专著论文集 2011-12-30 39 以发展综合认知能力为目标的英语教学研究 吴本虎 浙江师范大学外国语学院 专著论文集 2011-1-20 40 基于词典生成系统的新一代英汉双解学习词典的研编 章宜华 广东外语外贸大学 工具书 2011-12-31 41 《资治通鉴音注》音系与宋元语音的比较研究 马君花 北方民族大学文史学院 论文集 2012-8-31 42 元代汉语音系研究:基于八思巴字文献资料 宋洪民 鲁东大学汉语言文学院 专著 2011-12-30 43 两汉出土文献文字研究 徐正考 吉林大学文学院 专著 2012-12-31 44 《五经正义》词汇研究 杨云香 郑州大学 专著 2010-6-30 45 早期天师道文献词汇描写研究 俞理明 四川大学 专著 2012-7-30 46 初唐佛典异文考辨 王绍峰 阜阳师范学院科研处 研究报告 2010-12-31 47 从泰西、海东文献看明清官话之嬗变 陈辉 浙江大学韩国研究所 专著 2012-6-30 48 汉魏六朝人物品藻词语研究 宋闻兵 宁波大学文学院 专著 2012-6-30 49 简帛典籍异文集录与考订 吴辛丑 华南师范大学 工具书论文集 2012-5-30 50 明清俗语辞书及其所录俗语词研究 曾昭聪 暨南大学 专著 2012-6-30 51 东汉-隋本缘部汉译佛经定中结构研究 许剑宇 杭州师范大学人文学院 专著 2012-12-31 52 古汉语虚词理论及虚词词典编纂理论研究 章也 内蒙古师范大学 专著 2012-3-15 53 汉语形容词的历时演变 石锓 湖北大学文学院 专著论文集 2011-12-30 54 现代汉语单音节手部动作动词的ICM(典型认知模型)研究 延俊荣 山西大学语言科学研究所 研究报告 2012-6-30 55 贵州荔波喀斯特地区土著民族语言与英汉对比研究 韦启卫 黔南民族师范学院外语系 专著工具书 2011-12-22 56 当代汉语新生词族的构词能量、衍生机制及其理论建构研究 杨文全 四川大学文学与新闻学院 专著 2012-9-30 57 普通话二字词句法语义属性标注及其饱和度研究 刘贤俊 首都师范大学文学院 研究报告 2012-9-30 58 闽东方言语音变异的现代音系学研究 陈泽平 福建师范大学文学院 专著论文集 2011-12-13 59 13-14世纪蒙汉语接触及蒙古语文献中的汉语借词研究 哈斯巴根 内蒙古师范大学 专著 2012-10-31 60 蒙古语与汉语动词谓语句对比研究 德力格尔玛 中央民族大学蒙古语言文学系 专著 2012-12-26 61 维吾尔语哈密方言研究及音档建设 阿尔斯兰阿不都拉 新疆大学人文学院 专著电脑软件 2011-12-30 62 藏语方言调查字表及辅助系统研究 达哇彭措 西北民族大学 论文集工具书 2012-6-30 63 汉语和藏缅语族语言体范畴的类型学比较研究 罗自群 中央民族大学 专著 2010-3-16 64 十一世纪末以来的缅甸语语音研究 岳麻腊 云南民族大学民族文化学院 专著 2012-7-30 65 侗台语中接触引发的语法演变和变异 吴福祥 中国社会科学院语言研究所 专著论文集 2011-12-30 66 普米族韩规古籍译注 谭超 云南师范大学文学与新闻传播学院 译著 2011-6-1 67 语言接触与湘西苗瑶平话调查研究 胡萍 中南林业科技大学 专著 2011-6-30 68 短语理论与语料库的教学加工 何安平 华南师范大学 专著研究报告 2012-3-1 69 伯克修辞学思想研究--兼论汉英修辞学思想的差异 鞠玉梅 曲阜师范大学外国语学院 论文集研究报告 2012-5-1 70 新疆英译外宣文本问题与对策研究 谢旭升 新疆大学外国语学院 专著 2012-6-30 71 英汉语中冲突性话语的构建模式及其制约机制的语用分析 冉永平 广东外语外贸大学 论文集 2012-6-30 72 大学英语学习可持续发展能力的I-CARE培养策略研究 张森 河北科技大学外国语学院 研究报告 2011-12-30 73 口译职业资格认证测试的理论体系和运作模式研究 陈菁 厦门大学外文学院英文系 论文集研究报告 2012-6-30 74 全国高等学校英语专业本科毕业论文写作评审(测试)效度研究 修旭东 鲁东大学外国语学院 专著研究报告 2012-12-31 75 社会性网络环境下中国英语学习者英语交际策略及互动模式研究 武和平 西北师范大学外语学院 专著论文集 2012-6-30 76 俄汉社会性别语言的语用对比研究 周民权 苏州大学外国语学院 专著 2012-7-1 77 面向信息处理的俄汉语言模型策略 薛恩奎 黑龙江大学俄语语言文学研究中心 专著 2012-6-30 78 对中国日语学习者偏误的认知语言学研究 王忻 杭州师范大学 专著 2012-12-25 79 日语复合动词教学方略研究 张威 清华大学外语系 专著论文集 2011-6-19 80 中日韩三国语言文化比较研究 施晖 苏州大学外国语学院 专著 2012-12-31 青年项目 81 管辖音系学声调理论研究:模型构建及应用 贺俊杰 陕西师范大学外国语学院 论文集研究报告 2011-6-30 82 广义类型学视野中的判断句研究 张军 中国社会科学院 专著 2010-3-17 83 中国古典诗词中的隐转喻现象 高原 中国科学院研究生院外语系 专著研究报告 2012-7-1 84 基于语料库的英汉程度副词的极性特征对比研究 黄瑞红 上海财经大学外语系 研究报告 2011-12-31 85 本科翻译专业的测试研究 肖维青 上海外国语大学英语学院 专著研究报告 2012-9-1 86 基于类比语料库的翻译文本中的搭配特征研究 武光军 北京第二外国语学院英语系 专著论文集 2011-12-31 87 《蒙古秘史》的多维翻译研究 邢力 北京航空航天大学外语学院 专著研究报告 2011-12-31 88 基于语料库的中医典籍英译研究 兰凤利 上海中医药大学外语教学中心 专著研究报告 2011-12-31 89 内陆闽语的现状与历史研究 邓享璋 三明学院中文系 专著 2010-3-18 90 吴方言虚词的语法化与类型学考察 郑伟 上海师范大学人文与传播学院 专著论文集 2012-6-30 91 江淮官话语音的比较研究 吴波 南京师范大学文学院 专著 2013-12-31 92 语言文化生态与新疆少数民族大学生的民族认同研究 江承凤 塔里木大学人文学院 论文集研究报告 2011-6-30 93 中国高考汉语言测试的调查与研究(1977年后) 桑哲 曲阜师范大学 专著 2012-6-30 94 中西媒体中的危机话语研究及其对策 冯捷蕴 对外经济贸易大学英语学院 专著 2012-6-30 95 28岁儿童修辞性语言发展研究 郑荔 南京师范大学教育科学学院 论文集研究报告 2011-6-30 96 汉语轻动词的功能性磁共振成像研究 封世文 徐州师范大学语言科学学院 专著研究报告 2012-12-31 97 基于语料库的理工科大学生英语口语教学与评估一体化研究 刘芹 上海理工大学外语学院 论文集研究报告 2011-12-31 98 汉字与非汉字文化圈留学生汉语篇章阅读模式及阅读效率的比较研究 于鹏 天津师范大学 专著 2010-12-31 99 留学生汉字习得实证研究 王骏 上海交通大学国际教育学院 专著研究报告 2012-12-31 100 法律术语译名统一与规范化研究 屈文生 华东政法大学外语学院 专著论文集 2012-10-1 101 搜索引擎用短语词典的语法理论和构建方法研究 吕学强 北京信息科技大学 论文集电脑软件 2011-7-1 102 《切字捷要》与 《韵法直图》的关系及相关问题研究 李军 南昌大学人文学院中国语言文学系 专著论文集 2012-6-30 103 敦煌文献中的于阗文咒语对音对音研究 李建强 北京大学外国语学院 研究报告 2012-12-31 104 基于语料库的关联标记语体差异性研究 姚双云 华中师范大学 专著研究报告 2012-6-30 105 批评语篇分析的修辞评价模式及其应用研究 李艳芳 郑州大学 专著 2011-6-30 106 汉藏语名量词起源、演变的类型学研究 蒋颖 中央民族大学 专著 2012-6-30 107 副词的语用分析及相关语音问题研究 徐以中 南京航空航天大学外国语学院 专著论文集 2011-7-1 108 美国大报(2008-2010)之中国形象的语料库语言学方法辅助下的批评话语分析 唐丽萍 河北师范大学外国语学院 专著研究报告 2011-12-31 109 对双语语料库介入下学生译者翻译能力的计算机辅助实验研究 朱玉彬 安徽大学外语学院 专著电脑软件 2011-10-30 110 任务型语言教学与测试中听力理解任务的难度评估研究 潘之欣 上海交通大学外国语学院 专著 2011-12-31 111 中国学生汉译英机助评分模型的研究与构建 王金铨 扬州大学外国语学院 研究报告 2011-12-31 112 英、汉、日语模糊限制语的对比研究 张勇 贵州师范大学外国语学院 专著 2012-6-30 113 中国法语教育史 徐艳 中国人民大学外国语学院 专著论文集 2012-7-1 114 秦汉时期楚方言区文献的语音研究 谢荣娥 湖北省长江大学文学院 专著 2011-7-30 115 古文字字系研究 郝士宏 安徽大学中文系 专著 2012-9-30 116 齐系文字材料的整理与研究 张振谦 河北大学人文学院 专著工具书 2011-7-1 117 西周金文字词关系研究 田炜 复旦大学 专著 2011-6-1 118 战国楚系简帛用字习惯研究 禤健聪 广州大学 人文学院 专著 2012-6-30 119 两汉语法比较研究 魏兆惠 北京语言大学人文学院 研究报告 2011-3-11 120 全方位、多层次比较下的东汉特殊语法研究 葛佳才 湛江师范学院中文系 专著论文集 2011-12-31 121 现代汉语非现实范畴的语义句法研究 李敏 上海交通大学 专著 2010-12-31 122 现代汉语言说动词 吴剑锋 上海交通大学国际教育学院 专著 2012-6-30 123 现代汉语语气助词的主观性与主观化研究 何文彬 四川师范大学文学院 专著论文集 2012-12-31 124 汉语语体语法研究 朱军 湘潭大学 专著 2012-12-30 西部项目26项 1 认知诗学与文学批评新接面研究 马菊玲 宁夏大学外国语学院 专著 2012-6-30 2 基于汉英平行语料库的翻译文体学研究 黄立波 西安外国语大学 研究报告、工具书 2012-12-31 3 汉语方言接触视角下的四川客家方言研究 兰玉英 成都信息工程学院 专著 2012-6-30 4 近代西北方言文献研究 莫超 兰州城市学院文学院 专著 2011-12-20 5 新疆汉语方言研究 董印其 新疆师范大学 专著 2012-7-31 6 新疆少数民族双语教育中存在的问题及对策研究 米娜娃阿不都热依木 新疆社科院 专著 2011-12-30 7 花儿语言民俗研究 曹强 渭南师范学院中文系 专著、电脑软件 2011-12-31 8 民族地区双语环境下回族女童英语学习现状调查分析--以宁夏回族聚集地区为例 田凤俊 宁夏师范学院外国语学院 论文(集)、研究报告 2011-5-10 9 英语教学场论研究与应用 阎佩衡 西北民族大学 专著、研究报告 2012-6-6 10 基于新疆少数民族习得汉语语料库的偏误研究 崔新丹 新疆大学语言学院 论文(集)、研究报告 2011-12-31 11 语言文化生态环境视野下的新疆少数民族双语教学研究 付东明 新疆师范大学 研究报告 2011-12-30 12 面向语言学的东亚文字字体及输入法 李龙 广西大学文学院 电脑软件 2012-7-31 13 唐五代《切韵》系韵书研究 仝小琳 四川师范大学文学院 专著 2011-12-31 14 魏晋南北朝敦煌汉文纪年写卷常用字形研究 肖瑜 广西大学文学院 研究报告 2011-12-31 15 金文复音词与上古汉语复音化研究 杨怀源 西南大学文学院 专著 2012-8-30 16 科尔沁地区蒙古语使用现状及其演变研究 王顶柱 内蒙古民族大学 专著 2012-12-31 17 蒙古语标准音水平测试等级标准研究 山丹 内蒙古社会科学院 专著、电脑软件 2012-12-30 18 中世纪蒙古语句子结构研究 于权 内蒙古民族大学 专著  2012-7-1 19 城市化进程中的维吾尔语言变异研究 热孜婉阿瓦穆斯林 新疆师范大学 研究报告 2012-7-31 20 回鹘医学文书研究 阿布里克木亚森 新疆大学人文学院 专著 2011-9-30 21 基于六书理论的西夏文字分析 韩小忙 陕西师范大学历史文化学院 专著 2012-12-30 22 西部裕固语与维吾尔语词汇比较研究 王新青 新疆大学语言学院 专著、研究报告 2011-9-20 23 现代维吾尔语句模研究 徐春兰 新疆农业大学中国语言学院 专著 2011-7-30 24 藏族远程教学资源库建设 才智杰 青海师范大学民族师范学院 工具书 2011-12-31 25 云南省东南亚语种(泰、缅、越、老、柬)基础教学规律研究 刘晓荣 云南民族大学东南亚南亚语言文化学院 研究报告 2011-6-30 26 面向机器翻译的日中翻译难点分析及其翻译规则的制作 卜朝晖 广西大学外国语学院 研究报告、论文(集) 2012-7-31
个人分类: 语言学探讨 Linguistics|8781 次阅读|1 个评论
[转载]美国当代著名学者乔姆斯基教授将访问北京大学并进行公开演讲
timy 2010-7-31 17:11
From : http://www.newsmth.net/bbstcon.php?board=NLPgid=9740 标 题: 美国当代著名学者乔姆斯基教授将访问北京大学并进行公开演讲 发信站: 水木社区 (Fri Jul 30 13:20:07 2010), 站内 http://www.chomsky-in-asia.info/beijing/?p=18 2010年乔姆斯基教授北京大学演讲会 暨北京大学授予乔姆斯基教授名誉博士学位仪式 演讲嘉宾:诺姆.乔姆斯基,美国麻省理工学院学院教授 主办单位:北京大学 协办单位:北京语言大学、清华大学、北京论坛 演讲题目:Contours of World Order: Continuities and Changes 演讲地点:北京大学百周年纪念讲堂观众厅 演讲日期:2010年8月13日(星期五) 演讲时间:晚上7时 演讲语言:英语(500坐席设同声传译耳机)
个人分类: 同行交流|3686 次阅读|1 个评论
《立委随笔: 犯情节》
liwei999 2010-7-29 16:30
拉2爷,你比我起得还早啊?大周六的。 (120456) Posted by: liwei999 Date: December 01, 2007 07:25AM 回头想,你的批评是中肯的,就是语言学上没明白那个动宾结构的说法(犯情节)是你天才生造的词呢,还是有个习惯语的来源。 现代汉语很多类似动宾结构的习惯语,动词和宾语是有固定搭配的才出语义,可以不符合逻辑和常识,比如: 吃食堂 (吃的可不是食堂) 吃豆腐 (吃的也不是豆腐) ...... 还有主谓固定搭配: 倒霉/姥姥来了 (来的可不是倒霉和姥姥,而是例假) 猫叹气 (猫并不会叹气,而是一种密封容器,这个算合成词了)
个人分类: 立委随笔|2238 次阅读|0 个评论
《立委随笔:语言这东西,挺好玩de》
liwei999 2010-7-23 00:38
副词“都”/“也”用到句末,这个现象是怎么发生的? (116009) Posted by: liwei999 Date: November 09, 2007 10:30AM 我一直奇怪。 好像只有口语有这种用法。甚至我到北京上学前也从来没有见过这样用的,也许是北方口语?师姐也许知道怎么回事。 还有两个现象也很 strike me: 1. 用“有”表示完成体,好像先从台湾传过来的:我有看这个电影。(比较英语助动词have,感觉很妙。) 2. 句末用“...地说”,冰姑娘特别爱这么用,据说来源于日语,毛姑姑地说。 至于汤团这些老散仙的语言风格和措词,就更有特点,俨然成为网络方言。 语言这东西,挺好玩的。 约定俗成。 (116017) Posted by: shijie Date: November 09, 2007 10:51AM “都”放到句末是口语用法。“也”放在句末应该是古汉语用法,现在口语有这么用的吗?我没听说。 “有”表示完成体是闽方言用法,台湾话属于闽方言。闽方言不限于福建境内,广东、海南、浙江都有。“有”的这一用法是通过台湾传媒进入内地闽语区以外的地区的。 “……地说”不知道是不是来源于日语。在现代汉语中表示的是一状态,如:负责任地说、小声地说、高高兴兴地说…… 网络语言是一种社会性方言,存在于一定的群体中。不论其是否符合实际语言,只要在群体中约定俗成,能完成交际即可。 我从小就经常这样用。语言能力差的表现。 (116159) Posted by: Anonymous User Date: November 10, 2007 01:36AM 把要紧的词先说出来,不要紧的在最后面补上。 十二点半了都,你吃饭吗还? 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|2274 次阅读|0 个评论
从2010年国家社科基金项目成功立项说开去
热度 1 carldy 2010-6-18 21:09
用简短的文字记录下昨天的喜讯与当时的心情: 昨天在外忙乎了一整天,回到家已经很疲备了。加上连续多天的暴雨,出门很不方便,心情也就可想而知不会好到哪里去。正与家人聊天,手机响了,时间刚好18:00点整,一看号码,是兄弟立波打来的电话。他激动的话语告诉我,今天有喜事了。他高兴地说:老兄,你得请客了。什么好事情?今年申报的国家社科基金课题获得批准了。 当时很难相信这是真的,无论从哪方面,条件都不是特别理想(除了自己的认真之外),所以自己从来没有去想过。 这两三年参与了一项国家课题,也主持了多项课题,深谙此类课题研究的艰辛与责任。 【当时心情的写照】非常感谢所有关爱我的老师、朋友、兄弟们对我的指导、鼓励与帮助,让我有勇气去申报这类高难度的课题。 立波告诉我,评审结果可以从全国哲学社会科学规划办公室网站 http://www.npopss-cn.gov.cn/ 查询,让我下载评审结果好好看看。 打开电脑,找到网站,看到了醒目的头条新闻 2010年国家社科基金年度项目和西部项目评审结果公布 (2010.6.17) ,打开链接,下载了。 好好看看。 我申报的类别是语言学。 今年国家社科基金立项中,语言学有157项(其中重点项目7项,一般项目103项,青年项目47项)。 我初步统计了一下,将近20项都是与语料库相关的。本人的课题名称是基于语料库的译文源语透过效应研究。 【特别致谢】 该课题的申报成功,首先得感谢浙大肖忠华教授的悉心指导。本人自认识他以来,尤其是参与他主持的国家社科基金项目以来,学到了很多(如语料库知识与技巧),也获得了无微不至的帮助,更重要的是他的治学之严谨、为人之慷慨善良,实在让我感佩,也认定了自己的努力方向。 感谢黄立波、贺文照等兄弟。兄弟情怀,实乃人生一大幸事、乐事,他们时时给我鼓励与帮助; 感谢吴世雄教授,每年都鼓励我申报课题,并无怨无悔地帮我填写推荐信。 感谢校系领导对我本人的厚爱,对我教学科研工作的支持与帮助。 感谢我的学生,是他们激发了我在教学中无尽的灵感。 感谢不尽的,是我的家人与孩子。 还有很想感谢但是此情已无法传递到的人那就是我刚刚去世的父亲。他勤劳,善良,无怨无悔抚养我们兄弟姊妹。他永远是一座不跨的大山,支撑我不断攀登。 【言归正传】 该项目立项成功,对我来说,是一个极大的挑战。万里长征才开始,脚下的路还很长,要学的东西太多,要做的事情太多,我只能一步一个脚印,勇敢地走下去。 不要辜负了这一份责任。 坊间有很多关于国家社科基金的传说,几近神话,当时我确实不敢动笔去填写申报表。但我几乎是没有去多想,权当一次练笔,尤其称得上一次思维大整理:把脑海中那些还未成型的想法、观点用文字表达出来,而且要把课题论证材料(包括如下内容:本课题国内外研究现状述评及研究意义;研究的主要内容、基本思路、研究方法、重点难点、基本观点和创新之处;前期相关研究成果和主要参考文献等)控制在4000字以内,这本身就是一种思维的挑战 。 我自己感觉:日常生活中还不习惯于抽象思维,至少没有养成一种透过现象看本质、把感性的东西提升为理性思考的习惯。语言可以让自己静下来,理性思考,用钱冠连老师的话来说语言让自己出场。 很高兴,我能突破这一局限,这就是自己最大的收获。
个人分类: 生活点滴 Inspirations from Life|4865 次阅读|5 个评论
为什么冰箱不是用来放冰的?
harmonism 2010-5-17 23:02
为什么冰箱不是用来放冰的? 曾纪晴 下午,儿子在玩妈妈清理冰箱清出来的冰。突然,他问道: 爸爸,为什么冰箱不是用来放冰的,而是用来放菜的呢? 儿子的提问让我们全家会心而笑! 哈哈,多有趣的问题啊。大家知道,水箱当然是用来储存水的,工具箱是用来存放工具的,公文箱是用来存放公文的,乐器箱是用来存放乐器的,医药箱是用来存放医疗药品及医疗用具的 但冰箱为什么却不是用来存放冰的呢? 我稍加总结归纳了一下,发现 X 箱的说法大约有这个几类: 1 ,箱子是用来存放东西的:比如,水箱、工具箱、公文箱、乐器箱、医药箱、行李箱、垃圾箱、果皮箱等等。这类 X 箱的说法指的是此类箱子是用于存放 X 的。 2 ,箱子本身的材料是什么做的:比如,纸箱、皮箱、木箱、铝箱、 铁箱等等。这类 X 箱的说法指的是此类箱子是由 X 材料做成的。 3 ,箱子的功能,即箱子的用途是什么:比如试验箱、人工气候箱、旅行箱、干燥箱、培养箱、包装箱、急救箱等等。这类 X 箱的说法指的是此类箱子是的功能或用途是用来做 X 的。 4 ,箱子本身所具有的某种特征:比如,黑箱、集装箱等。 那么,冰箱这种说法属于哪类呢?我们来看看,如果是第一类,那么冰箱就是用来存放冰块的了,显然是不对的。再看第二类,冰箱显然不是指用冰做成的。看看第三类,冰箱的功能是用来冰东西的,这回似乎对头啦!不过,这里的冰是动词,而不是名词。但是,冰也有冰冷的意思,可作形容词。这样,冰(冷)又可作为某种特征。那么,冰箱似乎又可以是第四类了。 呵呵,儿子的有趣问题,让我们第一次仔细地考察了冰箱及其各类箱的语言学结构问题,收获不小啊! 2010-5-16
个人分类: 天和之路:一个父亲的育儿日记|3963 次阅读|2 个评论
王玉锋分析语言、言语、语言行为三者之间的关系
wangyf1970 2010-5-16 20:31
有一位语言学专业的人问我:能否给我举个形象点的例子,说明语言、言语和语言行为三者之间的关系? 这个问题有些难度,因为我看了那么多文献,还没看到有谁讨论这个问题。对于索绪尔提的语言、言语这两个术语如何理解?各家说法不一,我看到的至少有几十种说法。语言行为更是一个相当抽象的概念。 我颇为费力地思考了许久,依据我对语言本质的研究,回答他说 如果打比方,那我觉得好比军队、军人和军纪。因为语言所指大致是语言系统、由一个个言语组成的系统,言语指具体的一次语言,每个语言可以同时被理解为是一次语言行为,这关系就好象军队是由一个个军人组成的团队、系统,每个军人有着不同的军内地位,举例来说,你见到连长时和见到小兵时,所行礼就不一样,这就相当于每个军人有着不同的军纪意义对应着每个言语对应着不同的语言行为。 估计他是要完成什么论文什么的,拿了我的观点去,颇得导师的好评,所以他对我的回答大为欣赏。 这篇论文可用于语言学家参考。
个人分类: 未分类|5730 次阅读|2 个评论
这语言学也可以遗传?
liwei999 2010-3-4 05:32
这语言学也可以遗传? (851 bytes) Posted by: 立委 Date: March 03, 2010 02:24PM 甜甜在学校是公认的语法最强的学生,她自己为此很自豪,也很喜欢 diagram 句子的主谓宾结构。我并没有教她啊,她自己突然就喜欢起语言结构分析来,乐此不疲。遇到句子就琢磨一下语法。 当然与老师有关,她很喜欢那个教语文的老师,虽然很严厉,但是人很风趣,而且无比骄傲,他总告诉学生:don't argue with me, I am always right. No one can prove me wrong because I am smart. 他还经常嘲笑其他老师教学深度太浅。甜甜还真吃他这一套。 我告诉他,你有个 linguist PhD Dad,不用迷信他这个权威。甜甜说,some day I will prove him wrong. Maybe when he is old, we can challenge him to prove him wrong. 然后学着老人的颤巍巍的声音说:no, this is not a predicate nominative, this is a predicate adjective. You are wrong. 学得那赢了老师的得意样子让我笑得肚子疼。 我要是鼓励她的话,很可能就立下志向做语言学家了。我不想这么引导她,看过太多的学富五车的语言学家找不到工作的窘境。
个人分类: 成长花絮|3279 次阅读|2 个评论
Oxford出版的《语义学杂志》被SSCI收录
wanyuehua 2010-2-27 03:39
1982 年创刊的Journal of Semantics《语义学杂志》,ISSN: 0167-5133,季刊,英国(OXFORD UNIV PRESS, GREAT CLARENDON ST, OXFORD OX2 6DP, ENGLAND)出版,2009年入选 Web of Science的Social Sciences Citation Index,目前在SSCI数据库可以检索到该期刊2008年的第25卷第1-4期到2010年的第27卷第1期共29篇论文。 29 篇文章包括学术论文 28 篇、社论 1 篇。 29 篇文章的主要国家分布:美国 14 篇,加拿大、荷兰、英国各 4 篇,法国、以色列各 2 篇,中国 1 篇。 中山大学(Sun Yat Sen Univ)在该刊的2009年26卷第3期发表题为Counterfactual Donkey Sentences: A Response to Robert van Rooij的 社论。 该刊主要刊载自然语言语义学、哲学、心理学和语言语义学,以及与人工智能有关的语义学等领域的研究论文、札记、讨论和书评。 网址: http://jos.oxfordjournals.org/ 编委会: http://www.oxfordjournals.org/our_journals/semant/editorial_board.html 作者指南: http://www.oxfordjournals.org/our_journals/semant/for_authors/index.html
个人分类: SSCI投稿|4671 次阅读|0 个评论
【立委科普:语言学的基本概念】
liwei999 2010-2-10 07:11
语言学是语言的学问,这学问的引人入胜之处,就在于其研究对象”语言”是一个人人知其然,很少人知其所以然的复杂的系统。复杂到什么程度呢,总之是很容易陷进去出不来。能出来的人不多,立委自以为是出来人,因此,斗胆开讲语言学学理讲座。外行看热闹,内行看奥妙,陪伴各位做一次语言学揽胜之旅。 谈语言学,从基本概念起。 1 语言 语言的本质是人类的交流工具。这句大白话我们在学理的讨论中会反复引用,以示人们在语言学的不毛争论中多么容易偏离这一基本常识。 乔老爷的形式语言理论创立以后,语言定义为合法语句的集合。这个理论是计算机语言及其汇编的基石,对于自然语言(natural language)也有很好的借鉴意义(如果能够正确理解语法的话)。 把语言看成语句(sentence)的集合,意味着语句成为语言研究的基本对象。实际上语言不是简单的语句集合,语句之上还有篇章(discourse)结构,还有跨句回指(co-reference, 比如”他”回指前句的”张三”)。为简化学理的讨论,这次揽胜之旅不再涉及篇章语言学,一切限于语句之内。换句话说,作为理论的第一近似,语句是语言研究的最大单位。 2 语言研究的目的 目的可以有很多种,务虚的目的包括探询语言的本源,语言和思维的关系,语言理解的心理机制等等。立委乃计算语言学人,不尚务虚,因此本讲座限于务实的宗旨。具体说,主要为了支持电脑分析(parse)和生成(generate)语言。 3. 自然语言理解 语义(semantics)是内容,语言是形式,分析和生成就是建立语言和语义的连接。由语言达至语义是分析的宗旨,由语义外化为语言是生成的目标。什么叫做理解了呢?就是从语言的一句句话,解析出了相应的语义。在电脑自然语言理解里,解析出的语义表达(representation)称为逻辑形式(logical form),它是 parsing 的目标。 语义主要由两部分组成,即词汇意义和语法意义。词汇意义建立单词和概念的联系,是词典的任务。当一个个词排列成句的时候,句子的含义不是这些词汇意义的简单相加,而是涉语句结构及其语法意义,它决定了词汇意义转化为语句整体意义的组合方式(所谓 semantic compositionality),从而实现理解,达到交流的目的。形象地说,词汇意义好像散乱的珍珠,是语法意义把它们串接成理解的项链。如果一句话描述了一个事件(侧面),理解就是要求解 who (施事) did (动作) what (受事) when (时间), where (地点), how (方式) and why (原因) 等等。施事、受事、时间、地点等叫做语义角色(semantic roles)。 看下列例句:奥运会开幕式定于2008年8月8日晚8时在北京举行。 查词典可得词汇意义,用括号表示:(奥运会) (开幕式) (定于) (2008年) (8月) (8日) (晚8时) (在) (北京) (举行) . 所以,分析理解的关键是解析(decode)内含的语法意义。句子的主体是主语谓语,先切一刀: 【(奥运会) (开幕式)】| 【(定于) (2008年) (8月) (8日) (晚8时) (在) (北京) (举行)】 主语谓语的中心词形成了句子的主干,表达的是施事和动作的关系: (开幕式) … (举行) 主语中心词 (开幕式) 带有定语 (奥运会),表达的是修饰关系。谓语动词 (举行) 带有两个状语:时间状语 【(定于) (2008年) (8月) (8日) (晚8时)】和地点状语【(在) (北京) 】。这两个状语内部还有句法结构体现出来的语法意义,可以将其构成成分的各个词的词汇意义串起来,我们以后会进一步探究,先到此为止。 小结一下:自然语言理解的中心任务是解析语言单位之间的语法意义,即谁与谁发生关系以及关系的语义角色。 4. 语言单位:语素、词、短语和语句 语言研究的基本单位一般认为是语素(morpheme)、词 (word)、短语(phrase)和语句(sentence/clause)。当然还可以细分(比如乔老爷X-bar理论认为词和短语之间还有一个X-bar的单位, sentence 一般认为大于等于 clause),或施行不同的单位分类法,但这不是我们要争论的点,也不妨碍我们对学理的探讨。 语素的标准定义是音义结合的最小单位,书面汉语中绝大多数汉字对应的是语素,在英语里面语素是前缀、后缀、词干(e.g. un-read-able)和合成词里面的构词单位(e.g. black-board)。 语法(grammar)是构词造句的机制。它通常包括词法(morphology)和句法(syntax)两大块。从生成上看,词法的输入是语素,输出是词;句法的输入是词,输出是句子。在标准的语法模型里面,句法建立在词法之上,而”词”是二者的接口。可见,词是一个关键的语言单位。 什么是词?这个问题语言学家争论了很久,在汉语语言学界还曾展开过大论战,有真知灼见,更多的是不毛之争和口水战。争论的起因之一是因为书面汉语的书写系统是连续的汉字串,不象西方语言以空格分隔多数的词。更深层的原因是字和词之间有一大片灰色地带,而这和汉语的发展史有关。大体说来,古代汉语中的字和词基本重合,随着语言的发展,多音词(尤其是双音词)逐渐固定下来,成为句法基本单位的主流。由于书面汉语的惰性和传承性,字词的界限很不分明。一般来说,对于灰色地带,不同的理论模型可以有不同的处理安排,只要在系统内部(system-internal)可以自恰或摆平,没有绝对的对错之分。 总结前人的真知灼见,可以归纳如下:1. 现代汉语不同于古代汉语,词已经大于等于字(语素)而成为一个(独L)的语法单位;2. 应该区分语法的词(grammar word)和词汇的词(vocabulary word):尽管二者有很大的重合面,但它们不是对等的;3. 作为相对(独L)的语法单位,词指的是语法的词,而不是词汇的词;4. 词汇的词可以大于等于也可以小于语法的词,举例如下: 性:现代汉语中已经演变成后缀语素(-ness),小于词的单位,如:革命-性,可读-性 洗:动词(wash) 澡:名词(bath),一般不单用,与”洗”搭配使用:洗-澡,洗-了一个痛快的澡,澡-洗得怎么样? 澡盆:合成词(bath-tub) 洗澡:可分离的动宾习惯搭配,属于短语,是大于词的单位 城门失火,殃及池鱼:成语,属于语句,是大于词和短语的单位 以前很多关于字词的不毛之争是因为争论双方没有区分两个不同的概念(词汇的词和语法的词)而引起的。 世界上的语言很有意思,词法句法的比重因语言类型的不同而不同,一般而言,词法复杂的语言(譬如俄语、法语)句法相对简单,而词法简单的语言句法就复杂一些(譬如英语和现代汉语)。推向极端,在古代汉语这样的所谓孤立语中,词法基本为零,一切语法关系都是句法关系。所谓多综复合语(譬如有些印帝安部落语言)是另一极端,句法极为贫乏,一个简单句的语义常常通过动词主干上的种种前后缀的叠加来表达。 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|5968 次阅读|0 个评论
《立委科普:语素、汉字、单词以及音译意译》
liwei999 2010-1-27 03:53
【置顶:立委科学网博客NLP博文一览(定期更新版)】 《立委随笔:语素、汉字、单词以及音译意译》 Posted by: 立委 Date: April 22, 2007 09:24AM 这个题目似乎很多人感兴趣,也存在很多误解,做点语言学的科普吧。 由于对语言学基本概念语素(morpheme,也叫词素)的不了解,很多人拿汉字和西语的词比较,这是不科学的,等于拿苹果跟樱桃比较。语素是语言中音义结合的最小单位,是词法(morphology,也叫形态学)分析的起点,而词是词法分析的终点,同时也是句法(syntax)分析的起点(基本单位/最小单位)。汉字大体对应于语素(即 morpheme, 有例外,比如“葡萄”中的“葡”和“萄”,以及音译词如“沙发”中的“沙”和“发”,这些字就不是独立的语素,但总体而言汉字和语素的吻合度很高),可英文单词是等于或者大于语素的单位(否则就没有morphology了)。所以,不能这样比较。正确的比较是用现代汉语词典中的词条数目,跟英文词典的词条数比较,就没有那么悬殊了。 英文的语素包括词根,前缀(pre-,non-,anti-),后缀(-ize,-er, 也包括语法后缀,如-s, -ed, -ing)。比如: read-abil-ity/in-comprehens-ible/ir-regular-ity/relat-ed-ness 是一个单词(派生词),3个语素,相当于汉语中的三字词。 是不是学会2000汉字,就基本掌握汉语词汇(vocabulary)学会汉语了呢?显然不是。因为由字成词并不一定具有semantic compositionality(语义组合性,因为很多合成词语义上只是半透明的,甚至是不透明的黑箱), 也就是说,一个单词的意义并不总是语素的简单相加,1+1并不总等于2。多字词(现代汉语词汇主要是双语素词,表现在书面语就是双字词)也还需要一定的死记。比如,“语素”这个词,并不因为你认识“语”和“素”两个汉字,而自然理解,否则汉语只需要一本小字典就够用了,没有必要编纂汉语大词典和众多的专业词典。再举一例,我女儿汉字学得很快,但是让她独立阅读中文论坛就很困难,很多字认识了,可还是不明白讲什么,因为她不认识有些多字词,她的字汇量够了,可词汇量不够。 当然,相对于英语而言,现代汉语的词汇大多是多语素词,而不是由词根独立成词为主,这就给人一种不陌生的印象。即便遇到新词,由于语素构词的半透明性质,加上上下文,理解起来,也可能八九不离十。从这个意义上,学汉语比学英语,词汇的记忆负担确实减轻了一些。 最后说一个有关的议题:外来词(比如laser)的意译(比如“激光”)和音译(比如“雷射”)问题。从语素分析的角度,意译实际上是利用汉字的语素性质创构多语素新词,而音译就是利用汉字的音节性质构成单语素多字词(多音节词)。两种方法各有利弊:意译词一定程度减轻了记忆负担,让人似曾相识。这个优点同时也是缺点,常常导致望文生义,“秀才识字认半边”,给不求甚解者开了绿灯。权衡利弊,一般而言,对于需要精确定义的专业术语,音译(或者不译,直接用原文)比意译要好,可以避免误解。但是对于已经进入大众生活的外来新词,意译比音译好一些。 感谢小日本,很多现代汉语意译词汇(现在大多已经进入大众词汇),是由他们先行利用汉字语素创造合成,然后我们拿来就用的,节省了我们的先辈翻译家“一名之立,旬月踟躇”的麻烦,也避免了现代汉语蜕变成中西混杂的怪物,试比较下列文字: (1) 俱乐部已经邀请名讲师来举办青少年生理和心理健康的讲座,这是本俱乐部青春期性教育的重头戏。 (2) 克辣布已经邀请名莱克切入举办青少年菲锐澳勒基和塞靠勒基的莱克切,这是本克辣布青春期塞克司爱纠开心的重头戏。 ——– 立委名言:一名之立,三月踟蹰。近代日本先我拥抱西方,至少从立名而言,我们是占了便宜的。 ~~~~~~~~~~~~~ ZT: 忍不住到隔壁插了一句 (16228) Posted by: liwei999 Date: July 26, 2006 05:35AM 前几天看到江老弟在黑暗中摸索,想用汉字表达他琢磨出来的语素的概念,就想好为人师一下。想还是等别的语言学家出来给他点拨一下吧。结果没有。质疑他汉字说的人,逼迫他重新修正概念,提出了近似语素的基本概念。 隔行如隔山,聪明人往往喜欢琢磨其他专业的事情。但必须承认,再聪明,这样做也基本是徒劳。这是个很有意思的过程。 关于汉字拼音化(修正稿,放弃广义汉字说法) 大脑思维时,虽然表现出来像是以语音进行,但实质上是一种意识流;此意识流由某种意识元素组成。意识元素,从物理上说,表现为大脑神经网链;这些神经网链体现出意识内容、发音以及文字之间的联系。对于西语,意识元素对应于word;对于汉语,意识元素对应于字(一个汉字相当于英文小word)和词所表达的概念。下面主要讨论汉语的情况。 意识元素的三要素(意识内容、发音以及书写文字)中,意识内容是最重要的。 声音虽然是语言的一大载体,但思维并不就一定是声音流。比如对于先天聋人来说,思维纯粹就和声音无关。 再比如,当你脑子里想“可疑”二字时,你清清楚楚知道是“可疑”而不是“可移”;也就是说,思维是在用“意识元素”进行,只是一般感觉上表现出语音形式。 汉语在脑中的意识元素常常是“图声并茂”,其中图只是存图的特征信息,人脑并不存图的全部。 人们学汉字时,实质上是在建立一个从这个意识元素到字形的映射库;学拼音时,则是在建立从意识元素到混淆了同音字的拼音这种映射库。 1。汉语意识元素的图表示即汉字的书写形式。显然,其与汉字一一对应。 2。汉语意识元素的声表示即拼音。显然,汉字意识元素表达为拼音时,混淆了大量同音字;属于多对一的对应关系。 以上两点为汉语构成的两个基本特点。 (在目前汉语拼音方案基础上的)汉语拼音化实质上是把汉语用一种不精确的方式表达,可读性大为下降。 江毅 语言学上,这是个基本概念,叫morpheme 所有跟贴·加跟贴·新语丝读书论坛 送交者: liwei999999 于 2006-07-26, 04:41:11: 翻译成词素或者语素,它是语言中音义结合的最小单位。关于morpheme的理论和实践,有很多定论了。 不过还是很佩服你在显然没有怎么接触语言学的情况下,独立琢磨出近似语言学里面的概念和理论。不过,大多是重复劳动,用词不同而已。 你的思路是对的(但在语言学中是常识,Course 101一级),开始用汉字作为你思维成果的载体,虽有缺陷(所以你不得不放弃),也不无道理。 在古汉语,汉字、音节和语素有很大的重合面。最科学的概念,能够适应人类所有语言的概念,还是语素。研究语素构词的学问叫morphology (研究由词构句的学问叫 syntax)。
个人分类: 立委科普|2766 次阅读|0 个评论
科学圈圈坐-端木三
songshuhui 2010-1-16 22:41
科学松鼠会 发表于 2010-01-07 3:40 编者按:上周四,芝加哥大学演化生物学系 龙漫远 教授启动了 圈圈坐 。本周请来第二位端木三。端木老师八十年代初从成都东南角的师范学校英语系毕业,远渡重洋,辅修过计算机,却以研究说话写字儿的科学语言学为毕生事业,现在美国北部大湖区的密歇根语言学系任教。请围观松鼠seren(下文称我)同端木老师的学术午餐,并继续期待下一周的神秘人物 这是感恩节假期前的最后一天,早上下了雨,后来虽然停了,却还是暗,天低得像要直压下来。中午整十二点,我穿过半个校园,找到了语言学系的红房子,如约踏进了端木老师的办公室。 端木老师比照片上看起来更加斯文清瘦,说话的声音异常柔和,语速轻缓,一开口就让我没了紧张和隔阂。看我到来,他便合上笔记本,说:咱们一起去吃午饭。对面就是商学院新盖的大楼,我还没有去过,端木老师说,我们一起去试试? 商学院的大厅果然宽敞,因为时值节前,人丁稀落。我们去小餐厅买午饭,一进去端木老师就说:别跟我客气,我来付钱我于是弄了一盘沙拉,又倒了一杯咖啡,却见端木老师拿了一碗浓汤,一个面包圈,还笑着对我说:你吃得真健康 我们一起端着盘子走到放各色调料的小台子,我抓起越南蒜蓉辣酱往沙拉里倒,一边端木老师也抓起了小瓶辣酱我立刻问:您也是四川人吧。是啊。可是您的口音一点也听不出来。呵呵,四川话也是北方话嘛!哈,真不愧是语言学系的端木老师,被老乡拉着叙旧都不忘本行。不过我还是说:我知道四川话是北方方言语系,可是一般来说,四川人一开口,我一下子就能听出来!端木老师只是和蔼地笑笑。 我们走出小餐厅,在商学院宽敞的大厅里找了个安静的所在。端木老师把个黑色小茶几推到两张相对的沙发之间:诶,这个茶几还有轮子的。我们相对坐下,我开始套近乎:您是川师外语系毕业的?真巧,我就在那里长大的。不过,您本科学的英语,后来怎么想到做语言学呢? 计算机和语言学 端木:我们这些学英语的,基本就是两条路啊,要不然做文学,要不然做语言学。我呢,对语言学比较感兴趣一些。 seren:这样啊。那我看到您在MIT念书的时候,还念了一个计算机的专业? 端木:是的,那是我的minor(副修科目)。 seren:那您觉得学习计算机对您研究语言学有什么帮助呢? 端木:首先呢,在语言学里面,就有一个方向叫做computational linguistics(计算语言)。我虽然不是做这个的,但是计算机一方面给我提供了一些工具;另一方面在做研究的思路方面,它也对我很有启发。 seren:一方面是工具,另一方面也开拓思路唔,您能不能举个例子来说呢? 端木:譬如说吧,汉语是单音节语言还是双音节语言?好多人都觉得是单音节(一个一个方块字嘛!seren心想),可是其实我们有很多词都是两个字拼起来的,比如老虎。光争论可能不清楚,但是现在有这些计算机来做统计,一统计,好,汉语其实百分之七十的词语都是双音节的,所以并不是像很多人以为的那样是单音节语言。那么再看英语 seren:英语是多音节的吧? 端木:嗯,英语单词看着是多音节的,不过这么一统计呢,又发现其实大多数常用的词还是短的单音节和双音节的词。尤其是有些词看着长,其实把前缀后缀去掉,核心的部分也就一两个音节。这么看来,其实汉语和英语的差别也没有那么大。有了这些统计结果,有很多事情就清楚了。 seren:您就是说,一方面计算机给了您这种手段来搜集数据;另一方面又正因为它存在,您才会想到这么做研究。真有意思。 主次之分 端木:我们来看这两个词,蔬菜,和商店。蔬菜和菜意思差不多,商店和店也是。但是我们平常会说菜店,蔬菜店,蔬菜商店,不会说菜商店,对吧? seren:菜商店呃,确实听起来怪怪的。 端木:这就是一个21结构(两个字的词加上一个字的词)优于12结构的例子,相似的还有很多。可是如果我们换一个例子,捕捉老虎,这又不一样了。捕捉虎不好,但是捉老虎听着就比较通顺,这又是一个12结构比21结构好的例子。 seren:唔,有意思。这也是因为结构,不,组成部分不一样吧?那个捉老虎,是动词跟着一个宾语;而蔬菜商店,是形容词跟着名词 端木:其实两个都是名词 seren:好吧,都是名词,但是前面修饰后面的那我们能不能说好像有点泛化但是,如果是动宾的结构,就是12比较好,如果是那个前面修饰后面的结构 端木:这叫偏正结构。 seren:好那么偏正结构,就是21比较好。 端木:(笑)是的,大多数情况下是你总结的这个样子。这个现象,吕叔湘六十年代就提出来了,动宾的时候我们爱用12结构,偏正的时候用21,但是为什么呢?我们那时候不知道。 seren:(喃喃地)为什么呢?这只是为了说的顺口么? 端木:那我们来看英语,英语跟汉语不一样,但是它有个重音。英语里面也有偏正结构的复合词,这种时候,重音一般放在前面,比如pan cake,比如white house。而对那些动宾结构的呢,一般放在后面,比如watch TV,buy a car,对吧?所以我们说重长。 seren:(迷惑地)重?长? 端木:英语里的重音,对应着汉语里面比较长的那个词也就是12或者21里面的那个2。 seren:哦英语的重音对应汉语长的那个词,这是为了强调么? 端木:(笑)四十年代有一个克劳德香农(Claude Shannon),他是做计算和通信方面的,也是我们密歇根大学毕业的。他提出了一个information theory(信息论)。这个理论是用来确定词语的信息量的。他认为如果拿一个短语来看,如果一个词在短语结构的同一个位置出现的频率越高,信息量就越小,相反,就越大。比如我们看英语的这个冠词,出现在单数名词前面的,基本就是a,或者the,每一个出现的频率几乎是50%,它们所含的信息量就很小。哪怕漏写了这个冠词,我们还是一下子就知道是什么意思。但是冠词后面的那个名词,就有很多不同的可能,要是漏写了,就不知道要说什么了,所以信息量就很高。 现在我们用这个理论来看刚才的问题,比如动宾结构。在语言里,动词的数量只是名词的三分之一左右,也就是说,一个动词出现在它所在的位置上,要比一个名词出现在宾语位置上的概率高多了,所以,宾语那部分是信息含量更高的。还不光是这样,宾语可以是一个名词,还可以是一个被形容词修饰的名词,譬如打大老虎。你想想看,名词那么多,再加上和形容词的组合,这个可能性有多大!这样,我就提出了一个观点,出现在宾语这个位置的词,之所以在英语里面我们重读它,而汉语里面我们放一个长一点的词,都是为了突出它的重要性,因为它信息含量大。其实我们说话的时候,有的词信息多,有的少,总是有这个主次之分的,而这个主次就靠这个重长来体现。 seren:我觉得这个主次在传递信息和想问题里面很重要啊,要是没有主次,所有词都一样,那也没办法交流了 端木:是的,可是如果光这么想哪个词信息量大,我们脑子就不够用了。但是用这个规律来看这些词,再来想为什么会有重长这样的语言学现象,就很清楚了。 语言的演化 端木:英语里面有个单词with,它的音节是英语所有单词里面唯一一个这样发音的(th发浊辅音)。现在有的人已经开始把th发成清辅音了,这样它就不再是唯一例外了。还有的时候,一种语言会受别的语言影响。譬如四川话里面阶级的阶,有j-i-ai和g-ai两种发音。其实g-ai是原来的发音,但是受了普通话的影响,现在很多人念j-i-ai了,现在差别变小了。 seren:那这种越变越简单的,是语言演化的趋势么? 端木:这是趋势之一。一般来说,在演化里丢掉那些outliers(例外的部分),是一个规律。其实,在达尔文那个时候就开始争论这件事情了。达尔文的进化论一出来,语言学家就开始争论,语言里面有没有进化?有没有优胜劣汰?他们看到各个地方语言不一样:你看,中文,光光的,什么都没有,很简单。而英语呢,有几个时态变化,复杂一点,在中间。而再看那些意大利语啊,德语啊,又有时态变化,词还要分阴性阳性,很复杂。那大家就开始争论了,如果语言也有进化,谁高级谁低级呢? 有的人就说了,能够掌握复杂语言复杂规律的大脑应该更发达,所以复杂的更高级,中文那么简单,是最低级的他们当时也有个想法,觉得语言和社会的发展是成正比的。但是达尔文自己其实不同意这个说法的他也知道一点中国,像马可波罗写的,并不像其他人想到的那么落后。达尔文觉得简单的语言不一定就说明大脑低级。我举个例子,我让你帮我做件事情,要是我必须给你一步一步写清楚,你才能做得好,比起我只要跟你提一句,你就把事情给我办好了,哪个更聪明?达尔文他们觉得语言可能也是这样,要是得记住那么多复杂的规则,才能把意思表达出来,比起简简单单地就把意思说出来了,说不定后者更高级呢。 seren:那是这样吗? 端木:其实呢,不是的。语言的变化很复杂,并不像那个时代的人想的那样简单,一条线。语言这个东西,不是一个人一群人商量一下就制造出来的完美的东西,它是自然地出现的。有的时候,你把这里简化了,可是那里却又复杂化了。你看这里的这些茶几(端木指指我们面前带轱辘的黑色小茶几现在上面放着我们两个的空盘子。这样的茶几在整个商学院的大厅里到处都是。),现在我们在这儿说话,把它从旁边搬过来了,待会儿我们走了,别人来了,又把它搬到别的地方去了,语言的发展也有点像这样。 有很多语言都在慢慢地变,有时有些词的音节变得不发音了,图简便。比如说police,很多人都吞掉那个o,读成plice。还有potato,读成ptato。再说Toronto,多伦多,也有人吞掉第一个o变成t-ronto。而多伦多当地的人,甚至连中间的停顿都不要了,直接念成tronto。我们中文里面的豆腐这个词,经常腐就发一个f的音(轻声)。这就是简化发生了。可是这种简化,在英语的那几个例子里面,去掉一个元音,却创造了两个连在一起的辅音字母,有时候还挺难发音。豆腐那个例子呢,虽然没有创造两个连在一起的辅音,可是也创造出一个中文里面没有的新音节(douf),这也增加了语言的多样性。你看,这种简化反而创造了复杂性。还有的时候,人们会把那两个连在一起的辅音去掉一个,音节变少,这就有点向中文这边发展的意思。可是我们中文呢,现在却经常在单音节词里补充一个字,让它变长,音节变多,譬如鸭子的子,老虎的老。这么看起来,语言的变化不是单向的,一会儿长一会儿短,是一个循环往复的动态的过程。 seren:啊,真有意思!语言的发展是循环往复波动的还有啊,我觉得好多地方的语言差别特别大,完全跟两条线一样。像我去夏威夷,看看他们的土著语,其实发音很像日文或者中文,都是ma、po、la之类的音节,虽然嘟噜嘟噜一大串,发音倒是都特简单。但是我以前让实验室的墨西哥妹妹教我西班牙语,里面有的音,两个r连一起的,我就完全学不会。她就跟我说,这个音啊,小孩子五岁之前都发不出来,可是十五岁之后如果还发不出来那一辈子都发不出来了。我经常就觉得,这个不同地方的语言发展怎么差别这么大,简单的好简单,复杂的可以那么复杂,好像一点联系都没有的。 端木:呵呵,这个问题呢,其实就很难研究了。为什么呢?因为我们知道的历史太短了。我们知道的,主要也就是有文字以后这两三千年。而且文字最开始出现,并不是为了写历史用的,是为了记事情,譬如你借了我什么东西,我做个记号,怕忘了。历史这个东西,都是到了后来,人们尤其是皇帝,开始想高级的事情了,让你给写下来。所以我们知道的东西真的很少,五千年就算一万年,你想想看,跟人类出现比 seren:几百万年了。 端木:对,所以这个语言具体怎么变的,我们不知道。 seren:这个真是没法知道。 端木:也不是没法知道,就是现在没法研究。所以我们做语言的就先把这个问题搁下来,以后再说。现在我们主要是找找语言的规律,就像我刚说的,信息量的规律啊,复合词和短语结构的规律啊,从里面学点东西。 语言学也会演化 seren:您能不能跟我们讲讲这些年这个研究领域有些什么特别大的事,或者什么趋势值得大家主意的? 端木:好的。主要有几个方面的变化,第一是要求研究样本的数量变多了。以前啊,你做研究发文章,找一个人就行了。譬如做普通话,你就找一个北京人,证明一下他的身份,说明他合适这个研究,就够了。最多不过找俩,一男一女。现在不行了,必须找十来二十个,得重复做。第二个呢,是研究的手段变化了。像我刚说的,开始重视统计啊,数据啊,你以前说一个理论就行,现在要看证据。 seren:这听起来真像自然科学了,语言学在美国该是社会科学吧? 端木:其实语言学很宽,有的研究是偏人文方面的,有的像我说要做统计啊,数据啊,算社会科学,还有的就是基础自然科学的研究,做实验的。National Science Foundation(美国国家科学基金会)还提供语言学研究的基金呢。 seren:啊,原来也可以申请NSF funding的! 端木:是的。其实现在我们领域也比较喜欢做一些跟自然科学的研究能挂上钩的东西,不像以前,都是各做各的,搞出很多很高深的术语啊,复杂的概念啊,其实没必要。现在就偏向于一些能和别的学科交叉、交流的。还有一点变化,就是以前很多东西是非黑即白的,比如语法,一定要这么样,不能那样。现在不是了,开始看到有变化,有差异,有variation的。 seren:听起来真是很有趣。其实在采访您之前,我还挺担心的,心想我一个理科生,什么语言学都不懂,怎么问问题啊。没想到听您说了这么多,觉得都特别有意思,而且感觉我理科的思维也能用上去,能体会。 端木:那就太好了!我们就是希望能让大家都了解我们做什么,其实我觉得只要我们能解释好,大家会理解我们的研究的。 seren心里想:这跟我们松鼠会的理念真是不谋而合! 和端木老师从商学院宽敞的大厅里出来,在校园里互相道别。外面依然阴霾沉沉,松鼠们趁着秋尽冬来时难得的和暖时光,在草地上觅食,飞跑着穿过冷清的大街小巷。我反复地回忆着刚才谈话里的细节,生怕每一分秒的时间都在跟我的记忆力争夺那些端木老师讲过的小故事,真想插翅飞回家去,记下一切
个人分类: 科学圈圈坐|1892 次阅读|0 个评论
世界语: 语言学特点及其研究价值
liwei999 2010-1-11 00:52
摘自 Wei Li 硕士论文世界语到汉语和英语的自动翻译试验 第二章 在进入EChA系统的细节和探讨机器翻译的一般理论和方法之前, 我们专列这一节讨论世界语本身, 这对说明本系统的设计思想和具体方法是很必要的。毫无疑问, 我们的讨论主要是从语言学角度着眼。 世界语(Esperanto)是波兰的语言大师柴门霍夫博士( L.L.Zamenhof 1859.12.15 - 1917.4.14 )于1887年在印欧语系的基础上经过艰苦研究提出的一个人造语方案。由于其科学, 简明, 逻辑性强, 由于日益增长的克服语言障碍的国际需要, 也由于其维护世界和平, 增进各民族相互了解, 实现世界大同的崇高理想的感召, 它逐渐为人们所接受。目前, 世界上有2000多万人在学习和使用世界语。世界语早已脱尽了人造的斧痕, 走上了自然发展的道路。它不但能写也能说, 不但适于表达精密的科学思想, 而且在文学上也取得了令人赞叹的成就。从莱勃尼茨的万国通用文字的设想开始, 先后提出的人造语方案达150多种, 唯有世界语经受住各种考验生存下来了。现在, 越来越多的人认识到世界语作为国际辅助语的独特价值。有些国际性学术会议(如控制论大会)已经采用世界语作为工作语言。 世界语中除数量有限的虚词外, 其他词都有非常规则的形态变化, 借以表现该词的词性、格、数、时态、语态、语式、分词形式等语法信息。另外还有一整套前缀后缀, 用以表现词汇意义上的细微差别和修辞色彩。世界语是典型的黏着语, 词尾和语缀的意义单一, 可以叠加。这套词尾和语缀设计得非常巧妙, 规则, 特别容易掌握, 而且也非常适合机器的递归加工。(EChA的削尾算法就体现了这种递归加工的优点, 见本文第5节。)世界语没有语法同形词, 句法关系一目了然, 这不论对人还是对机器的识辨, 都是一个极为有利的条件(民族语机器翻译中同形判别的问题在这儿根本不存在了)。同时, 世界语的词类转换也特别灵活, 只要逻辑上说得过去, 不致引起误解, 同一个词干可以根据句法需要, 通过词尾变化随意改变词性。(我国古汉语词类活用也比较自由, 在一定程度上具有类似的灵活性, 可惜这种活用没有明确的形态标志, 常常要靠逻辑语义的分析才能确定。) 世界语的词尾形式并不很多, 但却很完备, 可以和形态发达的语言相媲美, 这一点我们不能不为之惊叹。拿格来说, 世界语只有普通格(零形态)和目的格(加词尾-N)两种, 但由于它把词性和格的用法巧妙地统一起来, 再加上有介词这种分析形式的后备, 表达起来跟形态丰富的语言一样灵活自由。俄语是现代形态最丰富的语言之一, 它有六个格。粗略地说, 它的一格(主格)跟世界语普通格对应, 二格(属格)跟世界语形容词姑且叫做形容格吧(加词尾-A)对应, 三格(与格)在世界语中没有相应的屈折形式, 一般用介词AL来代替。四格(宾格)对应于世界语的目的格。五格(工具格)跟世界语副词也姑且叫做状格吧相对应。六格是前置格, 跟前置词O,Ha,B等搭配, 它本身并不表示特定的语义关系。有意思的是, 世界语介词后可以跟普通格和目的格两种, 前者表示静态, 后者表示动态(方向)。比较俄语的类似用法, 世界语的简洁和完备的特点是很明显的。 世界语基本语法规则共16条, 原则上没有例外. 由此人们也许会推断这门语言很简陋, 刻板, 缺乏表现力。这是一个极大的误解。这里涉及世界语的另一个非常突出的语言学特点, 就是它兼有分析性语言和综合性语言的要素(虚词和形态都比较丰富), 同一种语义既可以用分析形式(借助于虚词), 又可以用综合形式(借助于屈折变化)来表示-当然, 这两种形式并不等同, 它们体现了不同的风格。由于这一特点, 世界语兼容性强, 文体多样, 特别灵活, 富于弹性和表现力。如果作为目标语, 它最能维妙维肖地模仿原文的语言特色。它既可以反映语序自由, 文体柔美的斯拉夫风格, 又可以表现形态缺乏的语言(如汉语和英语)的单纯, 严谨, 密集的特点。下面我们举几个例子来看一下分析形式和综合形式在世界语中的兼容并存情况: 分析形式 / 综合形式 1. 时态: Mi ESTAS skrib-ANTA. Mi skrib-AS. / Mi skrib-ANTAS. I AM writ-ING. 我 在 写字。 2. 语态: Ghi ESTAS limig-ITA. Ghi limig-ITAS. / Ghi lim-IGHAS. It IS limit-ED. 它 被 限定了。 3. 词义: Tio estas MALGRANDA (ETA) sekreto. Tio estas sekret-ETO. That is a LITTLE secret. 那是 小 秘密。 4. 介词与副词(状格): Li parolas EN (PER) Esperanto. Li parolas esperant-E. Li parolas Esperant-ON. He speaks IN Esperanto. He speaks Esperanto. 他 用 世界语说话。 他说世界语。 5. 介词与格(目的格): Shi parolis POR 30 minutoj. Shi parolis 30 minut-OJN. She spoke FOR 30 minutes. 她说了30分钟. 6. 分析形式向综合形式的转换: LAU kutimo ...............LAU-kutim-E...kutim-E 这种分析形式和综合形式并存的情形在世界语中极其普遍, 这一点跟民族语不一样。虽然没有绝对不用分析形式的综合性语言, 也没有绝对不用综合形式的分析性语言, 但是, 每一个具体的民族语言总是以一种形式为主, 而且在多数场合总是一种形式排斥另一种形式, 一般不允许并存。 总之, 跟人们通常想象的正相反, 世界语是高度灵活的, 表达方式极其多样, 且能互相转换。这种高度灵活性正好适应了人类思维模糊性的特点。灵活性与 规则性的高度统一, 这就是世界语的真正奇迹。 人造语言的规则性容易为人理解。关于灵活性, 再补充几点。由于篇幅关系, 我们不打算展开, 必要时辅以一两句例证。 1. 在世界语中动词的及物与不及物的界限模糊了。 Mi IRAS. / IRU vian propran VOJON! I GO. / GO your own WAY! 我行走。/ 走你自己的路! La tuta homaro PAROLOS nur unu LINGVON. / Mi PAROLAS esperante (en Esperanto, per Espernato). The whole mankind will SPEAK only one LANGUAGE. / I SPEAK in Esperanto. 全人类将说仅仅一种语言。/ 我用世界语说话。 2. 直接宾语(所谓宾格)与间接宾语(所谓与格)的界限模糊了。 informi ION al IU / informi IUN pri IO tell sth. to sb. / tell sb. about sth. 向某人告诉某事 / 告诉某人关于某事 3. 宾语与状语的界限模糊了。世界语语法规定: 目的格(即通常所谓宾格)也可以表达某种状语意义(参见基本法规第14和第13条)。 Mi invitas vin VOJAGHI kun mi PEKINON. I invite you to TRAVEL with me TO PEKING. 我邀请你和我一起 旅游北京。 4. 词缀与词根的界限模糊了, 从而派生词与合成词的界限模糊了。同时虚词与实词的界限也模糊了。 sekret-ET-o / ET-a sekreto JES, / mi JES-as vian opinion. little secret 小秘密 Yes, I agree with you. 是的, 我同意你的意见。 ANTAU-vidi / Sinjorinoj ANTAU-as. Kred-IND-a / ne-IND-a , IND-igi , sen-IND-ulo foresee / Ladies first. believ-able / not worthy, make worthy, good-for-nothing 5. 万能介词JE的设置。人们在表达思想时, 常常只意识到从属成分与中心成分有某种朦胧的修饰关系, 但却说不出, 往往也不必要说究竟是何种语义联系。为了适应人类思维的这种模糊特点, 柴门霍夫引入介词JE。这是一个很有见识的创造。表达这种模糊关系还可用屈折形式的目的格或副词 (状格), 见基本法规第14条。 6. 词性与格在用法上的统一。词性和格都是根据词尾 入句而后定 的动态句法特征, 都能表现比较抽象的语义关系, 可以相互补充。(这跟分析形式的介词短语不同。介词除了上述JE外, 一般用来表示较为具体和确定的语义关系。) Mi skribas plum-E. CF: (俄) (五格) 7. 极其灵活的词类转换。 La FLOR-OJ FLOR-AS. The flowers blossom. Li KANT-AS italan popolan KANT-ON. He sang an Italian folk song. Mi estas GHOJ-A. Mi GHOJ-AS. I am glad. 8. 词序的自由。 Mi amas vin. (106) / Mi vin amas. / Vin amas mi. (108) / Vin mi amas. (111) / Amas mi vin. / Amas vin mi. I love you. 我爱你。 9. 构词的灵活。派生词: 词缀的丰富及其黏合特点; 合成词: 词根与词根的自由复合。 Shi rid-AS. Shi rid-ETAS. Shi estas rid-EMA. Shi estas rid-EMULO. Shi estas rid-EMULINO (rid-EMINO). Shi estas rid-EMULINETO (rid-EMINETO). 她笑。她微笑。 她爱笑。 她是爱笑的人。 她是爱笑的女人。 她是爱笑的小女孩儿 。 INTER-lingvo 中间语言 fonto-lingvo celo-lingvo 源语 目标语 ponto-lingvo naci-lingvo internaci-lingvo 媒介语(桥梁语言) 民族语 国际语 10. 完善的时态语态系统和精巧的相关词表。 世界语的时态语态系统和相关词表是两项绝妙的创造。它们是如此地精巧完善, 富有逻辑的力量和美, 每一个世界语者都象化学家欣赏元素周期表一样体验到这种美, 并为此感到自豪。借助于唯一的一个助动词ESTI, 世界语能表达各种复合时态语态。相关词表所能表达的语义的简洁和丰富更是无与伦比的。 世界语的这些特点给人们的自由创造留下了很大的余地, 为人们充分发挥自己的语言才能提供了最好的条件。这种灵活性并不影响作为世界语基础的16条基本法则的不可动摇的严格性。在这儿, 自由和约束达到了完美的统一。在世界语国里, 每个人都在不同程度上是创造者, 每一个世界语者都体验到这种创造的乐趣。人们再也不是习惯的奴隶了。 然而, 不能不承认, 世界语的灵活和自由给机器的自动处理带来了一定的困难。我们在研制EChA系统的过程中, 深深感到, 与民族语相比, 以世界语为源语的机器翻译虽然有其容易的一面, 也有其特有的难处, 总之要比我们预料的要复杂得多。容易来自其高度规则性, 困难则源于其高度灵活性。 世界语作为人们唯一实际使用的人造语言自然有它独特的研究价值。拿它与民族语作对比研究, 我们会得到很多有益的启示。由于其独特的地位, 人们在研究思维与语言, 民族与语言, 社会与语言, 个体与语言, 信仰与语言等等的关系, 以及探讨语言的共性, 语言的本质, 语言的前途(未来社会的语言), 语言的形式和内容, 语言的类型, 语言的教学等问题时都可能在研究世界语的过程中获益。另外, 世界语本身的发展也需要语言学者对它作科学的研究和总结, 这不但有益于这门语言健康的发展, 有助于世界语语言学理论体系的建立, 同时也会丰富一般语言学的理论。语言学者对世界语的理论研究虽然早已开始, 但还远远不够。 对于机器翻译工作者, 世界语还有一层特殊的意义, 就是世界语作为民族语间机器翻译的媒介语的价值. 这可以从两方面看: 1) 按照机器特点对世界语作必要改造, 定义一个作为媒介语的世界语子集, 再辅以一套高度形式化的成分体系。这个设想我们在第一届中国世界语大会上提过。我们也确实设计过一个以世界语作为媒介语的英汉机器翻译规则系统。虽然由于时间等原因没有能上机试验, 但我们相信该方案是可行的, 也是值得尝试的。拿世界语或其子集作媒介语, 尽管还远远不是最理想, 但如果研制的是印欧语系间多语言自动翻译, 或者是以这些语言为源语的多对一系统(如英/法/德/俄汉系统), 相信会带来很多方便。2) 虽然不直接采用世界语作媒介语, 但在设计机译媒介语时, 认真吸取世界语的优点, 可以少走弯路。 附注: 为便于查对, 这里把世界语16条基本法规转抄如下: (1) 不存在不定冠词, 只存在定冠词 (LA), 其性数格不变。 (2) 名词词尾为 -O, 复数形式加词尾 -J。只存在两个格: 普通格和目的格; 后者由普通格加词尾 -N 构成。 (3) 形容词以 -A 收尾, 其格数与名词同。比较级用PLI和连词OL, 最高级用PLEJ。 (4) 基数词(没有词尾变化)是: UNU 1, DU 2, TRI 3, KVAR 4, KVIN 5, SES 6, SEP 7, OK 8, NAU 9, DEK 10, CENT 100, MIL 1000。几十和几百由数词简单合并而成。序数词加形容词词尾; 倍数加后缀-OBL-, 分数加 -ON-, 集合数词加 -OP-, 分配意义用介词 PO。此外, 数词也可以有名词和副词形式。 (5) 人称代词: MI, VI, LI, SHI, LI, GHI (代物件或动物), NI, VI, ILI。其所有格形式加形容词词尾构成。数格的变化与名词同。 (6) 动词没有人称和数的变化。动词的各种形式: 现在时用词尾 -AS; 过去时 -IS; 将来时 -OS; 假定式 -US; 命令式 -U; 不定式 -I。分词(有形容词和副词的意义): 主动现在式 -ANT-; 主动过去式 -INT-; 主动将来式 -ONT-; 被动现在式 -AT-; 被动过去式 -IT-; 被动将来式 -OT-。被动语态的各种形式, 都借助于ESTI的相应形式和所需要的动词的被动分词构成; 被动式所用的介词是DE。 (7) 副词以 -E 收尾; 各比较等级与形容词同。 (8) 所有介词都要求普通格。 (9) 每个词读写一致。 (10) 单词重音永远在倒数第二个音节上。 (11) 合成词由词与词简单合并而成(主要的词放在后面); 语法词尾也被看作独立的词。 (12) 有其他否定词的时候, 就不再用 NE。 (13) 为了表示方向, 单词加目的格词尾。 (14) 每个介词都有确定不变的意义。但是如果我们需要用一个介词, 而从意义上看不出应该用哪一个, 这时我们就用没有独立意义的介词JE。介词JE也可以用没有介词的目的格来代替。 (15) 所谓外来词, 即大多数语言取自同一来源的词, 在世界语里不加变化地应用, 只需照世界语拼写法书写; 但如果一个词根派生几个不同的词时, 最好只不加变化地采用那个基本词, 并由此按照世界语的规则构造出其他的词来。 (16) 名词和冠词末尾的元音字母可以省略, 用省略号 来代替。 请参看 《巴贝尔通天塔必将建成》(刘涌泉 李维, 中国第一届世界语大会论文。其中第四节专门讨论了世界语作为机译媒介语的优点, 缺点, 可能和前景。) 立委《我的世界语国》入 《世运人物志》
个人分类: 世运资料|4855 次阅读|0 个评论
《朝华午拾:世界语之恋》
liwei999 2009-12-15 18:20
朝华午拾 - 我的世界语国(二):世界语之恋 世界语之父柴门霍夫博士 柴门霍夫(Zamenhof)博士创造完世界语后,并没有马上发布,而是用世界语自己跟自己说话和著述了好多年,烂熟于心。 我刚开始接触世界语,就一见钟情,堕入爱河,有诗为证: Al Nia Kara Lingvo La lingvo gracia, kara mia, Ghis kiam vi venis al mi fine fin? Atendis soife mi, eterne via, MI AMAS VIN ! Mi amas vin vere, pruvu Dio, Kaj mia bon-koro batas nur por vi; Ne plu sekreteto estas tio: VIN AMAS MI ! Chu kredas vi mian amon maran? Chu kredas, ke mia koro flamas? Chu kredas la vorton pure karan: VIN MI AMAS ! 这是我1986年写的情诗,也是我世界语的处女作。尽管幼稚,却是火热真情。我后来做世界语到英语汉语的机器翻译实验,索性把它送进我的翻译程序,跟“人工智能”开了个小玩笑,还振振有词地在论文中说:谁说诗歌不能翻译?谁说诗歌不能机器翻译?以下是我的诗歌的机器翻译: To our dear language The language graceful, my dear, Till when you came to me at last? Waited longingly I, ever yours, I LOVE YOU ! I love you truely, let God prove, And my good heart beats only for you, No longer that is (a) little secret: I LOVE YOU ! Do you believe my love like sea? Do (you) believe, that my heart burns? Do believe the word purely dear, I LOVE YOU ! 献给我们的亲爱的语言 优美的语言,我的亲爱的, 到什么时候你最后来到了我这儿? 我渴望地等待,你的永远的, 我爱你! 我真实地爱你,让上帝证明吧, 我的善良的心仅仅为了你跳动; 那已经不再是小秘密: 我爱你! 你相信我的大海一样的爱吗? 相信,我的心燃烧吗? 相信纯粹地亲爱的词吗: 我爱你! 真是年少轻狂,流淌的都是滚烫的词句,不加掩饰,不知含蓄,但表现了我当年初识世界语那种欣喜若狂、神魂颠倒的恋爱状态:毕竟年轻过。 作为语言学研究生,我一开始就被世界语的外在美迷住了。世界语表达方式的灵活多样让我折服。首先是语序的自由,一个简单的目的格后缀 -n, 主谓宾句式的语序就获得了完全的自由:mi amas vin (我爱你),可以有六种表达!我感叹其神奇,也获得了诗歌的灵感,于是用不同语序入韵。很多年以后的今天,我没有忘记告诉我的女儿,世界语可以用6种组合说“我爱你”。每次跟女儿电话,挂电话前,她总不忘用六种语言说“我爱你”(汉/英/法/俄/日和世界语),最后总是以世界语结束,并且一口气说下去: Mi amas vin. Mi vin amas. Vin mi amas. Vin amas mi. Amas mi vin. Amas vin mi. 每次听女儿稚嫩的声音一遍一遍用世界语说爱我,哪个做父亲的能不融化?女儿跟我说,她长大也要成为一个语言学家和世界语者,像我一样。 好,回到跟世界语的恋爱史上来。世界语的外貌,让我惊奇的还有构词的自由性,和相关词表的对称美。我把这些写入我的世界语笔记,最终成为我的世界语语言学特点的论文素材。就说构词的自由性吧,比如: Shi rid-AS. / Shi rid-ETAS. / Shi estas rid-EMA. / Shi estas rid-EMULO. / Shi estas rid-EMULINO (rid-EMINO). / Shi estas rid-EMULINETO (rid-EMINETO)……. 她笑。 / 她微笑。/ 她爱笑。/ 她是爱笑的人。/ 她是爱笑的女人。/ 她是爱笑的小女孩儿 ……。 世界语丰富的词缀和构词的黏合特性,从形式上给了语言使用者最大的弹性,只要在语境中 make sense, 使用世界语,几乎可以随心所欲,很能满足人的创造欲:世界语的本性是鼓励“生造词”的。当然,在实际使用中,这种弹性更多表现在给人以造词的便利,而不是满足创造欲。如果我忘记了一个专门词汇,比如 komputero(电脑),临时生造一个 elektrona kalkulilo (电子运算工具:可以指计算器或电脑),也不妨碍我的交流。每一个使用过世界语的,都体会过这种便利和创造的乐趣。 世界语的外貌使我着迷,就好像一个漂亮姑娘的吸引。世界语的内在美和近乎宗教信仰一样的感召力,是我进入世界语圈子以后逐渐体会的。在北京世界语圈子,我第一次接触到一个来自各行各业的特殊群体,大家一团和气,互相帮助,加上世界语者中普遍流行的道德优越感和使命感,这极大地满足了我的理想主义的内心。我当时把这一切全部归功于世界语的内秀,深深迷恋。我好像找到了一个外美内秀的完美对象,教我如何不爱她? 记于2006年4月21日 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|6584 次阅读|0 个评论
[小红猪]解读古文字
eloa 2009-6-27 10:40
小红猪小分队 发表于 2009-06-24 23:49 原文 ,翻译 Meredith,87女,自由译者。嗜茶饮,爱好阅读音乐。她的另一篇译作在 这里 。 面对古代碑文上无法知晓含义的古文字,我们有什么办法去了解它?安德鲁罗宾森将向我们展示尚待解密的神奇古文字世界。 书写是人类历史上的一大发明,也许是最伟大的发明,因为它让历史成为可能。如果没有书写,就没有知识积累,没有历史记录,没有科学当然也不会有书籍,报纸或者网络。 楔形文字是世界上已知最古老的文字。这是一种刻在陶片上的文字,它的使用者是5000多年以前生活在美索不达米亚平原上的人们。之后,文字出现在了埃及,再往后是欧洲,中国和中美洲。不同的文明创造了上百种不同的书写体系。其中有一些,例如英语,如今仍在使用,但是大多数已经逐渐不为人知了。 这些沉寂的手稿让我们痴迷。这些文字记录究竟表达了什么意思? 如何深入到过去,倾听沉寂的声音这是文字破译工作面临的最大挑战。1823年,埃及象形文字破译之时,有记载的历史突然间延伸了2000余年,我们得以阅读拉姆西斯大帝的文字记录。玛雅文字的破译向我们展示了一个与罗马帝国同时代的错综复杂的新大陆一个同样有着高度文明的国度。 未知文字如何破译?至少需要满足两个条件:首先,充足的文字资料;其次,该文字与已知文字存在联系。如果碑文是双语文稿或者包含了能够识别的专有名词,这对于破译工作会大有帮助例如罗塞塔石碑,用古埃及语和古希腊语写成,同时上面还刻有托勒密王朝的名字。如果没有任何的关联,就必须尝试在被封藏的语言和已知语言之间寻找到联系。 尽管人们已经破译出了许多古文字(见图表历史上重要的破译文字),但是尚有一些重要的文字正等着人们去解读。这样的情况分为三大类:用未知语言写成的已知文稿;用已知语言写成的未知文稿;用未知语言写成的未知文稿。前两类较为容易破译,但是第三类这让我们想起了唐纳德拉姆斯菲尔德(DonaldRumsfelds,美国前国防部部长)和他的举世名言我们不知道我们不知道的事物。(Uknownunknowns.)是一种比较棘手的情况,当然这无法阻止人们去探寻它的真正面目。 以下提及的大多未破译文字已经为人们部分破译,一些知名的研究人员甚至宣布他们的破译工作已几近圆满。古文字研究是一项进度非常快的工作,尤其是随着新的文稿的发掘,新的研究成功会不断发布欣慰的是,这样的情况时常发生。 资料:安德鲁罗宾森,剑桥大学沃弗森学院客座教授,著有《失落的语言:世界未破译文字之谜》(汤姆斯和哈德逊出版社)和《牛津通识读本:书写与文字》(将于2009年由牛津大学出版社出版)。 1艾特鲁斯坎语 来自希腊文字但区别于希腊语 (未知语言写成的已知文稿) 对那些痴迷于语言和书写的人们来说,艾特鲁斯坎语既让人心生向往又让人倍感挫败。这种语言的破译过程正如让一个人只通过阅读碑文来学习现在的英语一样。艾特鲁斯坎文字使用古希腊字母,但是却区别于任何一种语言。我们读得出来那些句子,但是除了人名和地名,还有一些零星的词汇和正式用语,没人猜得出来那是什么意思。 艾特鲁斯坎文明崛起于史前,位于现在的意大利行政区托斯卡纳和翁布里亚境内,公元前一世纪并入罗马帝国。艾特鲁斯坎人有较强的读写修养,其上千余篇的文字记录留存于世。许多出土的艾特鲁斯坎工艺品上刻有希腊字母,几乎可以确认,这些字母是从公元前775年居住在意大利西部的希腊殖民者那里传入的。 艾特鲁斯坎人日常使用的字母系统却又不一样,尽管它看起来很像希腊字母,二者却又有极明显的区别其中最大的不同在于,艾特鲁斯坎语的字母通常与希腊字母相反。过去的一个世纪里,研究人员一直试图寻找艾特鲁斯坎语和其他已知欧洲语言(包括巴斯克语)的共同点,但是结果是徒劳的显然艾特鲁斯坎语不属于印欧语系,人们只能将其划分为和巴斯克语一样的孤立语言。 不过人们还是从上下文中猜出了一些艾特鲁斯坎单词的意思,例如Ruma(罗马),Clevsina(丘西城)和Fufluns(酒神狄俄倪索斯)。现在需要解决的问题是如何得知那些名字以外的单词的含义。目前大约有250个像ciavil(三年)这样含义确定的单词,而随着新的文稿的发掘,这一数量还会继续增加。 公元前二至三世纪用艾特鲁斯坎语写成的铜片,内容可能是地契 刻着希腊字母写成的艾特鲁斯坎语的墨水瓶 2麦罗埃象形文字 黑法老王的语言 (未知语言写成的已知文稿) 公元前1000年左右,坐落于今日苏丹境内的库施王朝在阿布辛贝和喀土穆之间的尼罗河两个大拐弯之间繁盛起来。库施文明(又名麦罗埃文明,因首都麦罗埃得名)跻身成为当时撒哈拉以南地区最强大的非洲国家之一。 公元前712年,库施的国王们征服了埃及,将它变成了库施统治下的第二十五王朝。公元前656年,与亚述人一役战败,统治了埃及将近七十年的黑法老王和他的库施人被赶回了老家。 在此战役之后,麦罗埃象形文字才开始兴起。库施法老们曾经使用的文字是埃及象形文字,但是公元前三世纪之后,越来越多的埃及文字中出现了一种新的当地文字。在埃及碑文上(例如罗塞塔碑文),人们可以看到两种文字:一种是刻在墓碑上象形文字其实就是一种图形字符;另一种是人们平日用的手写体。 和拥有上百个字符的埃及象形文字不同的是,麦罗埃文只有23个字符,这和现代字母表很相像。1911年,牛津大学的埃及学专家弗朗西斯卢埃林格里菲斯(FrancisLlewellynGriffith)曾成功从一篇麦罗埃语和埃及语双语碑文中破译了两种麦罗埃文的发音。 所以正如艾特鲁斯坎文字,麦罗埃文字也是可读文字,但是作为一种未知语言,人们无法理解它的含义。现在麦罗埃文中已经知道含义的只有专有名词,还有其他为数不多的从上下文中猜测出来的单词,比如tenke(西方,西部)和ato(水)。 格里菲斯认为麦罗埃文有最终破译的可能。但是几十年来,尽管专家们将麦罗埃文字和该地区所有时期的非洲文字做过了比较,都没有发现什么令人信服的共同点。 和埃及语之间到底是什么关系? 3来自新大陆的语言 奥尔梅克语,萨巴特克语和地峡文字 (奥尔梅克语:未知语言写成的未知文稿 萨巴特克语:或许已知的语言写成的未知文稿 地峡文字:或许已知的语言写成的未知文稿) 我们已知的传统的玛雅文明(约公元250年至8世纪)是能够读写的文明,但是中美洲乃至整个新大陆的文字起源却无从知晓。这个地区尚有大量未破译的古文字,其中最受关注的三种文字是奥尔梅克语,萨巴特克语和地峡文字。 奥尔梅克人可能是创造了这片陆地上最古老文字的美洲人。约公元前1500年至公元前400年期间,他们在墨西哥湾沿岸的特万特佩克地峡繁衍,建立了美洲大陆最古老的文明。上个世纪九十年代末,一个筑路工人发现了一块石头,上面刻有62个字符,其中部分重复,产生年代为公元前900年。但是因为没有新的碑文发掘,人们不能确认它到底是不是文字,奥尔梅克文字最终未能破译。 瓦哈卡地区的萨巴特克文明无疑拥有自己的文字。目前这个地区已有1200余件刻有文字的文物出土,其中包括涂墙,陶罐,动物骨头和贝壳,其活跃时间大约为公元前600年至公元前400年之间。 学者们已经破译了萨巴特克历法,认为它是玛雅历法的前身。尽管现在这个地区的人们说的仍是萨巴特克语,但是由于该语系极为错综复杂,重建文稿中的语言仍是一项十份艰难的工作。 最具争议的文字是地峡语言,它是这三种语言中最晚出现的文字。它的名字甚至还没有统一,有些人称之为后奥尔梅克文字。1902年,人们从奥尔梅克地区一块农田里刨出了一块非同寻常的玉石雕像上面刻着的是一名穿着模仿鸭子男子,周身有70余个未知字符。这块名为土斯拉像人的雕像现存于华盛顿市史密松研究院。1986年,第二件地峡文字碑文现世,由一名渔夫在河里捞到。这块重达四吨的光洁的巨石板上刻有的地峡文字,比起之前那块雕像要多得多。 地峡文字源于公元二世纪,人们认为它是特万特佩克地峡现存语言索克语的起源语言。曾经有两位分别来自纽约州立大学和匹兹堡大学的语言学家约翰加斯特森(JohnJusteson)和特伦斯考夫曼(TerrenceKaufman)声称他们重建了原索克语,并在此基础上破译了地峡文字。但是众所周知,在更多的碑文出土之前,这种破译根本不足为信。 穿着模仿鸭子的土斯拉人像 4线形文字A 米诺斯谜团 (未知语言写成的部分已知的文稿) 1900年,英国考古学家亚瑟伊万在克里特岛的科诺塞斯铜器时代米诺斯文明的中心,同时发现了两种未知文字。这些文字都写在陶片上,出土于米诺斯王宫。 其中的线形文字B,已于1952年成功破译,成为欧洲最早的可读文字(参见历史上重要的破译文字)。而线形文字A,到目前为止仍未能破译。 线形文字B大约始于公元前1450年,为当时征服了克里特岛部分地区的希腊人使用,是一种古老的书面希腊语。线形文字A的历史更为悠久,约在公元前18世纪左右。它是我们已知的唯一与失落的米诺斯语言有关联的文字。 但不幸的是,我们能找到的线形文字A文稿远远少于线形文字B。除了克里特岛本土,在爱琴岛,希腊大陆,土耳其和以色列也有线形文字A出土。但是大多数碑文都不完整,它们部分缺失或过于简短。 线形文字A的字符和线形文字B极为相像,但这并不等于它们也有相同的发音。米诺斯语和希腊语之间还是存在差异的。你可以用线形文字B的发音读线形文字A,但是没有人懂米诺斯语,我们也就无从确认它是否正确。但能够从中做出推断的是,线形文字A并不是希腊语言。 5朗格朗格语 复活节岛颂歌 (用有可能已知的语言写成的未知文稿) 当地的传说是,这种文字跟随着来此定居的玻利尼西亚人的小船而来。 复活节岛本身是一个充满神秘和诱惑的地方。岛上土著语朗格朗格语也毫不例外,吸引了很多人的关注。 朗格朗格在复活节岛文字拉帕努依语中的意思是颂歌。尽管朗格朗格语看起来和拉帕努依语很相像,但是这种文字更为复杂难解。现存的25份文稿全都写在木板上,其中有些篇幅很长。 这种文字的历史渊源无从探究,当地的传说是,大概公元300年左右,它跟随着来此定居的玻利尼西亚人的小船而来。然而,1722第一支登陆复活节岛的荷兰船队并没有发现过岛上使用过朗格朗格语。1770年两艘西班牙船只来到岛上,和这里的人们签订协约将复活节岛划归西班牙名下,但是上面的签名也不像是朗格朗格文字。 1774年詹姆斯库克船长(JamesCook)登上这片大陆上的时候,根本没有看到过书写文字。直至1864年,一名法国传教士宣布他见到了朗格朗格语,但是认为这种语言已经濒临灭绝。尽管十九世纪七十年代,塔西提的牧师们做了许多挽救这种语言的努力,人们已经无法在这座岛上找到懂朗格朗格语的居民。自此以后,学者们便在如何破译朗格朗格语的问题上争执不休。 朗格朗格语拥有诸多痴迷者,这并不令人惊讶。在他们之中有一种较为流行的解释是朗格朗格语和古印度河文字有关联,因为二者有些字符相似,这有点荒谬。 毋庸置疑的一点是,朗格朗格语的阅读方向非常特殊,尽管并不是绝无仅有。第一行从文稿的左下角开始读,然后将木板180度倒转,接着从左边开始,读在上面的第二行,读完之后再次180倒转,如此往复。这就是所谓的牛耕式转行书写法(boustrophedon,古希腊语,意为耕地时牛掉转头)。 资料:历史上重要的破译文字 文字一:埃及象形文字 时间:1823年 破译者:法国东方学专家让弗朗索瓦商博良 介绍:破译过罗塞塔石碑(部分由物理学家托马斯杨破译)的商博良,有着深厚的古埃及语和科普特语功底,这对他后来破译埃及象形文字起到了重要作用。 文字二:巴比伦楔形文字 时间:19世纪50年代 破译者:英国亚述学家亨利克雷奇克罗林森和爱尔兰牧师爱德华辛克斯 介绍:对大流士大帝时期的贝希斯铭文古波斯,巴比伦和埃兰三种楔形文字同时写成的铭文进行了20余年的研究。 文字三:线形文字B 时间:1952 破译者:英国建筑师和古典学爱好者迈克尔文特李斯 介绍:经过多年的不懈研究中,其中运用到了建筑学的解析思维,并且在缺失双语文稿的情况下将线形文字B认定为古希腊语言。 文字四:玛雅字符 时间:1952 破译者:苏联语言学家尤里诺罗索夫 介绍:16世纪一位西班牙检察官在墨西哥写成玛雅语西班牙语字母对照表,尤里诺罗索夫通过这份残缺的字母表将玛雅字符与现代玛雅字典中的单词拼写进行对照参考。 6古印度河文字 独角兽图形 (或许已知的语言写成的未知文稿) 印度河流域文明的遗址包括今天的巴基斯坦和西北部地区,大约是欧洲面积的四分之一。公元前2500年至公元前1900年间是它最为兴盛的时期,它的主要城市的规模已与同时代的美索不达米亚和埃及城市繁荣程度相当。 古印度河文字的分布范围十分广泛,人们已经发现了5000余件刻有这种文字的石器。印章上最常见的图案是一种独角的四足动物,像印度传说中的独角兽。古印度河文字记录中最短的只有五个字符,最长的也仅有20个。有些学者怀疑这根本不是一种书写文字。 也许古印度河文字已经追随印度文明而去,但是有的专家认为达罗毗语系和古印度河文字有某种联系。如今使用达罗毗语的区域只有南部印度地区和印度河谷附近的巴基斯坦俾路支地区。在俾路支,达罗毗语被称为布拉灰,如果关于达罗毗的假说成立,那么我们就可以将泰米尔那多地区一种古老形式的泰米尔语达罗毗语的一支与古印度河文字进行匹配,进行破译。 例如,下图是一个普通的鱼形字符。古泰米尔语中表示鱼的单词是min,但是min还有星星,行星的意思。那么,鱼形字符就有可能表示天体这有点像在字谜中用sun(太阳)的象形文字表示单词son(儿子)。 尽管这样的假设很吸引人,但是古印度河文字破译工作还是需要更多的努力。二十世纪二十年代该文字出土之后,人们已经破译出了超过100份文本,破译者中不乏受人尊敬的考古学家。问题是这些研究成果分歧严重,而且这种情况时常发生。 7原始埃兰文字 最古老的未破译文字 (未知语言写成的部分已知的文稿) 如果原始埃兰文字是一种具有完备书写体系的文字,那么它就是目前世界上最古老的未破译文字,但这一前提却无法得到确切证明。圣经中所指的埃兰大概就是今日伊朗西部的油田地区,原始埃兰文字的使用时间应该是从公元前约3050年开始,持续了150年左右。它几乎和最古老的美索不达米亚楔形文字同龄,但是我们几乎找不到它的使用者的资料。 原始埃兰文字之后,大概过了750年,线形埃兰文字成为该地区的语言,该文字目前已经部分破译。而公元前13世纪起,第三种埃兰文字出现埃兰楔形文字,它的使用时间超过了几个世纪,这一文字已经在19世纪破译。 这三种埃兰文字相互间隔约800年,没有任何过渡的文字记录如同盎格鲁撒克逊时期和现代英国时期之间缺失了乔叟和莎士比亚。 对于原始埃兰文字和线形埃兰文字之间关系一直存在着诸多争议。二十世纪初原始埃兰文字出土,它的发掘者认为两种文字为同一种语言。学者们也赞同这一说法。但是二十世纪八十年代以后,专家们越来越信服另一种观点,即二者没有共同的语言和文化。学者们已经能够详细地解读原始埃兰算法,但仍旧无法解释碑文上的语言。 碑文中所用语言和该语言的使用者均为未知 8菲斯通盘 是最古老的铭文还是闹剧? (未知语言写成的未知文稿) 举世闻名的菲斯通盘文字可能是世界上最古老的铭文。这块直径约为15厘米的菲斯通盘出土于克里特岛,目前陈列在伊拉克利翁展览馆最显耀的展位上。但是有些人认为不应该将其归类于未破译文字之列因为菲斯通盘根本就是伪造的,它是古文字中的皮尔唐人(1912年在英国皮尔当发现的头盖骨,当时认为是史前人类的化石,1953年经鉴定为伪造)。 尽管如此,大多数专家还是愿意把它当作正品来对待。1908年意大利考古学家在古菲斯通遗址发掘到这块铭文,根据考古研究判断,可能是公元前1700年左右时期的作品。但是到目前为止,还没有多少学者向众人展示过他们的破译成果。 菲斯通盘实质上是一件双面刻有字符的烧纸陶器,字符排成螺旋形状。上面总共有242个字符(其中有一个磨损),是由45枚印章在陶器烧制之前印上去的。这是唯一可以基于事实给出的陈述。 但是比起费劲去刻45枚印章,制盘工人为什么不把文字直接写在湿陶上?如果是批量制造,那为什么找不到任何其它的菲斯通盘?而这些字符看起来和其它的任何一种克里特文字都完全不一样,这又如何解释? 有一种解释是,这块铭文可能从外地传入,例如安那托利亚(其中一个字符和安那托利亚石墓上的字符相像)。如果是这样,菲斯通盘上的文字就成了一种无法知晓的非克里特语言。在人们能够发掘到更多的菲斯通文字之前,它仍是一个复杂难解的谜团。 菲斯通盘
个人分类: 小红猪翻译小分队|2814 次阅读|2 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 18:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部