科学网

 找回密码
  注册

tag 标签: 汉语语法

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

答网友问:汉语语法为什么是世界上最乱的语法?
热度 1 Boqitang 2016-4-5 11:07
汉语语法为什么是世界上最乱的语法,请详细阐述一下理由并举例,非常感谢。 2013-03-24 22:03 長得如此欠扁 | 分类: 语言学 | 浏览603次 2013-03-24 22:47 提问者采纳 是谁向你传播“汉语是世界上最乱的语法”这样的观点的?——这种观点是极其错误的!判定是否“最乱”,是要有标准的,说 汉语语法 “最乱”,判定的标准是什么?判定 汉语语法 的“正、乱”与否,能以英语、法语、阿拉伯语、印地语等等的语法为标准吗?——不能!楼上的“爱是地狱”的回答,基本是胡扯! 估计你说的所谓“乱”,大概是这样一种情况:主要是指书面语言的所谓“语法”,而不是“口头语言”:汉字是表意文字,没有拼音文字那种形式化的标识语法特征的词汇形式,如:各种具有语法意义的动词形式(时态变化、各种分词形式等);名词的格、阴性、阳性、单复数形式等等。 简而言之,汉语不是形式化的语言。 语言的形态变化与词序(语序)关系密切,形态变化越多的语言,词序越不固定(或曰:‘乱’、“不稳定”、“灵活”也可以)。拉丁语是典型的形式化语言,词即使移动了位置,也可以从其形态标识识别它的语法意义,因而词序可以不固定。汉语是典型的分析语,词没有形态标识,词语之间的关系主要通过安排词序及使用虚词来表达,所以,词序(语序)相对固定(稳定),“秩序”良好,不“乱”,也不能“乱”! 海 瑞两千 | 来自团队 大家的团 | 十二级 采纳率71% 其他4条回答 2013-03-24 22:13 爱是地狱 | 十五级 世界上那么多语言,其语法文字各不相同,法语的语法很像科学推理那样严肃硬板; 而汉语单从古诗词就可以看出她的语法很混乱更像做的梦一样飘渺梦幻。 法语是说明文、论文,汉语则是诗是画, 一个倾向于西方理性的端点,另一个则代表了东方的感性的特点。 汉语语法为什么是世界上最乱的语法,五点来说吧 1。文字:汉字是由笔画构成而非字母。而且比较恐怖的是汉字不象绝大多数的语言(如英语),字型和读音基本么什么关系。外国人习惯于将语音和字型联系起来学习,结果是崩溃。 2。语音,汉语是唯一有四个声调的语言。长短音在不同情况下还有不同的感情含义,这一点连很多中国人都无法理解。何况外国人。 3。含义,根据联合国教课文组织统计,汉语的一词多意是世界最多的,形象点说就是英语的2.5倍。 4。语法:拿省略和词性活用来说吧,大多数语言在这方面都是有一定规律的(我的意思是,每种语言都有自己的一定规律,只要掌握了这规律就会容易一些)但是,但是,汉语在这方面,说话的人省略的部分,表达的词性,大多是依照个人喜号,一人一个习惯,还有各式各样的方言。这一点真的是让人绝望,一个例子,从中学到大学都没有的知识。断句不同解释不同,这个就是不严谨的语法。(从中/学到/大学都没有的知识and从中学到大学/都没有的知识) 5。文化,这是可以让所有中国人都引以自傲的。我们有数千年的历史,而不同的朝代又有不同的积淀,语言有连续性,也有间断地方,今人不知古人言,今字曾经照古人。 2013-03-24 22:16 天风海雨楼主 | 十五级 现在通行的语法,是用西方语法来套汉语,自然混乱。实际上古人并不讲语法,却运用得纯熟。 | 2013-03-26 20:47 伏花 | 二级 非常遗憾,我不能苟同您的观点。 我认为,汉语和其他语言的基本构成是一样的,虽然它有着民族的独特性,但是最基本的语法功能和其他的语言还是相通的。如果您认为汉语语法是很乱的理论的话,只能说您还没有真正进入汉语语法的天地,光看看它的某一点就让您害怕了。所谓一叶障目可能就是您现在的状态吧? 其实汉语语法分为现代汉语和古代汉语两大类型,如果您真的想否定中国的母语的话,就请先认真钻研,找到“毛病”后再下结论吧! 到时候我定仔细请教。 来自:求助得到的回答 2013-03-24 22:15 zezestx | 来自 手机知道 | 四级 那你能说出它有什么语法吗?你现在学的都是在说了几千年之后,效仿西方语法,在近几年里生拉硬拽出来的.
个人分类: 答网友问|4097 次阅读|1 个评论
[转载]汉语“有”字句 存疑
carldy 2014-5-20 22:48
【“有”字句】   “有”字句是由“有”做谓语构成的句子。动词“有”的基本意义主要有两项。一是“存在”,二是“领有”。    一 “存在”的“有”   “有”和“在”都表示存在,可是它们的结构形式却不相同。“有”表示的是处所、时间存在着人或事物。基本结构是:   处所、时间词语+有+名词性词语   例如:   (1)教室里有很多学生。   (2)唐代有位著名诗人,叫李白。   “在”前的名词性词语一般是确指的,“有”后的名词性词语往往不是确指的。所以名词性词语前常常用“数量名”结构。比较:   词典在书架上。(确指)——书架上有几本词典。(不确指)   人在屋里。(确指)——屋里有两个人。(不确指)    二 “领有”的“有”   1.作谓语时,基本结构是:     名词性词语(多是有生命的)十有十名词性词语   例如:   (3)人人都有两只手。   (4)我有很多朋友。   (5)他有一个幸福的家庭。   2.“有”还可以表示具有某种新情况发生和出现。这时“有”后常常附有表示变化意义的“了”;“有”的宾语常常是动词在性词语,也有名词性的。其基本结构是:   名词性词语十有(了)十动词/名词   例如:   (6)最近,他的汉语有了明显的进步。   (7)近几年,教育又有了很大的发展。   (8)她又有男朋友了。   “有”前有副词“又”时,“有”后一般都要加“了”。   *她又有男朋友。   *我又有机会。   “有”后接“过”可以表示“曾经具有”的意义。例如:   (9)他有过去国外的机会,可是他放弃了。   (10)过去,她曾经有过这种经历。   3.一般的“有”不受程度副词修饰,但是当宾话表示的是主语的属性,宾语多为抽象名词时,“有”可以接受程度副词的修饰。   例如:   (11)这次社会实践很有意义。   (12)这个青年非常有头脑。   (13)小王很有领导才能。    三 “有”的否定形式   “有”只能接受“没”的否定,不能接受“不”的否定。对提问进行否定回答时,不能单独用“没”。否定后,不是在特定的场合下(反驳、对比、强调等),宾语前一般不用不确指的数量词语。   例如:   (14)我没有时间,不能陪你上街了。   (15)你有中国朋友吗?——没有。  *你有中国朋友吗?——没。   (16)我没有自行车。    *我没有一辆自行车。    四 “有”的疑问形式   可以在句尾加“吗”,也可以用“有没有”的形式。但是用“有没有”提问时,除特殊场合外(反驳、对比、强调等),宾语前一般不用表示不确指意义的数量词语。例如:   (17)他到现在还没有住处吗?   (18)你有没有这三种书?(确指数量)   (19)今年夏天我们有假期没有?   (20)在美国,有很多中国饭店吗?   (21)在美国,有没有很多中国饭店?(不确指数量) 2004-09-24 选自:卢福波著《对外汉语教学实用语法》 http://www.pep.com.cn/xgjy/hyjx/hyxxzy/hyxx/yffd/201009/t20100901_855484.htm
个人分类: 语言学探讨 Linguistics|1545 次阅读|0 个评论
还是要学点汉语语法
热度 2 Greg66 2012-9-6 12:34
一些同学的文章中,“的地得”三个字区分不清楚。 带“的”的是形容词,修饰名词; 带“地”的是副词,修饰动词或者形容词; 不要弄混了,请查查“百度”。
3410 次阅读|4 个评论
“地”还是“着”?说温家宝的题词:"微笑地生活下去"
热度 1 liwei999 2011-5-25 18:59
回答: 来评评这句话:微笑地生活下去 说"微笑着生活下去",不持续笑也得时不常地笑一下。 作者: mirror (*) 日期: 05/23/2011 17:22:55 而"微笑地生活下去"的说法,可以与人笑不笑无关,是一种借意。“ 微笑着”是面孔,“微笑地”是心境。 ---------- 就“是”论事儿,就“事儿”论是,就“事儿”论“事儿”。 合法, 但不如“微笑着”/"带着微笑“ 生活下去 “地”-字结构 (语法形式) 做动词状语,通常表示“方式”(语法意义); 作者: 立委 (*) 日期: 05/23/2011 13:41:28 带有体助词“着”的动词(语法形式)可以做动词的状语,表示“伴随情形”(语法意义)。 如果理解成 ,用微笑的办法(来)生活下去,那么“地”本无不可。 如果理解成,带着微笑(去)生活下去,就应该用“着”。 前者太刻意;后者更潇洒。 Quote 合法,但不如“微笑着生活下去” 好。 存在的都是合理的。 套这个句式可以说:合法的,都是有道理的。 这个道理就是,温总的原意是不是强调“方法”多于“情境”。 汉语活用词法一般指的是自主的、不用外在助词的用法。 作者: 立委 (*) 日期: 05/23/2011 14:40:53 古汉语中,或者现代汉语构词法中,有很多词活用的例子:瓦解;玉成,等等。瓦和玉原来是名词,活用为副词 ,做状语,等价于介词框架结构“象N那样”。 用了助词以后就不是什么活用了,就是被强迫了,语法上叫做“地字结构”。虽然形容词比较常见,但原则上任何词和短语都可以与“地”构成地字结构,其结构功能是谓词(包括动词和形容词)的状语。 回答:加不加助词,就要把本来活用的词另外分类? 活用 by definition is 隐性的,加了助词就是显性的了 作者: 立委 (*) 日期: 05/23/2011 15:01:47 重要的语言事实是,无 论什么词(或者短语)加上“地”以后,其功能都是一致的。 因此,说“微笑+地”是微笑的活用,是不妥的。因为 X+地 也仍是如此,不单是微笑。 说到底,为什么要用 词类活用、地字结构等等概念,所有这些概念都是为了概括语言现象和规律。从这个宗旨上看,拿 X+地 的 地字结构的说法来说明“微笑地V”这样的语言现象,显然比说“微笑”活用以后加上一个可有可无的助词“地”来修饰动词,要简洁漂亮得多。 因此,这个回合,你还是举白旗比较好。你面对的是语言“学”匠人,不是语言匠人,而你语言学没有入门,最多算个语言匠人或语言艺术家(高级匠人),与语言学没有什么关系。不在一个层次上。我是在元语言层次上呢。 会跳舞的不见得是舞蹈专家;会拉小提琴的不一定是音乐家;会写美文的大多不是语言学家。 至于 Quote 微笑本身就不一定是动词,更是名词 在语言学上,是一个不知所云的说法。 不是说词类活用么?没说合法非法。 作者: 立委 (*) 日期: 05/23/2011 16:31:09 第一个活用的人有非法嫌疑,大家都活用了,就成为一词多类。 对于古汉语,活用 是常态,因此,第一个活用的也不非法。 断言不如是我的错,认。任何说法,只要 fit 那个情形,就是好的。 作者: 立委 (*) 日期: 05/24/2011 13:44:40 我说不如的时候,是不知道这句话在哪种场合说的,谁说的,具体要表达什么。其实现在还不知道究竟,只是知道出自温 总,在日本。既然你如此推崇在这里的这个“地”字,我相信你的判断。 我说不如是一般而言。当然,这不过是小学教师的判断而已。 好,你赢了,下次见面我请客。
个人分类: 其他杂碎|1807 次阅读|1 个评论
《科技汉语语法纲要》——科技汉语句子的时态
gzchengzhi 2011-5-22 20:13
第三部分 科技汉语句子的时态   科技汉语中应该明确反映出句子的时态变化,这是语法严密性的基本要求。   对汉语时态的研究目前已经积累了相当多的成果。这也反映出现代汉语的一个重要的特征。   对于什么是时态,陈立民给出的定义认为汉语时态的变化反映的是在不同的时域变化中,事件的存在方式 。另外早在上个世纪八、九十年代,陈平、张敬仪、王松茂、龚千炎等也专门对汉语的时态进行了专门的研究 。在他们的研究成果中,探讨了汉语时态助词的语法范畴等问题,张敬仪的研究还涉及到了汉语和维吾尔语在动词时态的比较问题。近十年来,随着与英语使用者的交流日渐频繁,一些学者也开始注意汉语时态的问题。一些学者建议设立专门的时态短语来反映汉语句子的时态 。   另外分析汉语句子的时态问题,另一个非常重要的领域是机器翻译中的汉语时态的处理。对于汉语本身而言,自己已经有一套表示时态的规则,但是这种规则是与英语等语言不同的。如何成功地实现汉语到英语之间的时态转换,这似乎已经成为了机器翻译领域的一个热点。   例如一些研究者探讨了在汉语到英语机器翻译过程中涉及的规则问题 。另一些学者针对采用规则的方式来确定汉语时态的困难性,提出了采用模式分类的方法来确定汉语句子的时态 。针对汉语句子时态变化的复杂性,一些学者也尝试着利用机器来确定汉语篇章的时态信息等 。   与英语句子不同,科技汉语的动词没有时态的变化,因此句子中的时态变化可以通过相应的虚词来进行指定。   单字时态虚词包括:了、已、着、过、当、曾、近、将、正、前、后   双字时态虚词包括:曾经、过去、过往、当时、已经、将要、正在、继续、以来、直到    一般现在时态: 不需要使用时态虚词。    一般过去时态: 可以使用“前”、“曾”、“曾经”、“过去”、“过往”、“当时”等。    现在完成时态: 可以使用“已”、“已经”、“过”(放在动词后面)、“自从”、“以来”    一般将来时态: 可以使用“将”    正在进行时态: 可以使用“着”、“正”、“正在”、“继续”    过去完成时态: 可以使用“了”    虚词的省略方法:   在汉语中,最直接的方式是使用虚词来表示句子的时态。一般情况下,不使用虚词来表示时态的句子是一般现在时态,但是在其他时态使用的时候经常也会出现省略虚词的情况。   1)一般现在时态可以省略虚词   2)过去时态虚词和将来时态虚词的省略依赖于时间状语。如果包含了明确的时间状语,则可能会出现省略这两种时态虚词的情况。   3)在二字时态虚词中,包含了其他的虚词,则有时可以省略其中的一个。如“将要”可以省略为“要”。   4)汉语的时态变化还可以放在一个段落中来分析。如果在一段文字中包含了时间状语,其中的过去或将来时态虚词可能会被省略。不过在科技汉语中,应该尽量避免这种情况。为了避免歧义,如果一个段落中同时包含了现在时态、过去时态、将来时态,则不应该省略时态虚词。   对于时态的组合,则不宜省略虚词,否则难以准确地表达出句子的时态。   7 现在时态   8 过去时态   9 将来时态   10 进行时态   11 完成时态   12 时态的组合 第四部分 计算机技术在科技汉语语法中的应用   13 汉语统计模型   14 N-gram模型   15 汉语的语法检查   16 拼音输入法 参考文献: 陈立民. 汉语的时态和时态成分 . 语言研究, 2002(003): 14–31. 张敬仪. 汉维动词时态的比较 . 西北民族大学学报 (哲学社会科学版), 1981, 4. 王松茂. 汉语时体范畴论 . 齐齐哈尔师范学院学报 (哲学社会科学版), 1981. 龚千炎. 汉语的时相, 时制, 时态 . 商务印书馆, 1995. 龚千炎. 谈现代汉语的时制表示和时态表达系统 . 中国语文, 1991, 4: 251–261. 陈平. 论现代汉语时间系统的三元结构 . 中国语文, 1988, 6: 401–422. 李梅. 从现代汉语角度考察功能语类–时态的设立 . 现代外语, 2003, 26(001): 22–27. 程节华, 戴新宇, 陈家骏, 等. 汉英机器翻译中时体态处理 . 计算机应用研究, 2004, 21(3): 79–80. 林达真, 李绍滋. 基于模式分类的汉语时态确定方法研究 . 中文信息学报, 2006, 20(001): 67–75. 马红妹, 齐璇, 王挺, 等. 汉英机器翻译中汉语篇章时间信息系统模型 . 计算机工程与科学, 2002, 24(004): 85–88.
6255 次阅读|0 个评论
《科技汉语语法纲要》——5 科技汉语的句法
热度 1 gzchengzhi 2011-5-12 00:08
   5.1 常见的句子类型   根据英语以及现代汉语的语法的界定方式,按照用途来划分,科技汉语中的句子类型可以分成:   陈述句、疑问句、祈使句、感叹句等四种。   按照结构来划分,可以分成单句、复句和多重复句等三种。   5.2 科技汉语的句型结构   一个完整的句子由多个句子元素构成。比较常用的句子元素包括:   主语(Subject,简称S)、谓语(Predicate,简称P)、宾语(Object,简称O)、定语(Attribute,简称D)、状语(Adverbial,简称Z)、补语(Complement,简称C)   尽管这六种元素的组合数量可以达到几万,但符合汉语语法规定的组合只有几十种而已。   下面分几种情况加以说明:    1.句子的基础结构   句子的基础结构为:   SP   在此基础上衍生出来的包括:   DSP, SZP, DSZP   SPO, DSPO, SZPO, DSZPO, SPDO, DSPDO, SZPDO, DSZPDO    2.补语的应用   补语的应用比较复杂,因为补语主要起到对其他各种元素进行补充说明的作用。   1)SP结构中的补语应用方法:   SCP, SPC, SCPC   2)SPO结构中的补语应用方法:   SCPO, SPCO, SPOC   SCPCO, SCPOC, SCPCOC   SPCOC   3)其他。   理论上也可以对定语、状语进行补充说明。这样就形成了DC和ZC的形式。所形成的句型结构包括:   SZCP, DSZCP   DSPO, SZCPO, DSZCPO, SPDO   DSPDO, SZCPDO, DSZCPDO   DCSP, SZP, DCSZP   DCSPO, SZPO, DCSZPO, SPDCO   DCSPDO, SZPDCO, DCSZPDO   DSPDCO, DSZPDCO   DCSPDCO, DCSZPDCO   DCSP, SZCP, DCSZCP   DCSPO, SZCPO, DCSZCPO, SPDCO   DCSPDO, SZCPDCO, DCSZCPDO   DSPDCO, DSZCPDCO   DCSPDCO, DCSZCPDCO   等等。   比如“鲜艳的花朵开满花园”,对定语进行补充说明后,就变成了:“鲜艳得娇艳欲滴的花朵开满花园”。其中“娇艳欲滴”就是“鲜艳”的补语。不过这样的用法在科技汉语句子中比较少见。   鉴于补语的使用经常造成混淆,因此有必要在语法上进行约束。即如果在句子中使用了补语,则一定要使用虚词来进行词汇分割。比如,使用“得”、“了”、“不”等。如果不进行分割,则应将其视为一个多字词汇。    5. 3 语法上完整句子的界定   与英语一样,汉语的一个句子表示了一个完整的意义。虽然一个句子是否完整,可以直接从这句话的意义来进行判断,但是因为对句子意义的理解因人而异,所以有必要从语法上来对一个句子的完整性质进行规定。   尽管科技汉语中的句型结构是多种多样的,但是任何句子中都必须包含主语和谓语,这可以被看作是一个句子完整与否的最基本标志。    5.3.1 单句   这些句子能够直接被归类到上述任何一种句型结构之中,且每一个句子元素都由独立的词汇组成。    5.3.2 复句   1.如果该句子能够被归类到某一种句型结构,但其中至少有一种元素采用了短语的方式,则这属于一种复句。   2.第二种复句为使用连词将两个单句连接在一起。    5.3.3 多重复句   如果使用多个连词将两个以上的单句或复句连接在一起,就形成了更加复杂的复句形式。这里称之为多重复句。   比如曹广福教授给出的这个例子:“甲、乙两人沿铁路线相向而行,速度相同。一列火车从甲身边开过用了6秒,4分后火车又从乙身边开过用了5秒,那么从火车遇到乙开始,再过多少分甲、乙两人相遇?”。原题中,从标点符号的使用情况来看,似乎只有两个句子。但从语法的角度来看,实际上该题目包含了三个句子。对其进行修改以后就变成了这个样子:   “甲、乙两人沿铁路线相向而行,速度相同。一列火车从甲身边开过用了6秒,然后4分后它又从乙身边开过用了5秒。那么从火车遇到乙开始,再过多少分甲、乙两人相遇?”
3823 次阅读|5 个评论
楼堂馆所命名问题
热度 1 gzchengzhi 2011-5-7 23:01
  刚刚发了“ 《科技汉语语法纲要》——4 汉语分词方法 ”一章内容,顺便浏览了一下戴世强老师的博文“ 小议知识分子的社会声誉 ”。看到文中谈到戴老师的单位是“上海市应用数学和力学研究所”,突然意识到里面可能存在一些问题。   如果按照二字词汇作为基本单位的方法来规定汉语句子的分词要求,理论上是可以达到比较准确地对汉语句子进行词汇的分割的要求的。如果是三字词汇,对于普通的句子而言,显然可以通过规定增加虚词的方式来进行分词,但是对于那些“xxx派出所”、“xxx科学院”等的命名该如何处理?总不能要求这些楼堂馆所也必须在名字中增加虚词吧?   显然通过增加虚词的方式可以使名称的表达更加准确。比如“上海市应用数学和力学研究所”,通过增加虚词表达出来就变成了这样:“上海市的应用数学和力学的研究所”。不过这样一来,这就不成为一个专有的名称了。   但如果不这样做,该名称显然是存在歧义的。我们既可以将其理解为:“上海市应用数学和力学研究 所”,也可以理解为“上海市应用数学和力学 研究所”。二者区别在于前者强调了“研究”这一词汇,意味着这一机构就是一个进行数学和力学研究的馆所。而后者则强调了“研究所”这一词汇,意味着这是一个具备研究性质的馆所,涉及的领域为数学和力学。   尽管二者之间的意义相差不大,但相信足以对一个馆所的定位产生不同的影响。我建议的解决方法就是取消其中的三字词汇,改用二字词汇作为基本单位,采用自然分割的方法来消除歧义。或者二者结合起来,将次要词汇缩减为二字词汇,主要词汇前面添加虚词。这样该研究所的名称就变成了:“上海应用数学和力学的研究所”。   当然如果无所谓名称问题,则可以将这样的名称当作是不可分割的词汇,利用拼音或英文开头字母进行缩写,禁止对其进行分割。
3699 次阅读|2 个评论
《科技汉语语法纲要》——4 汉语分词方法
gzchengzhi 2011-5-7 20:23
4 汉语分词方法   如何对汉字进行分词,一直以来都是令人困惑的事情。在一个句子中,所有的汉字都是连接在一起的。这不同于拼音那样简单采用空格就可以进行词汇的分割。比如“宇宙大爆炸学说”,用拼音来进行表述就可以拼写成:yuzhou da baozha xueshuo。 其中“宇宙”为一个二字词汇;“大”为虚词;“爆炸”为一个二字词汇;“学说”为一个二字词汇。如果用如同拼音那样的方法,用空格来对词进行分割,则可以表述为:“宇宙 大 爆炸 学说”。虽然这种表述方式好像是清楚了,但是这种表述方式并不会如同拼音文字那样明了,反而让人感到阅读起来有些费劲。这一例子说明,作为象形文字,词组的组合方式有着不同于拼音文字的特点。   常用的汉字大约3000个,如果两个两个汉字进行组合,则可以获得九百万种组合。看起来数量挺多,但由于其中存在很多无意义的词汇,要进行准确的意义表达,还需要更多的组合。   如果增加三字词汇,即一个词汇由三个汉字组成,这样可以使组合数量达到二百七十亿。这么多的词汇组合数量就足够大了,可以满足较准确表达意义的需求。   但是如果采用了奇数个汉字来进行组合获得词汇,则容易给词汇分割造成不便,容易产生歧义。因此在包含了三字词汇的句子中,应采用适当的方法来帮助进行词汇的分割。   另外如有可能,构成新词汇的时候,尽量采用偶数个汉字来完成。其中二字词汇由两个汉字组成,四字词汇则由两个二字词汇组成。其他以此类推。 4.1 汉语词汇组合的模型   4.1.1 条件概率   从已有的研究成果来看,用条件概率的方法来处理汉语句子和分词问题是比较有效的。   例如,假设ABCDE五个英文字母对应五个汉字字符,且各汉字之间没有意义上的联系,则一个句子可以表示为:   S=ABCDE   整个句子被表达出来的概率为:P(S)   这里用P(AB)表示在词汇AB被表达出来的概率。P(A)表示汉字A被表达出来的概率。P(C|AB)为条件概率,即在AB被表达出来以后,C被表达出来的概率。   P(S)=P(ABCDE)…………………………………………………………(4-1-1)   用条件概率表示出来为:   P(ABCDE)=P(A)P(B|A)P(C|AB)P(D|ABC)P(E|ABCD) ……………………(4-1-2)   但是由于在一个句子中存在词组,这个关系又可以被简化。假如其中AB、CD分别是二字词汇,而C是虚词,则该句子被表达出来的概率为:   P 1 (S)=P{ (DE)}     =P{ (DE) }=P{ ]     = P{(DE)| } ………………………………………………………(4-1-3)   或者另一种组合的可能,即:   P 2 (S)= P{ (AB) }     =P{ |(AB)}     = P{ |(AB)}   由于句子的概率是非常小的一个数字,利用对数的方式进行处理,这样就得到所谓的“汉字熵”(注:由于三字词汇容易引起混淆,建议将这个词改为:汉字信熵),这种汉字熵的大小反映出了句子所出现的概率的高低。汉字熵越小意味着该句子出现的概率越高,反之则越低。一个句子的汉字熵的定义可以使用多种形式,这里简单采用对数形式:   H(S)=- logP(S) ………………………………………………………………(4-1-4)   另外,这里所说某个汉字或词汇被“表达出来”,其中涉及到人类思维过程。这一过程是复杂的。它不能够等同于在计算机的语料库中随机选择出某个汉字或词汇的概率。   例如,对于“基因可以控制性状”这句话,假设在一个计算机的语料库中选择“基”字的概率为P 1 ,在“基”子出现以后,选择“因”字的概率为P 2 ,则选择“基因”一词的概率就是P 1 P 2 。   不过人类思维过程可以根据句子的整体含义来提高“基因”一词被表达出来的概率。在这一句话中,由于后面的“控制性状”涉及到生命科学的课题,则出现“基”字以后,表达出“因”字的概率就会有很大的提高。由于“基因”也可以被理解为“基础因子”,说明“基”和“因”之间存在较强的关联性,这将显著提高“基因”一词被表达出来的概率。而至于“基础因子”为何会被当作是一个容易表达出来的词汇,则涉及到思维过程中的某种逻辑关系。   当然一个词汇或句子被表达出来的概率,还跟一个人所从事的专业有关。比如一个没有任何专业背景的人士要表达出“基因”这一词汇,概率显然要比从事生命科学专业的人士小很多。    4.1.2 词汇的判断   通过最小熵的方法来判断一个句子中的词汇,是对一个汉字句子进行分词的好方法。    命题:如果一个句子可以被完整地划分成若干个词汇的组合,则句子的汉字熵将为最小。   则如果公式(4-1-3)中的概率P 1 (S)是最大的,则AB和DE为两个词汇。   又比如“宇宙大爆炸”,该段话被表达出来的最大概率为:   P(宇宙大爆炸)=P{ ]}    4.1.3 多于两个汉字的词汇   在汉语句子中,经常会出现多于两个汉字的词汇。这些词汇一部分可以看作是多个二字词汇和单个汉字的组合,习惯上将这些词汇称作“词组”。另一些则是不可分割的。   1 .词组和成语   如果为词组,则这些词汇可以被继续分割下去,最终获得多个二字词汇和汉字的组合。   其中比较简单的多字词汇由偶数个汉字组成,它们都可以被继续分割下去直到出现二字词汇为止。   例如“变分微扰理论”就是这样的词汇。它可以被继续分割下去。它被表达出来的概率的计算公式为:   P(变分微扰理论)=P{ (变分) }   这一类词汇中占比比较大的主要为成语。比如“守株待兔”、“九牛一毛”等。在科技汉语中,汉语成语的使用机会较少。   而由奇数个汉字组成的可分割词汇主要集中于三字词汇。比如“柜员机”、“开发商”、“地铁站”、“慢吞吞”、“急冲冲”等。   2 .不可分割的多字词汇   这一类词汇一部分集中在人的姓名等方面。比如维吾尔族名字“巴哈尔古丽”由五个汉字组成。   另外这类词还主要集中于部分药品名称方面。比如“阿司匹林”等。这些词汇也是不可分割的。   不可分割的词汇被表达出来的概率为:   P(巴哈尔古丽)=P   这类词汇必须保持完整性。除非是单个汉字,任何分割部分被单独表达出来的概率都是非常低的。但是作为一个整体被表达出来的概率就会跃升。     4.2 对句子进行词汇分割   按照上述模型,对于一个完整的句子都可以采用这种最大概率的方法来进行分割,并获得相应的词汇。   由于对一个自然语言句子进行词汇分割涉及到语义问题,且词汇的分割还涉及到该句子的意义以及不同人士的认识能力。如何进行词汇分割就涉及到一个标准问题。以下给出常用的几种无歧义的分词的方法。    4.2.1 自然分割   从4.1.3部分的分析可以看出,除了不可分割的多字词汇以外,所有的汉语词汇都是可以最终被分割成二字词汇或者二字词汇和单个汉字的组合的。   例如这句话:在粒子物理理论中,电磁相互作用和弱相互作用是可以采用弱电相互作用理论来进行统一的。   采用自然分割的方法,分割出来的句子为:   { 在 { (理论) } 中 },{ { { (电磁) } 和 { 弱 } } { 是 (可以) { (采用) { (弱电) { (理论) } } } 来 (进行) (统一) 的 } }。   那些只有二字词汇进行组合的词汇是可以达到非常准确的自然分词的要求的。而可分割的四字词汇、六字词汇等,则又可以被分割成多个二字词汇的组合。   比如:“在紧急情况时按下呼叫按钮”   去掉虚词后,变成:“紧急情况按下呼叫按钮”   二者的含义是一样的。两个句子都可以被正确分词解读。后一句话的词汇的划分方法为:   “{ { (按下) } }”   但如果句子中出现三字词汇,则可能会出现歧义。   比如:   “开发商店面向群众开放”   如果采用自然分割的方法,则该句话可以这样来进行分词:“{ { 开放}}”   如果考虑其中包含了一个三字词汇“开发商”,则该句话也可以这样来进行分割:   “{{ 向(群众)}开放}”   可以做简单的规定来避免这样的歧义。即:   1)如果句子中所有可分割词汇都是偶数个字数的词汇时,可以用,也可以不用虚词来进行词汇的分割。   2)如果其中包含了单个汉字词汇或超过三个字以上的可分割词汇时,则必须在该词汇的或前面或后面增加虚词的方式来进行词汇的分割。   比如上述句子中,如果要表达的句子包含的了三字词汇,则可以这样来添加虚词:   “开发商的店面向群众开放”   而其中中间没有插入虚词的“店面”则被自然分割为一个词汇。    4.2.2 通过虚词来进行分割   这些虚词包括:这、之、其、于、以、而、则、乃、若、且、为、是、此、何、虽然、然而、然则、最、再、才、都、就、很、全、把、被、比、从、跟、同、和、因为、因此、了、的、地、得等等。   例如“标准问题”可以更改为“标准的问题”。这样“标准”和“问题”两个词汇就被分割开来了。   又如:“这就是大自然的搬运工”。其中“是”和“的”两个虚词将“大自然”和“搬运工”这两个三字词汇分割开来。   这种方式还可以用来表示一个汉语句子的时态。    4.2.3 空格分割   如同英语当中那样,汉语也可以采用空格来进行词汇的分割。这种方式可以用在音译的外来包含三个以上汉字的词汇的分割。另外我国维吾尔族的人名也可以采用这种方式。   比如:“忙碌了一天的阿娜丝塔西夏终于可以坐车回家了”可以书写为:“忙碌了一天的 阿娜丝塔西夏 终于可以坐车回家了”。    4.2.4 利用英语或拼音进行分割   由于英语以及拼音符号在表述方式上不同于汉语字符,利用英语拼写或汉语拼音来书写某些特定的词汇,也可以起到自然分割句子的作用。   而能够做到这一点,还有一个原因在于,在我国,义务教育阶段英语已经成为了一门必修课。对于从事科技的人士而言,掌握英语更是成为了一项基本能力。因此在汉语句子中适当位置直接使用汉语拼音甚至是英语单词,并不会影响交流的效果。   当然为了避免汉语本身的语法体系规范受到影响,可以规定这些英语和拼音词汇的使用只限定在三字词汇以上的外来词上。主要应用于人名和英文缩写。   英文缩写,如:MP3、DVD等   姓名,如:Bill Clinton   用在一个句子中,则如:“忙碌了一天的Anastasia终于可以坐车回家了”   另外西药的药品名称大部分都采用音译的方式,不过因为这些药品名称在构词方面有非常规范的要求,所以可以结合汉语的特点进行音译。为了能够在句子中对这些药品名称进行自然分割,建议音译过来的药品名称应以二字词汇为单位进行翻译,最后翻译出来的中文名称尽可能保持偶数个汉字。
3969 次阅读|0 个评论
《科技汉语语法纲要》——前言
热度 4 gzchengzhi 2011-5-3 20:01
  一直以来对汉语能否精确地表达意义存在疑问,这种疑问源于汉语缺乏比较严密的语法。而至于古代汉语那样连标点符号都没有,则构成了更大的问题。另一方面,随着科学技术的不断发展,采用汉语来书写科技论文的人士越来越多,对于科技汉语应该使用什么样的语法来做一个规范,成为了非常迫切的任务。正是基于这样的考虑,我感觉放下目前繁重的其他工作,专心探讨一下科技汉语语法问题,是一件非常有意义的事情。   精确的语法是人类文明发展的重大成果。相信诸如英语这样的语言在产生之初也是没有语法要求的,只是为适应人与人之间更加准确的交流需要,才产生了越来越严密的语法。严密语法的出现,则又为语言能够更准确地表达意义提供了保证。汉语也可以走同样的道路。   当然这并不是说我们需要去改变汉语。事实上,不需要严密的语法也反映出了汉语的重要特点。中国几千年的文化,其中有一部分都是跟汉语的这种表达的模糊性有关系的。然而在表达科技知识的时候,这种模糊性则成为了一个问题。比如科学网知名博主曹广福教授的博文“小学数学题有多难”反映的就是这个问题。虽然从现有的知识来分析,已经可以判断博文中所涉及题目在表述方面存在问题,但却并非像英语当中那样明显,以至于在科学网这样云集了知识层次比较高的人才的场所引起了广泛的争论。而更严重的问题则是,很多从事科研工作的人士对此问题认识不足。比如在评阅学生论文的时候,很多人觉得学生论文中存在各种语法错误是“小问题”、“没关系的”。这说明至少在科技领域,汉语语法需要进行规范已经成为了一项迫切的工作。   有关汉语语法方面的专著已经有很多了,比较知名的包括吕淑湘的《汉语语法分析问题》等。然而纵观这些汉语语法的专著和教材,其中存在的问题在于没有面向科技人士。   英语已经有了非常严密的语法,且相关的著作也非常丰富,英语目前也是公认的科技论文写作语言。因此,在确定科技汉语语法的时候可以广泛借鉴英语语法的成果,再结合汉语的特点进行适当补充。   其中第一类语法内容是可以直接从英语中引进的。比如英语句子的构成、词性等。第二类则是可以变通一下进行引进的。比如英语的时态、动词的形式等。因为在汉语中无法对相应的词语进行形式上的改变,所以有必要通过在句子中增加冗余词语来实现这种时态和形式的变化。第三类则是汉语所独有的。比如汉语的构词方法。在英语中,单词一般都具有独立的形式,而汉语中的词组则是由其他的字或词构成的。面对这些问题,则不必拘泥于英语语法,结合现代汉语研究的成果,对这些独特的应用进行恰当的语法上的规定。   本书内容安排如下:   第一部分 科技汉语的构词     1 汉字概述     2 科技汉语词汇的构成     3 词汇的性质     4 汉语分词方法   第二部分 科技汉语句子的结构     1 语法上完整句子的界定     2 科技汉语常用的句型结构   第三部分 科技汉语句子的时态     1 现在时     2 过去时     3 将来时     4 进行时     5 完成时   第四部分 计算机技术在科技汉语语法中的应用   最后,我也感觉到,随着计算机和网络技术的发展,在探讨科技汉语语法的时候,引入计算机和计算机网络技术可以让科技汉语语法的探讨站在一个更高的层次上来进行。而首先采用网络的方式来发表,也是基于这种方式能够以更快的速度将自己的想法传播出去,并及时获得各专业学者的批评意见,实时进行修改。 程智 2011.5 广州
5362 次阅读|20 个评论
科技汉语语法的改革建议
gzchengzhi 2011-4-29 11:23
  曹广福老师的博文“ 小学数学题有多难? ”引起了大家的关注。这道题目倒不难,但经过博友们的讨论以后,焦点逐渐集中于该题目的表述方式是否存在歧义的问题上。当然这正是从一个侧面反映出了同英语相比,科技汉语存在的问题所在。   很简单的对比,就是如果采用英语来表述该道题目,就不会存在这么大的争论了。   中文原题为:“甲、乙两人沿铁路线相向而行,速度相同.一列火车从甲身边开过用了6秒,4分后火车又从乙身边开过用了5秒,那么从火车遇到乙开始,再过多少分甲、乙两人相遇?”   这里存在争议的地方在于该火车是开过甲的身边以后,再经过4分钟到达乙的身边?还是火车到达甲处在经过4分钟后到达乙处。   当然经过我从语法和逻辑上来分析,我认为其含义应该是前者。但既然在科学网上这么多专业人士中引起了争议,至少说明对于一个汉语句子,不同的人是存在不同的理解的。   翻译成英文以后,其句子就变成了这样:   Two persons A and B are moving in opposite direction at same velocity. A train takes 6 seconds to pass A completely, and then it takes 5 seconds to pass B completely after 4 minutes. How long will A and B met after the train met B?   从英文的翻译句子来看,在英文中,句子的含义是非常明确的,就是火车先花了6秒钟时间经过A,然后,再花4分钟的时间到达B,并且花了5秒钟的时间经过B。之所以能够这么明确,在于其中and then的用法。如果没有这一用法,则这将成为两个句子。如果再配合英语的时态等用法,则可以更加严密地表述这一问题。   而中文中加不加“然后”一词,都可以成为一个句子,也没有时态区别。这就是引起歧义的根源。   基于这样的考虑,我这里提出建议,应该按照英文的语法重新对中文科技语法进行规范。   第一,一个句子应该从语法上明确如何才算完整。比如“一列火车从甲身边开过用了6秒,4分后火车又从乙身边开过用了5秒”这样的表述方式就应该算错误。正确的表述应该为:“一列火车从甲身边开过用了6秒,然后4分后火车又从乙身边开过用了5秒”。这样虽然是罗嗦了一些,缺少了汉语精炼的要求,但考虑到在科技汉语中,不需要追求文字的优美,这种用法应该允许存在。如果不加“然后”一词,则可将其分成两句话,即:“一列火车从甲身边开过用了6秒。4分后火车又从乙身边开过用了5秒”。   第二,由于汉语词汇没有时态变化,可以通过添加:过去、现在、已经、将来这样的词语进行界定。比如“自从1997年以来,我就住在北京了”,这样的用法在科技汉语中应该界定为不符合语法要求,必须将其改正为:“自从1997年以来,我就已经住在北京了”。又如错误用法:“如果明天不下雨,我们就去钓鱼”,正确用法应该是:“如果明天不下雨,我们将去钓鱼”。因为“就去钓鱼”的含义不明确,不一定表示将来时,也可以表示一般现在时。比如可以说“我们现在就去钓鱼”。   第三,取消量词这种多余的用法。比如“一个人”和“一辆车”在科学上没有多少区别。你可以说“一人”,“一车”,这完全可以表达清楚自己的意思。另外滥用量词不利于创新。比如新的技术出现了,比如ipad,究竟应该是称之为一台ipad,还是应该称之为一片ipad,或一块ipad,这是容易引起争议的问题。因此即使因为习惯愿意保留已有的量词,至少以后的量词使用应该统一。比如统一为“个”。这样ipad出现以后,我们只需要称之为“一个ipad”就可以了。   第四,建议增加词语分割符号,比如用“|”来进行分割。这样可以解决不同“断词”方法引起的歧义。    由于这么多的要求很多人一下子难以适应,可以开发的相应科技论文校对软件,在完成论文以后,专门检查这些语法要求。
4594 次阅读|0 个评论
镜某也要“革命”了,革师姐的命了。
liwei999 2011-1-4 09:34
立委按:镜子作为语言学的门外汉和哲学家,要挑战专业人士师姐,实际上也是对立委的挑战(不论书上如何讲,镜某对汉语语法的理解是如此。如果国人没有这样的理解,那就要文革了)。本来是应该应对的,词类词性、语言逻辑都是我琢磨了一辈子的问题了,哪里容哲学家来踢场子。可气的是,哲学家的话,用的是另一套符号系统和参照系,而且虽然幼稚可笑而且误导,也不是全无道理。真要有理有节批判镜子,还是需要找对下口的地方,运用相同的符号系统。算了,这次且放过。现在体会到,专业人士遇到哲学家,真有些秀才遇到兵,有理讲不清的感觉,呵呵。说到此,有些开始同情被镜子横扫过的专家们了。 镜某也要革命了,革师姐的命了。 (157421) Posted by: mirror Date: May 30, 2008 07:41PM Shijie: 明明白白:形容词;问题:名词;回答:动词;的、地:助词。 如果说这种语法是师姐科班学来的话,再来个文化革命的理由还是相当充分的。 如何断句明明白白的问题明明白白地回答?师姐给出了个分析。至少是道理不足,或者是说分类方法不妥。明明白白的/问题,明明白白地/回答是个第一近似分析。的、地、得的用法是近代汉语中才确立的。因此单分出来,认为是明明白白/的/问题不妥。应该考虑/明明白白的/是形容词,的的助词作用不是要一个词的分类名目,而是要作到助词--把明明白白这样一个并不明白的、不很确定的词助成了形容词。 与助学金的再助了学之后消失了一样,的即便是助词,与明明白白结合后就消失了本体,助产了明确的明明白白的这样一个形容词了。 不论书上如何讲,镜某对汉语语法的理解是如此。如果国人没有这样的理解,那就要文革了。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 又及: 右派是打出来的、划出来的,并非天然。 (157432) Posted by: mirror Date: May 30, 2008 08:04PM 同理,汉语的词性分类也是打出来的、划出来的。的、地、得就是就是划成分通知书了。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 相当令人震惊的语言学问题:大众错了,常识还能对么? (159033) Posted by: 笑笑 Date: June 04, 2008 09:46PM 寇前候补的指导责任问题很严重哈。。。 引用: mirror 也许是大众的选择错了,这也是常发生的事情。但是,所谓的科学说也同样的不可靠。这是镜某要主张的常识了。 三十年河东,四十年河西。可谓常识也。 (159036) Posted by: mirror Date: June 04, 2008 09:50PM 纳粹的登场,美国人的禁酒,就是大众选择错误的事例了。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 Mammography不知如何翻译的。称为馒馍图像应该是很不错了。-- mirror 更年、忧郁不是到了一定的年纪才会有。 (158607) Posted by: mirror Date: June 03, 2008 07:44PM 随时可能发生。客气是个策略,很多问题可以在客气当中得到解决。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 1)整本《西游记》所述。 (157424) Posted by: mirror Date: May 30, 2008 07:45PM 2)不必灌输,点滴即可。 3)既然是灌输,成功灌输了的,就是应该的。 -------- 就是论事儿,就事儿论是,就事儿论事儿。 因为是神话,中国的神话。 (157439) Posted by: mirror Date: May 30, 2008 08:17PM 都到了神话的份上了,还用解释么?比如悟空为什么要系个虎皮围裙?这个答案在中国文化里有解释。 书中的一招一式都是经过设计的,依照着中国文化,没有丝毫的偏差。据考证,也不是一个人写的,是一个班子人马按图纸设计的故事。 -------- 就是论事儿,就事儿论是,就事儿论事儿。
个人分类: 镜子大全|2473 次阅读|0 个评论
学习漫谈(11):学一点汉语语法
热度 3 sqdai 2010-10-22 07:22
我认为,理工科学子应该学一点汉语语法。近年来,经常审读年青人写的科技论文和项目申请书,总体来说,他们的语文水平实在令人不敢恭维,有些作品简直难以读懂。我问过一些青年朋友:有没有系统学过汉语语法?答案多是否定的。这种现状亟待改变。 记得 1955 年我上高中时,语文课分成文学和汉语两门,后一门课中主要学习汉语语法(包括古代汉语语法和现代汉语语法),教材的编写者是时任中科院语言研究所所长的 吕叔湘 先生。我觉得,从这门课学来的知识一辈子管用:一是懂得了汉语的构成规律和语法特点,遣词用句时有了客观标准;二是对学习外语语法很有帮助,特别是可以有意识地比较汉语与外语,有利于更快地掌握外语。不知何时开始,这种语文分课的做法戛然而止了,汉语语法成了语文课上不那么系统地传授的知识,很是遗憾。 我们知道,汉语中有着各种各样的结构,有人指出,共有十一种之多。例如,有偏正结构和动宾结构;偏正结构又可分成定中偏正结构和状中偏正结构,的是定中偏正结构,地是状中偏正结构。在叙说一件事的时候,应灵活运用不同的结构。对于外语的语言结构,也可做类似的分类。 根据我阅读中英文科技论文的经验,英语写作者偏爱于偏正结构,例如,动词性名词+ of 之类,而中文写作时,更多地采用动宾结构。我们常说,研究问题,英美人士喜欢说,问题的研究。如果问题用词较多,中文中用定中偏正结构,就有头重脚轻的感觉。 由于我国有不少科技著作是译著,科技工作者经常接触带有欧式色彩的著述,就不知不觉地受了影响,欧式语言风行一时,这也是读国人的科技论文常常觉得别扭的原因之一。 鉴于上述,为了更好地写作科技论文,建议朋友们学一点基本的汉语语法知识。当然,我们不想成为(一般也不可能成为)汉语语言专家,学一点 ABC 就行了,但必须有一定的系统性。老师不教,我们只能靠自学,找一本浅近一点的汉语语法书来读读。经网上搜索发现,似乎可读如下参考书: 刘月华:《实用现代汉语语法》; 黄伯荣、廖序东:《现代汉语》; 胡裕树:《现代汉语》。 希望文科博友们对此提出更好的建议。 写于 2010 年 5 月 26 日晨 http://blog.lehu.shu.edu.cn/sqdai/A217638.html
个人分类: 寄语学子|8886 次阅读|14 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 03:22

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部