科学网

 找回密码
  注册

tag 标签: 句式

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

【新智元笔记:汉语 parsing 涉及重叠的鸡零狗碎及其他】
热度 2 liwei999 2016-3-20 01:20
我: 条件反射了,一看到 ”伟大的中文“ 或 ”精妙的中文“ 的标题,就忍不住想 parse parse 看看(重叠reduplication)。 我: 虽然是对联似的歌词,结构其实与现汉一样蛮清晰的 白: “有”应该彻底做定语 我: why??这不是典型的 有+宾+宾补 句型么 白: “有NP VP”和“一个NP VP”逻辑上是同构的。有不当动词用,更接近本质。“没”单用也是一样。 我: 明白你说的意思,不过这事儿很微妙,两说着 我对于这类现象,也有那种处理,目前条件是要求 “有” 在句首。句首的“有”,虚化得厉害,其他的“有”真地不好说,因为前面可能再出现主语或其他的谓语连带成分,不能就把它一杆子打下去。 白: 当然不是所有。 我: 句首的“有”:“有个教授下午来”;“有教授下午来” 白: “我猜有人会紧张了”。 这不是问题,裸量词也是定语,相当于定语叠加了。“有”和“个”分别被“教授”吸收。一个表存在,一个定数量。 我: 语言学上是不定(indefinite),相当于英语的 some 或不定冠词 a 白: 不出现“个”,就是some;出现“个”,就是a。“拿个(根)鸡毛当令箭”,裸量词也是一样作定语。在这个意义上,数词就是状语。 我: 个 = 一个,省略了“一” 如果是修饰宾语N的话。但主语N的量词则不能省“一”。可以没有数量,但一旦有量,必须有数。量却可以省。“一妹子来看你”。量一般不能省,偶尔可。 白: 有个名句“把个特务跑了”,逻辑主语,虽是宾格。“给我一枪吧……” 我: 一枪是动量结构做补语,不是带有名量结构的“一把枪” NP 做宾语。 白: 俩=两个;仨=三个,一个,没有俩仨那样的字对应 我: 方言性质,我们江南就没有“俩”和“仨”。 白: 一+名词,北京口语这么说不少,普通话不是 梁: @wei 你这个 parser 很厉害! 我: @梁 谢谢,来之虽晚,却之不恭。kidding ... 还没有加 ontology 的核心呢(正在加),只可算爬到了半山腰,但山巅已然可见。 再过三个月半年看,可以不可以感受一次会当凌绝顶的VR(虚拟现实)。 我:这个句型算什么状语?v 是重叠词或短语(重叠以前做过的句型有: x 是 x , y 是 y): v 就 v,(反正)。。。 不 v 就 不 v “走就走,谁稀罕你似的” “不要就不要,有啥了不得” “没做就没做,你能拿我怎么样?” “瞎了眼就瞎了眼,反正是我倒霉,关你什么事” “坏就坏,我不在乎” “有钱就有钱,反正我也高攀不上” “不关机就不关机, 反正不上飞机老子一辈子不关机!!” “罚站两小时就罚站两小时,我扛得住” 以前说过,重叠(reduplication)现象在汉语不仅限于造合成词(abab,aabb,abb之类),而且也常用作句法手段在各种句式里。 “要我走就要我走,我早就不想呆了” 该句式呼应的小词有:反正 、大不了、早就、不在乎、稀罕、最多、顶多、扛得住、顶得住、受得了。。。 很像让步状语,但让步状语( 即使......)和条件状语(倘若......),都是虚拟,而这个状语却是针对 “已然”(已经发生的动作)。一般是负面的、有害的行为,主句说的是不畏惧,自己给自己打气。这个表达法有点意思。好像这类状语还没个名字?还有其他的表达方式么? 还有一个句式: 爱 x x “爱谁谁” “爱咋咋” “爱走走 不留你” “爱微信微信 爱非死不可非死不可” “爱阴谋阴谋 爱阳谋阳谋 谁怕谁” “爱堕落堕落 我爱莫能助” 可以加“就”,或者说上述句式省略了“就”: “爱吃鳕鱼就吃鳕鱼,反正不是我的选择。” “爱点豆酥鳕鱼就豆酥鳕鱼 我没有意见 领导说。” “你爱点鳕鱼就点鳕鱼” 意思是,“你如果想点鳕鱼 你就点” 白: 这不应是句法管的事情,只不过重复模式可以强化提示某种复句标签而已,就算啥都不提示,不是还有Next兜底么。 我: 不管如何 parse? 结果都成了: vp NEXT vp NEXT vp ...... 白: 不上规则主体,最多当成trigger…… 我: 谁 VP1 谁 VP2 ,“谁”的重叠句式,对应于英语 whoever,或者 those who VP1 will VP2 “谁出问题谁擦屁股。” 类似的句型还有: 什么 AP 就 V 什么 “什么热就学什么” == whatever is hot, go for it. 也可以是主句主语: 什么 AP 什么就 VP “什么热什么就招财” 类似的还有疑问词“哪个”和“怎么”: “哪个漂亮就找哪个” “哪个漂亮哪个就一路顺风” “哪个愚蠢哪个就完蛋” “怎么方便怎么来” “怎么”这个句式的扩展性似乎弱一些。 汉语口语,这些鸡零狗碎的句式还真不少。这些玩意儿 pattern matching 最拿手,就是扩展的 ngram,gram 是动态句素,不仅仅是静态的 token(词)。匹配不仅仅是 fsa formalism,而是带有 unification 的 fsa++ 机制。 统计模型怎么对付这些个玩意呢?譬如 smt(统计型机器翻译)怎么翻译?“爱咋咋”好办,它不扩展,应该从语料中学出来的,到了英语就是 whatever。“爱吃鳕鱼吃鳕鱼”,smt 是不是就傻了?试一下: smt 任重道远涅!(连“爱咋咋”都没对,往好里揣度是训练数据集可能压根就没有口语或社会媒体的双语材料。) 才意识到我前句的歧义:“不管如何parse” (1)(If) not handling (this pattern) how (can we) parse (it?) (2)No matter how to parse it 汉语口语的条件状语经常省略小词“如果”,真心可恨。这是铁心要逼我们上fsa+++梁山的阵势。 【相关】 《新智元笔记:汉语parsing以及所面对的汉语的意合特点》 【新智元:中文 parsing 在希望的田野上】 【征文参赛:美梦成真】 【立委科普:语法结构树之美(之二)】 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|5119 次阅读|2 个评论
英文论文词句的积累
whcuser 2010-10-18 11:58
用excel文件。按打头的字母,分作26个sheet,便于排序和查找。 另一种办法是存入26个txt文件中。
个人分类: 科研|2891 次阅读|3 个评论
“被××”句式 如何翻译?
phd9992000 2010-2-10 14:59
2009年,时间充分发挥了这片神奇土地上人们的文字创造力和想象力。例如: 2009年风行华夏大地的被句式,其典型形式是用于语法上不允许使用被的场合,如被自杀、被自愿、被就业以及被小康等等。一个事关公民权利、应该由当事人自己做主的行动,常常被人代劳。当事的公民身不由己,不但未能行使理应享有的法定权利,还要听任强势者的话语强暴,连自我声辩的机会也得不到,如此窘境,除了被句式之外,很难找到更为传神的表述。在这层意义上,被成为年度汉字一方面说明了权力的横蛮和强势者的滥权,另一方面也说明民众对权力和强势的质疑和责难。( 以上文字引自 http://www.sdnews.com.cn//news/2010/2/9/866314.html ) 还是英、美鬼子聪明,提前就造出了被动语态,以便我们使用。不过,这些被句式该如何翻译,才能够做到信、达、雅呢? 自己试了一下。例如被代表可以翻译成2种形式,分词和不定式:having been represented; to be represented,而后根据不同语境选用。此外还有其它一些,例如被自杀、被自愿、被就业、被小康等,可如法炮制。 以前看《中国日报》,经常能够看到一些和谐类文章,以及具有中国特色的词语的英译,来教化内外夷狄。现在因为很少和鬼子接触,英语这劳什子也随着啤酒、海风和蛤蜊穿肠而过,都忘记了。不过被句式应当属于河蟹类文章,上面有没有还真不一定。因为很久没有看《中国日报》,不知道这样翻译对不对;这里姑且算扔砖,欢迎高人砸玉。
2084 次阅读|0 个评论
医学期刊英文标题如何做到“信、达、雅”之二
crter 2010-1-6 13:39
2. 标题的制作类型中的语法句式变换 语法的结构就像一个万花筒,其中蕴藏着千百种变化、无穷的奇妙组合。策划标题如果把握好语法的应用,会给标题带来无穷的活力,给读者一个又一个惊喜。 在医学期刊中常见的标题类型有:单纯名词短语型,并列名词短语型,不定式短语型,分词短语型,主副标题型,陈述句型,疑问句型。 ⑴ 单纯名词短语型标题 通常由一个名词主干加上前位、后位定语或两者都用而构成。医学期刊标题多采用此类写法。 如: Contemporary management of chronic obstructive pulmonary disease: Scientific review ( JAMA. 2003;290:2301-12 ) 慢性阻塞性肺疾病的现代治疗 : 科学综述 ⑵ 并列名词短语型标题 主要在表达两个或两个以上同等重要的内容时使用,通常由两个或两个以上的名词短语构成。 如: Behavior therapy and sibutramine for the treatment of adolescent obesity : A randomized controlled trial (JAMA. 2003;289:1805-12) 行为疗法和西布曲明治疗青少年肥胖:随机对照研究 Normal serum aminotransferase concentration and risk of mortality from liver diseases: prospective cohort study(BMJ. 2004;328:983-6) 正常血清转氨酶浓度与肝病死亡率危险性的关系:前瞻性队列研究 这种类型的标题中我们常常会用到 and 和 versus ,前者强调关系 ( Relationship ) 后者强调比较 ( Comparison) 。比如上面所举的 Normal serum aminotransferase concentration and risk of mortality from liver diseases: prospective cohort study 也可以表示为 Relationship between normal serum aminotransferase concentration and risk of mortality from liver diseases 。而下面这个标题也可转换成 Comparison of and 形式。 如: Early intensive vs a delayed conservative simvastatin strategy in patients with acute coronary syndromes: Phase Z of the A to Z trial (JAMA. 2004;292:1307-16) 辛伐他汀早期强化治疗方案与迟发保守方案治疗急性冠脉综合征的比较: A to Z 试验之 Z 段研究 还有 plus 可替代 combined with 表示 A 和 B 的联合作用。 如: Exercise plus behavioral management in patients with Alzheimer disease: A randomized controlled trial (JAMA. 2003;290:2015) 阿尔茨海默病患者运动加行为疗法:随机对照研究 ⑶ 不定式短语型标题 此种标题通常强调如何做。 如: A strategy to reduce cardiovascular disease by more than 80% (BMJ.2003;326:1419-23) 减少 80 %以上心血管疾病的治疗策略 ⑷ 分词短语型标题 这种标题强调动作,一般由现在分词+宾语+介词短语构成。 如: Improving management of obesity in primary care: cluster randomised trial (BMJ.2003;327:1085) 加强对肥胖的初级预防:群体随机试验 ⑸ 句子型标题 常见的有陈述句型和疑问句型。陈述句型标题 语气更强烈,可以给读者留下更加深刻的印象,但因为它有时语气过于强烈会给人比较武断的印象, 通常也显得不够简洁, 所以不少杂志限制陈述句型标题。因此,在使用时应当谨慎 。但有时标题不仅强调动作,而且强调动作的发出者时,我们就可以用一个完整的句子表示。 如: Cognitive behavior therapy affects brain activity differently from antidepressants (BMJ.2004;328:69) 认知行为治疗对大脑活动的影响有别于抗抑郁药 Carvedilol was more effective than metoprolol tartrate for lowering mortality in chronic heart failure (Evidence Based Medicine. 2003;10:14) 卡维地洛比酒石酸美托洛尔更能有效降低慢性心力衰竭病人的死亡率 前一句用的是一般现在时,表示这是作者的研究结论;后一句用的是过去时,表示这是研究的结果。 采用疑问句做标题是一种不错的表现形式,尤其是在评述类文章的标题中,可使标题显得生动灵活,更易引起读者的兴趣。 如: Why do doctors use treatments that do not work? For many reasons - including their inability to stand idle and do nothing? (BMJ.2004;328:474-5) 为什么医生使用无效的治疗措施?有许多原因包括医生不能什么都不做? ⑹ 主副标题型标题 在英文医学期刊中使用较多,一般由破折号、冒号或副标题另起一行。副标题一般是为了突出标题的主要内容,使之更加醒目。正副标题之间多为同位关系,或是后部分对前部分进行补充解释、细节补充、背景交代、分层说明等等。 如: Aspirin, ibuprofen, and mortality after myocardial infarction: retrospective cohort study (BMJ.2003;327:1322-3) 阿司匹林、布洛芬与心肌梗死后死亡率:回顾性队列分析 Nonalcoholic fatty liver disease: An underrecognized cause of cryptogenic cirrhosis (JAMA.2003;289:3000-4) 非酒精性脂肪肝病:一个未被认识的隐原性肝硬变的病因 本文中用到的标题范例多为带副标题型,由此可见,与大部分中文期刊相比,主副标题型标题被更多的英文期刊及其读者所接受。 其实,我们大多数的文章标题都是混合型的标题,包含的两到三种不同类型的标题。由于国外一些知名医学期刊的文体多种多样,如《 BMJ 》除了有 Original Contributions (原著) 和 Reviews (综述)外,还有 Preliminary Communications (短讯), Brief Reports ( 报道 ) , Editorial (述评)等多种文体。所以英文期刊的标题逐渐走向多样化、多元化,语法、句式在标题中的应用更加灵活多变。 如: Diet first, then medication for hypercholesterolemia (JAMA. 2003;290:531-3) 高胆固醇血症的治疗:饮食先于药物 Combined hormone therapy and breast cancer : A single-edged sword (JAMA. 2003;289:3304-6) 联合激素替代治疗与乳腺癌:一把单刃刀 前一个例子本应是最基本的名词型标题( Diet and medication for hypercholesterolemia ), first 与 then 两个时间副词的使用突显了高胆固醇血症治疗的先后顺序饮食先于药物 , 条理清晰,更易被读者接受。后一个标题使用了比喻的手法,变平淡为生动,化艰深为浅显,形象的描绘出联合激素替代疗法治疗乳腺癌的副作用,使读者眼前一亮,增加了阅读的兴趣。 一个小小的标题,看起来不起眼,却是文章必不可缺的角色,它是文章开始的报幕员,也是文章终结的落幕人,角色虽小却作用千钧。虽然,医学期刊的专业性和学术性,使其文章标题并不能成为流传一时的时尚用语,但好的标题是优秀期刊的标志这一点无可厚非。一个好的医学标题不仅要抓住小同行的视线,更要能引起大同行的继续阅读的兴趣。正如《鲁滨逊漂流记》作者说的,我的写作原则,是假设对 500 个不同职业的群众讲话,而每一个人都能听懂。不再把医学期刊的读者固定在几种人群上,而是让更多的人喜欢上这些往日被认为是呆板、无趣的冷门杂志。这不是白日做梦,国际知名医学期刊《 BMJ 》, 《 NEJM 》,《 JAMA 》等正在把这梦想转化为现实,每年十几万甚至几十万的固定读者就是最有力的说明。我们要想走上这条康庄大道,就先要把标题做深做精,为创办精品期刊打下坚实的根基,让它帮我们打开进军国际期刊市场的第一扇窗。
个人分类: 医学英语|1659 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-16 14:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部