科学网

 找回密码
  注册

tag 标签: 语言科学

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

字与词哪一个是书面汉语间接形式化的基本结构单位
geneculture 2019-5-21 12:16
2013-10(上海:第二届汉语独特性理论与教学国际研讨会) 言和语的关系及其应用 邹晓辉,邹顺鹏 美国加州大学(伯克利) 中美塞尔研究中心 中国地质大学(北京)高等教育研究所 北京市海淀区学院路29号,100083 【摘要】 本文旨在通过“中文棋盘”及其应用的介绍,即:以书面汉语即中文的“字”与“字组”的序位关系数据库及其应用举例,阐述言和语的序位关系及其应用。其实施方略就是用一个超级特例及其可能派生的一系列具体示例来论述其中蕴含的原理和法则。其结果就是便于从形式化的角度来优化汉语“字本位”理论及其应用,进而,以便于人们在应用中体会纯形式的“言本位”之功用。其意义是它以统一参照系(a)和一系列智慧秤“天平”(b)的方式来对语言文字、思想概念、软件对象及其综合体现的人类心智活动进行大规模的定量分析,从而,可有效提升计算机辅助(汉语)教学和研究及其成果应用普及的质量。 【关键词】词本位;字本位;言本位 http://m.blog.sina.com.cn/s/blog_65197d930101b91v.html 言本位何以统辖词本位和字本位? 邹晓辉,邹顺鹏 美国加州大学(伯克利) 中美塞尔研究中心 中国地质大学(北京)高等教育研究所 北京市海淀区学院路29号,100083 2013-09-04 06:02:55 因为,言本位是更高层次上的一种抽象表述方式,即形式化表述!这实质上是三种语言观的递进式发展过程!如果说基于英语的词(国际主流语言)而发展归纳的现代汉语"词本位"学说是西方文化引进在书面汉语即中文及其语言学上的理论提炼,而基于汉语的字(世界人口最多的国家通用的对象语言)而提出的试图统一古今汉语的"字本位"学说是中国文化的传统体现,那么,基于英汉双文双语的间接形式化而升华出来的"言本位"学说就是既兼容于字和词及其本位学说的第三种语言观,又是有基于语言文字、思想心智和软件世界三大基本范畴观而发展起来的文化基因系统工程作为其坚实的哲学方法论与科学方法体系的形式化表述! 注:语言、心智、世界,三位一体,构成广义文本,接受同义并列对应转换法则的管辖或约束;其同义并列的义,即:序位关系,是唯一守恒的本真信息,它的存在性是不证自明的,但是,形式化表述是其无歧义表达的可见形式! http://m.blog.sina.com.cn/s/blog_65197d930101atfz.html “与其说字本位不如说言本位” 邹晓辉,邹顺鹏 中国地质大学(北京)高等教育研究所 北京市海淀区学院路29号,100083 摘要:本文回顾了汉语研究的几次“本位”转换,认为这就是前辈在探寻汉语理论体系建构的逻辑起点。如果必须在字与词之间做出选择,那么,赵元任“字是中国人心目中的中心主题”的论断,以及徐通锵“‘词’不能代表‘字’而成为汉语的一种基本结构单位”的论断,都选择了字。而之前,其他人分别选择了词(马建忠1898)、句(黎锦熙1924)、词组(朱德熙1982)。这是为什么呢?难道赵、徐两位语言学教授都不懂字和词的常识性义项吗?显然不是。他们是根据学术直觉作出上述断言的。有没有可支持他们这种学术直觉背后的学术性义项呢?这是笔者提出的问题和思考。本文从宏观的类与微观的例两个层面多个角度,分析了字与词的学术性义项,发现常识性义项往往是造成非学术性争议的起因。本研究采用史论结合形式和学术分类方法,通过对“语”与“字”两个亚系统的二八分类,凸显了音节、字、言“迭交”的特点,得出了“汉语就是组字成语的典例系统”的论断。陆俭明、冯志伟都说如果字本位换成语素本位,也就不会有人再反对字本位了。因此,为避免字本位提法所引起的非学术之争,与其说字不如说言是汉语的基本结构单位,从而便于我们集中精力论述字素关系(周上之)、字词关系(潘文国)、字语关系即言和语的关系(邹晓辉)几组术语及其关系(这是字本位内部尝试统一认识的努力之一)。 关键词:普通语言学、形式信息学、汉语形式化、汉语研究的逻辑起点、字本位、言本位 2009-12(上海:第一届汉语独特性理论与教学国际研讨会 论文集: 2013-1-1北大出版社:世纪对话:汉语字本位与词本位的多角度研究 平装) http://m.blog.sina.com.cn/s/blog_65197d930102vy8k.html
个人分类: 学术研究|1455 次阅读|0 个评论
对广义和狭义的文本对象做六类分析(视频回放)
geneculture 2018-8-24 07:26
六大分析:对广义和狭义的文本对象做定性分析和定量分析以及结构分析、程序分析、定向分析与定位分析。-邹晓辉 中文棋盘的发现和发明及其应用ppt讲解 http://www.webmeeting.com.cn:8800/pub_recording_view.php?id=60 公佈日期: 三月 01, 2018 錄影日期: 三月 01 (05:47 下午), 2018, 1 小時 10 分 7 秒 主持人: 邹晓辉 提示: 第一次拜访邹晓辉云教室需要事先准备即进入 http://www.webmeeting.com.cn:8800/portal.php 下载JionNet安装页面选择单机版jnj(可直接打开调用)或手机版App(苹果机仅占3m内存,必须提前安装,在Safari状态进入即可) http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=1101814
个人分类: 语言学基础研究|1939 次阅读|0 个评论
语言+认知+人机=自然的+人工的双脑的智慧能力
geneculture 2018-7-30 07:42
语言+认知+人机=自然的+人工的双脑的智慧能力 由此可见,其实应该这样排列: 1. 基于逻辑与数学的抽象演绎 2. 基于语言和图像的虚拟呈现 3. 基于心理与生理的思维选择 4. 基于人机和自然的载体世界 -邹晓辉2018-07-30暨农历6月18号 附录: 【智能科学是由脑科学、认知科学、人工智能等构建的前沿交叉学科,研究智能的基本理论和实现技术。脑科学从分子水平、细胞水平、行为水平研究人脑智能机理,建立脑模型,揭示人脑的本质。认知科学是研究人类感知、学习、记忆、思维、意识等人脑心智活动过程的科学。人工智能研究用人工的方法和技术,模仿、延伸和扩展人的智能, 实现机器智能。智能科学是实现人类水平的人工智能的重要途径,引领新一代人工智能的发展。】
个人分类: 学术研究|1411 次阅读|0 个评论
严谨规范,学术精进,激励后学,奋力拼搏。
geneculture 2018-7-12 08:50
无论是谁?哪怕他或她再有学术资历和荣誉地位,在学术问题上都应该严谨规范,尤其是对后学的学术研究成果,更是不能主观臆断,而要多多鼓励和支持!否则,学界如何进步?因此,我们一定要提倡各种有利于激励千百万后学奋进的社会氛围!否则,整个学界和社会都会缺乏后劲。凡事都有其相应的规律或概率。一旦发现其科学的概念、原理和方法,就可获得相应的诀窍。这就意味着决策和执行的过程会事半功倍。融智学理论与三大系统工程实践结合,有化腐朽为神奇的功用。这是意料之外情理之中的。合情合理又合法就是其实际发挥作用的基本准则。懂会熟巧用则是必经之路。否则,充其量也就是一个业余爱好者。基于理性的哲学反思与基于经验的科学预言,外加个性化的艺术应对与标准化的技术操作,可充分体现集大成、融大智、共大享的格局(这就是融智学理论与三大系统工程实践可发挥作用的情形)。相比之下,古希腊和先秦诸子、近现代以及现当代的各路才俊英豪,都没有这样千载难逢的机会。因此,我们生逢其时,必然对人类近期的未来以及长远的未来,产生影响。这就是我们每一个人的机会(至于是否能把握?那就另当别论了)!-zxh 附图暨附录
个人分类: 学术研究|3372 次阅读|1 个评论
可多校合作的国际国内重大特大项目的三个关键内核
geneculture 2018-6-11 08:16
“基于科学方法体系的双语逻辑” (UNILOG2018国际统一逻辑会议报告题目)和“自然语言处理的新方向”(ICIS2018智能科学国际会议报告题目)与前面我报告过的“两大类形式化方略”即上海计算中心报告题目的改进版三个报告一道可组成做未来我们可多方多校合作的国际国内重大特大项目的三个关键内核(有此基础理论和方法以及广大师生皆可参加的网络工具平台暨新一代广义双语开发环境做支撑,各式各样的发明创造和发现创新的活动都会有一个自由发挥的虚拟现实世界来配套)!-邹晓辉(塞尔科技) 附录1:“两大类形式化方略”即上海计算中心报告题目及摘要 摘要: 阐述机器翻译的两大类形式化方略。其中,第一大类形式化方略涉及:编程语言和英语(自然语言);第二大类形式化方略涉及:二进制数与十进制数、十进制数与汉字中文、中文和英文(可换)三类双语协同变换,属于形式化及其拓展研究领域。其结果是:凸显了第二大类形式化方略。其意义是:揭示了其理论依据,并为含语言学在内的学科知识系统工程提供了广义双语信息处理技术,有利于母语为非英语的计算机用户改善人机对话的语言环境。 关键词: 机器翻译; 形式化; 双语信息处理; 分类号:TP391.2 两大类形式化方略.pdf http://xuewen.cnki.net/CJFD-JYRJ201309055.html 附录2:ICIS2018智能科协国际会议报告题目及摘要 2017-09-07 ZouXiaohui and ZouShunpeng: Logic of sequence and position.pdf 附录3:ULILOG2018国际逻辑会议报告题目及摘要 11. New Approaches to Natural Language Understanding Xiaohui Zou Sino-American Saerle Research Center, Abstract: This talk aims to disclose the know-how of launching a new generation of excellent courses and to develop the learning environment in which human-computer collaboration can optimize the expert knowledge acquisition. The method is to form a teaching environment that can be integrated online and offline with some technical platform of cloud classrooms, cloud offices and cloud conference rooms. Taking Chinese, English, classical and summary abstracts as examples, human-computer coordination mechanism, to do the appropriate new generation of quality courses. Its characteristics are: teachers and students can use the text analyzed method to do the fine processing of the same knowledge module, and only in Chinese or English, through the selection of keywords and terminology and knowledge modules, you can use the menu to select as the way to achieve knowledge. The module's precision machining can adopt the big production method that combines on the line first, complete coverage and accurate grasp each language point and knowledge point and original point even their respective combination. This method can finish fine processing instantly for any text segment. The result is the learning environment that enables human-computer collaboration to optimize the expert knowledge acquisition. Its significance is that this project of this learning environment software based on the National Excellent Courses is already owned by Peking University and that is constructed by using the numbers-words chessboard with the feature of the introduction on the knowledge big production mode for the textual knowledge module finishing. Biography Xiaohui, Zou, male, Chengdu, Sichuan Province, chief researcher, Working in the Project Team on the new generation Excellent Courses of Natural Science Foundation in Peking University and the Sino-American Searle Research Center, head of the group on collaborative intelligent education research, deputy director of the Artificial Intelligence Committee of the China Branch of the International Information Research Society, and Assistant Director of the Education Information Professional Committee, The research direction is language, information and intelligence science. http://www.intsci.ac.cn/icis2018/committees.jsp http://www.intsci.ac.cn/icis2018/speaker.jsp
个人分类: 融智学前期探索|1755 次阅读|1 个评论
Bilingual Logic Based on the Scienti c Method System
geneculture 2018-6-9 23:05
Bilingual Logic Based on the Scienti c Method System ,(Upload link after publication) by Xiaohui Zou Shunpeng Zou . . . . . . . . . . . . . 497-498-499 References(2006-2017 Some of our papers) : 1. Zou Xiaohui. Value-Takingand Confidence-Building of Language . AAAS Annual Meeting, February 19, 2012 https://aaas.confex.com/aaas/2012/webprogram/Paper7342.html 2. Zou Xiaohui. Collaborative Intelligent Computing System : Theoretical Model with Its Application . AAAS Annual Meeting, February 19, 2012 https://aaas.confex.com/aaas/2012/webprogram/Paper7341.html 3.Xiaohui Zou. Fundamental law of Information: Proved by Double Matrices on Numbers and Characters . AAAS Annual Meeting, February 19, 2017 https://aaas.confex.com/aaas/2017/webprogram/Paper20325.html 4. Shunpeng Zou, Xiaohui Zou. Ecological Characteristics of Information and Its Scientific Research . Conference FIS 2017: The Seventh International Conference on the Foundations of Information Science, in IS4SI-2017 http://sciforum.net/conference/IS4SI-2017/paper/3926 Proceedings 2017, 1(3), 59. Published: 8 June 2017 http://www.mdpi.com/2504-3900/1/3/59 5. Xiaohui Zou, Shunpeng Zou,Lijun Ke. Fundamental Law of Information: Proved by Both Numbers and Characters in Conjugate Matrices . Conference FIS 2017: The Seventh International Conference on the Foundations of Information Science, in IS4SI-2017 https://sciforum.net/paper/view/conference/3927 Proceedings 2017, 1(3), 60. Published: 8 June 2017 http://www.mdpi.com/2504-3900/1/3/60 6. Shunpeng Zou,Xiaohui Zou. Understanding: How to Resolve Ambiguity . ICIS 2017: Intelligence Science I pp 333-343. Conference paper, First Online: 27 September 2017. Part of the IFIP Advances in Information and Communication Technology book series (IFIPAICT, volume 510) https://link.springer.com/chapter/10.1007%2F978-3-319-68121-4_36 7. Zou Xiaohui. Intelligence means information processing . VII International Ontology Congress: Real or Virtual: from Plato's Cave to Internet, 2006.Spain 8. Zou XiaoHui. The Meaning of the Information Model on Knowledge Management in University . The International Conference on the Foundations of Information Science (FIS), in Beijing 2010 AAAS and FIS paper all need to be significantly improved
个人分类: 融智学前期探索|1654 次阅读|0 个评论
高级科普:如何把科字真正或完全加到这些重要学科上去?
geneculture 2018-4-29 19:27
会当临绝顶: \0 www.webmeeting.com.cn:8800/pub_recording_view_ecard.php?id=79
个人分类: 融智学前期探索|2431 次阅读|0 个评论
再次公开2010年在贵大举行的中西方语言哲学上的发言
geneculture 2018-4-21 23:59
在“2010西方语言哲学夏日书院”的大会发言 屏蔽 已有 648 次阅读 2010-8-10 04:09 | 个人分类: 2010年7-8月 | 系统分类: 论文交流 推荐到群组 结论:本真信息与序位逻辑的同义并列,导致(“物、意、文”之后)第四范畴(理或义或法或道)的凸显。 邹晓辉在做大会报告之前或会议期间分别同Maria、钱冠连、王寅、林允清、李鸿儒、王爱华、梁瑞清、王建芳和包通发等专家教授做过较为深入的面对面的交流,并得到了各个角度的认同以及进一步推广该原创思想在具体表达或交流方式上的各种意见。 各位专家关注的焦点是不同的,例如 : Maria教授 关注的是“三棱模型比三角模型的丰富性”、 钱冠连教授 关注的是“三棱模型提出的哲学问题及其中西融合哲学问题的重要性”、 王寅教授 关注的是“三棱模型提出的核心问题——真正的形而上问题(即:形上本质)”、 林允清教授 关注的是“具体的学术渊源或研究途径”、 李鸿儒教授 关注的是“创新及其对很不容易的创新如何鼓励并让其阐述透彻的问题”、 王爱华博士 关注的是“三棱模型的核心——第四范畴如何实现无歧义地论证过程”、 梁瑞清博士 关注的是“三棱模型的各个知识要点与西方语言哲学大家的具体思想的对接或渊源关系——表现为具体的参考文献”、 王建芳教授 关注的是“三棱模型怎样给大家深入浅出地讲透彻”和 包通发教授 关注的是“三棱模型如何把中国传统的哲学思想融合进去的——例如模型及其背景知识中涉及老子的道与德以及孔子的仁与礼而不仅仅是那些与西方哲学对接的部分”。 对本人及其学生或助手这都是一个很好的鼓舞、帮助和启示。尤其是钱老提示“不要急、不要多(少而精)以及要舍得(赞成笔者引用鲁迅所说的要忍痛割爱的做法)”以及王老明示“1 弗雷格、罗素、维特根斯坦,2 后现代哲学各派,3 三棱模型的螺旋上升”这样的具体论述途径或轨道,对笔者及其助手进一步提炼三棱模型的具体表达方式很有帮助和启示;Maria的思维方式和表述习惯对笔者及其助手进一步提炼三棱模型的英文表达方式很有帮助和启示。 转载本文请联系原作者获取授权,同时请注明本文来自邹晓辉科学网博客。 链接地址: http://blog.sciencenet.cn/blog-94143-351532.html 下一篇: 什么是语言科学的研究对象——“言本位”从根上解决问题 收藏 分享 修改 | 删除 | 当前推荐数: 0 推荐到博客首页 发表评论 评论 ( 3 个评论) 删除 回复 邹晓辉 2011-4-2 22:48 谢谢! 你是从以下网页复制粘贴过来的: http://bbs.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=418598 删除 回复 邹晓辉 2010-10-1 17:18 融智三棱提出的信息科学基础问题以及它的信息科学基础意义在信息科学基础国际会议其间得到专家们认可 http://www.sciencenet.cn/m/user_content.aspx?id=351755 博主回复: 信息科学基础国际会议是自然科学、社会科学、人文科学和哲学等领域具有信息科学以及信息技术特长的中外专家们聚集的地方。 删除 回复 邹晓辉 2010-10-1 17:15 融智三棱提出的哲学问题以及它的哲学意义在夏哲院得到专家们认可 http://www.sciencenet.cn/m/user_content.aspx?id=359234 博主回复: 夏哲院是外语学界的(中西)语言学、语义学、语用学、翻译学、认知语言学、解释语言学和计算语言学等领域具有(中西)语言哲学修养的专家们聚会的地方。
个人分类: 学术研究|2234 次阅读|0 个评论
中国语文现代化与知识大生产方式的结合带来的启迪
geneculture 2018-4-13 00:50
中国语文现代化与知识大生产方式的结合带来的启迪 邹晓辉 中美塞尔研究中心 主任 研究员 摘要 从“整合创新,促进中国语文现代化——汉语拼写方案的必要性、科学性和可行性”涉及的语言点、知识点和原创点,探讨人机双脑协同智慧能力可实现的拼音和拼写或拼形的歧义将如何自动排除的问题。旨在揭示:一语双文的认知特点对于思维与记忆的独特作用、价值和意义。方法是:首先,把人脑产生的言语片段经过主体间的积极探讨之后一气呵成(不仅仅是理性的归纳整理),接着,把该言语片段的文本导入特定的中文信息处理软件自动生成该文本里不重复的汉字列表(可采用语言棋盘的间接形式化呈现方式),然后,由用户(专家和大众、教师和学生)在联网环境下找出其中的语言点、知识点和原创点乃至知识模块。其结果是:不仅可快速地找出该言语片段文本中几乎所有的语言点、知识点和原创点,而且还可做到知识模块精加工。其意义在于:这样的加工过程不仅蕴含了语言、知识和软件三大类系统工程,而且,知识大生产方式在这个过程中通过开发环境和应用环境联合呈现了出来。 关键词:汉语拼音方案;汉语拼写方案;中文信息处理;间接形式化呈现;知识模块精加工 纪念《汉语拼音方案》颁布60周年暨“语文现代化与汉语修辞发展演进”学术研讨会 报告嘉宾:邹晓辉 用知识大生产方式做新一代精品课程的项目组 联系电话:15916241709 电子邮件:949309225@qq.com 论文题目 给语文现代化插上翅膀:人机双脑结合全面发挥汉语修辞的作用 论文摘要 本文旨在把字本位与汉语多音双文特点现代化、信息化和智能化,从而给语文现代化插上翅膀即人机双脑结合全面发挥汉语修辞的作用。基本方法是:首先深挖字本位与中文信息处理全文中的原创点,进而,采用双字棋盘对其中精选的文本片段所记录的专家知识模块做精加工,最后,提炼可用知识大生产方式做各科精品课程及学术论著的人机协作机制。其结果是可当场验证在网络环境下对任意的文本片段做知识模块深加工。其意义在于它以小见大和见微知著的知识大生产方式可把人助机的形式化和机助人的社会化及人机互助的智能化完美地结合,逐步化解标准化与个性化兼容的难题,发挥人机双脑协同优势,其典型表现是对诗文或文摘及术语乃至言语片段均可实现诗眼或修辞的提炼。 (全文“字本位与中文信息处理”纪念我的语言学导师徐通锵和吴玉章先生)
个人分类: 学术研究|1881 次阅读|0 个评论
语言信息与智能教育:时代呼唤知识大生产方式
geneculture 2018-4-12 20:23
语言信息与智能教育:时代呼唤知识大生产方式
个人分类: 学术研究|1484 次阅读|1 个评论
用知识大生产方式做新一代国家精品课程
geneculture 2018-3-21 08:21
1. 农业时代 物质小生产 的问题与工业时代 物质大生产 的创新之间的社会历史发展或变迁,现在回顾起来,仍然 记忆犹新 。前两个时代的 知识小生产 的问题与信息、智能和大数据时代的 知识大生产 的创新(酝酿过渡乃至阵痛期)之间的社会现实发展或变迁,虽然已经走过了大半个世纪,但是,对于人们而言,至今仍然呈现出 扑朔迷离 的情状。 究竟是 什么原因让这一次的社会大跃迁如此困难 呢?对此,经过深刻的理性反思和经验预测, 笔者发现了“牵一发而动全身”的问题与症结之所在 (见以下2.2. 核心科学问题:在 知识小生产方式 方法上的问题)。发现问题、分析问题和解决问题之间有着内在的逻辑联系与历史必然。在合适的地点、时间和人群就会自然而然地对创新的幼芽一路呵护地前行直到有一天,它的爆发点,就会 水到渠成,瓜熟蒂落 。这个契机就是 目标管理与自我管理 可协同兑现之时。笔者 教管学用结合的社会化系统工程 遵循的目标导向,它们的兑现方式,见以下2.1. 项目的科学目标: 知识大生产方式 方法上的创新)。 2.1. 项目的科学目标:知识大生产方式方法上的创新 用基于广义文本的文化基因系统工程,把 言识软硬结合的形式化系统工程 与 教管学用结合的社会化系统工程 ,在蕴涵着 语言、知识、信息、智能、数据等关键词 共同指向的科学发展道路上,从逻辑的定性分析和数学的定量分析,进而再发展成为 定性、定向、结构、程序、定位、定量的综合系统分析 ,尤其是 基于三类信息处理的方法和原理的双字棋盘 ( 既是开发环境,又是用户平台 )在各级各类学校对于广大师生的普适性,这就把 知识大生产方式 方法逼到了前台(之前它是隐在后台的)。 这样的创新及其蕴涵的威力之所以巨大无比 ,不在于其复杂性而在于其简单性( 实际上是简单与复杂、标准与非标、抽象与具体的高度统一 )。 2.1.1 . 融智观念 框架:“七个字”概括的 基本范畴框架 即知识管理定性分类的 顶层设计 2.1.2 . 融智方法 架构:“五层级”凝聚的 基本学科架构 即知行合一刚柔相济的 方法体系 2.2. 核心科学问题:在知识小生产方式方法上的问题 科学 学科的形成与发展,终于到了这么一个节点 ,不仅语言、知识、信息、智能、数据等长期在某某学与某某哲学之间 两极摇摆 ,就是很难在科学的严格限制条件下成立,而且,更有甚者的是, 就连逻辑与数学这样以严谨而著称的学科,也再次复现在某某学与某某哲学之间两极摇摆的情形 。近十年左右,在相关这些学科的国际国内学术交流中,特别是教育学和教育哲学的问题也加入了该基础研究和前沿研究的探讨视野, 这就进一步加速了这类问题收敛的进程 。特别是高等教育学和马克思主义(思想政治教育学)理论以及软件工程这样的大跨度的学科建制的过程,联系到前述一系列学科的 内在建制 问题, 促使笔者认识到了一个超级复杂问题,完全可以采用最合适同时也是最简单的优选方案来一揽子地统一化解 。这就是本项目的方案 为什么要从小生产这个根上的问题切入来优选知行统一的解决方案的缘由 。 2.3. 围绕解决核心科学问题拟开展的主要研究内容及建议研究方案(科学目标应该明确集中, 所凝练的核心科学问题具有基础性和前沿性,学科交叉性强 ) 2.3.1 . 主要研究内容 既然 诸多关键学科的内在建制 都遭遇了相似乃至本质上相同的一连串牵一发而动全身的问题,即 知识小生产的方式 方法已经再也不能适应如今 学科交叉日益复杂的局面 了,那么,本项目干脆就直接从 知识大生产的方式 方法颠覆既有的延续了两千多年的 知识小生产格局 。 2.3.1 .1. 研究对象 2.3.1 .2. 学科属性 2.3.1 .3. 概念框架 2.3.1 .4. 方法架构 2.3.2 . 建议研究方案 有了以上的问题分析和内容划分,一个明确的方案也就顺理成章地凸显了出来,即:采用知识大生产与知识小生产 双重方式方法并行的新格局 。其具体步骤是: 步骤一是 从人脑的特点入手,采用自然语言理解的方式,来帮助电脑做自然语言处理 ,其特征在于 教管学用结合的社会化系统工程 ; 步骤二是 从电脑的特点切入,采用专家知识表达的方式,来帮助人脑做专家知识获取 ,其特征在于 言识软硬结合的形式化系统工程 ; 步骤三是 从双脑的互补导入,采用广义双语翻译的方式,来帮助人机做言和语的识别 ,其特征在于 广义文本基因的智能化系统工程 。 附录: 今晨灵感(对外稿件): 重大项目的名称:用 知识大生产方式 做新一代国家精品课程 是 信息科学和技术以及智能教育乃至知识管理的巨大发展 ,有巨大的社会与经济双重效益。 昨晚构想(内部草稿): 题目:采用 人机双脑协同智慧能力形成的科学机理 来启动北京大学新一代精品课程 属于 基础研究的科学机理 即三大类信息处理的方法和原理 具有普及推广意义的北京大学新一代精品课程即 可创造巨大社会经济价值 的实际应用 理论的前瞻性和实际的普适性 共同 奠定了本重大项目的战略意义
个人分类: 学术研究|4 次阅读|1 个评论
对象,性质,框架,架构,全面贯通:理论建构的困难所在
geneculture 2018-3-14 07:28
牵一发动全身(务必全面贯通一揽子解决) 基础研究对象的明确与派生研究对象的清晰 明确学科性质进而分清领域边界同行业界限 基本概念体系的框架和基本方法体系的架构 对象,性质,框架,架构,全面贯通:理论建构的困难所在。
个人分类: 学术研究|1730 次阅读|0 个评论
什么是语言科学的研究对象(言和语的划分)
geneculture 2017-12-17 00:19
发表新博文 什么是语言科学的研究对象——“言本位”从根上解决问题 屏蔽 已有 4891 次阅读 2012-4-6 04:24 | 个人分类: 语言学基础研究 | 系统分类: 论文交流 | 关键词:索绪尔 语言学 语言科学 推荐到群组 什么是语言科学的研究对象* ——“言本位”从根上解决问题 作者:邹晓辉(Geneculture)** 1.提出问题 索绪尔曾明确指出:语言学完整而具体的对象是什么呢?这个问题尤其难回答;后面我们还会分析其原因;这里我们只是强调这种困难。其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察;但是语言学不是这样的。*** 索绪尔既然已经认识到:其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察。那他为什么不把语言学的研究对象往这个方向或这个层次上引导呢? 2.分析问题 笔者认为:索绪尔及其后续各个方面的继承者均在对普通语言学的研究对象的取值和确信两个方面迷失了进一步前进的方向。 笔者凭什么可以这样说呢?仅以索绪尔区分语言和言语这一对范畴并至今还得到各派语言学家的一致认可,就足以说明索绪尔在对普通语言学的研究对象的取值问题上所取得的具有里程碑意义的成就和贡献,但是,同时也说明学界在这个问题上再前进一步多么困难。 笔者发现其中至少存在以下两个重要原因: 其一,是英语等西方语言以及受其影响现代汉语的词均存在一个不同于古代汉语的特点,即:词兼有言和语双重属性。这就是在形式上造成语言学研究对象不明确的一个根本性原因。 其二,是不仅索绪尔创立的普通语言学而且乔姆斯基创立的形式语言学均未深入研究过汉语的特点,而这正是可克服西方语言学的基本研究对象不明确的一个非常有效的切入点。 为什么会这样呢?笔者发现西方语言学的价值判断和置信假设共同造成了该局面。 首先,他们在价值判断上排除了汉语研究可对西方语言学做出实质性贡献的机会。 进而,他们在置信假设上确信了汉语研究可与西方语言学的进一步发展没有关系。 也就是说,他们几乎忽略了语言的共性是离不开语言的个性而独立存在这一事实。 尤其必须指出的是:弗雷格和塔斯基所探讨的价值(真值)与索绪尔所探讨的价值(即从经济学引入的可判断语言实体功用或意义——价值)以及它们在确立词语的用法或语法的取值等涉及义项的选择和句子成分的选择的价值(取值)之间,既存在区别又存在联系。其难点在于纯粹形式上的取值与夹杂着内容的选择均与语言使用者的态度即置信程度挂钩。 3.提出进一步的问题 在普通语言学建立之初,由于索绪尔确信:(其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察;但是)语言学不是这样的。从而,导致普通语言学的研究对象长期仅限于语言和言语这两个层面,迄今为止的语言学乃至言语学(虽然暂时还没有此学说但是的确已有此探讨)发展几乎均未突破这两个研究对象的边界。 既然学界早已认识到科学工作的对象能否预先确定是同行之间是否能够合理分工并高效协作从不同的角度来考察或探索同一个研究对象的根本性问题,而且,经过百年探索之后至今还仍然是众说纷纭的这么一个仅有其外在建制而其内在建制仍未建立起来的学科,难道不应该从根上反思一下其问题所在吗?以往语言学界确信的研究对象,为何不能再换一个思路来进一步重新细分一下呢? 4.进一步分析该问题 首先,仅就价值判断而言,虽然索绪尔早已发现语言是一个价值系统,但是,他却未能把可从经济学引入语言学的价值与可从数学引入语言学的价值以及可从逻辑学和化学引入语言学的价值之间的相互关系理顺。这就是本文强调的第一个问题,即:取值问题。 本来早就可以沿着这条路径开辟出一条自然语言理解的间接形式化通途,但是,却由于学界在价值判断和置信假设两方面的错误一而再再而三地给耽误了,因为,学界确信了错误的判断和假设。于是,不仅迷失了语言科学进一步精准发展的研究对象,宏观上说就是混淆了语言符号形式与思想内容以及两者的物质载体乃至支配三者的序位关系四个“类”的界限,中观上说,是学科性质尤其是在学科交叉研究领域的划界时常出现张冠李戴的错误,微观上说,是学界至今仍未确立汉语的“言和语”这一可间接形式化处理与理解的方略在普通语言学和形式语言学中的地位。    接着,仅就置信假设而论,尽管弗雷格早就提出与价值判断密切相关的置信或确信的问题,但是,它却仅限于对真值判断问题以及间接引语置信问题的探讨。这正如前面所说,价值这个词语的用法或义项在不同领域或从不同学科背景来看具有不同的含义,因此,置信或确信什么?也就不能不影响取值。这就是本文强调的第二个问题,即:确信问题。 5.从根上解决问题 普通语言学的研究对象究竟是什么?或者说,什么是语言?它主要指什么?可否进一步区分为言和语?为什么不能在英语的言与汉语的言之间划等号?    索绪尔曾尝试性地回答了前面三个问号,他不仅区分了语言和言语,而且还指出了语言是一个价值系统,为学界系统分析其中音义结合的词素、单词、词组、句子等结构单位指出了方向。从而,开创了科学探讨语言学的先河。 汉语的情形很特殊,因为在文言中根本就没有印欧系语言的词素、单词、词组、句子那样的结构单位,只有偏旁部首、字、辞、链、块、读、句这样的结构单位。 白话文及现代汉语引入印欧系语言的结构单位造成了多次本位转移或本位之争,其中最典型的是马建忠、黎景熙、朱德熙和徐通锵教授等人提出的本位学说。 笔者提出“言”和“语”两个系列的细分价值系统,指出两者的区别在置信而联系却在取值。例如,如果假设英语的言是词(实质上词兼具言和语双重属性),汉语的言是字,那么,英语的语就是词组与句子,汉语的语则是字组1(即:辞、链、块)与字组2(即:读、句)。从普通语言学的基本研究对象“言”及其取值角度来看,说英语与说汉语的社团可视为对英语的言即词与汉语的言即字分别置信的社团。而从普通语言学的派生研究对象“语”及其取值角度看,说英语与说汉语的社团可视为对英语的语即词组与句和汉语的语即字组1(即:辞、链、块)与字组2(即:读、句)分别置信的社团。 这样,就可得到以英语与汉语为例的普通语言学研究的言和语两个系列的细分价值系统,即作为基本符号对象的普通语言学的基本研究对象“言”及如何取值与置信的细分价值系统;和作为符号组合解释的普通语言学的派生研究对象“语”及如何取值与置信的细分价值系统。 图1 言(Yan)和语(Yu)的关系 由图1可见以汉语为例的普通语言学研究可区分两类基本研究对象,然而,以英语(或其他印欧系语言)为例的普通语言学研究却必然遗漏文言的字这样的研究对象。 鉴于白话及现代汉语的词属引进的语言结构单位,故被纳入区别于字的另一类语言结构单位。在以汉语为例的普通语言学的研究对象之中,言具有基本结构单位的地位,简称:言本位。 采用“言本位”这种语言观,不仅可克服以汉语为例的普通语言学研究中其他几种本位说的错误、缺点或不足,而且还可为一种崭新的机译策略奠定语言理论基础,并且也可为语言学迈向语言科学进一步发展奠定形式化处理的基础。 因为,现代汉语必然传承古代汉语的精髓“言本位”,即使引入西方语言(混音节词)形式上混沌即兼具言和语双重属性的所谓“词本位”也掩盖不了汉语形式上清晰即言(单音节字)和语(双音节及多音节的字组)截然分明的本质特性。 参考文献 : 邹晓辉.语言的取值与置信——对语言学研究对象的哲学分析.“语言与价值”国际学术研讨会(2011北京师范大学)论文集,2011;文集双语版,牛津大学出版社,2012 注释 : * 本文是直接从《语言的取值与置信——对语言学研究对象的哲学分析》节选重组而成的短论。仅有极少数涉及文本文字和文体格式上的调适,论点、论据、论证等实质性内容和系统的语言表达风格均无改变。 ** 2000年至2005年邹晓辉由北京大学中文系徐通锵教授一步一步地带入以汉语为例的普通语言学基础研究领域,邹晓辉的研究重点是字与词的关系以及基于双语信息处理的汉语字与字组的计算机辅助分析。分别于2004-2011年期间参加新加坡、北京、青岛、厦门大学(注:此前会议仅是文章上了会议论文集);西班牙、上海、哈佛大学、加州伯克利大学的一系列学术交流,并且发表了相关研究成果,同期,还申请了着重于汉语形式化技术处理的发明专利(2010101752962)。 *** What is both the integral and concrete object of linguistics? The question is especially difficult; later we shall see why; here I wish merely to point up the difficulty. Other sciences work with objects that are given in advance and that can then be considered from different viewpoints; but not linguistics. 【 这一条答复,也可用于回答:科学网读者 】 “ 北大中文论坛 www.pkucn.com » 汉语语言学 » 什么是语言科学的研究对象——“言本位”从根上解决问题 ” http://www.pkucn.com/viewthread.php?tid=277927page=1extra=page=1 (一贴出来不久也很快就有人留言) 原帖由 汝南 于 2012-4-6 09:18 发表 http://www.pkucn.com/images/common/back.gif    这个论文节选很好,想来是反映出了语学界动态的 。至于说论文针对“字本位”和“词本位”而 又新提出“言本位”,由于是第三方观点 ,就不便请教了。只想借此请问一下楼主,不知能否介绍一下 语言里“本位”到底是指 ... 邹晓辉Geneculture答复 如下: 语言学只有摆脱主观臆断的干扰,才能走上科学化道路 。 “本位”这个辞语有两个义项 ,其一由金融学的“金本位”截取并借用到语言学的“词本位”、“句本位”和“短语本位”;其二就是徐通锵教授的《语言论》以及《基础语言学教程》所述的汉语的基本结构单位,即: 字是汉语的基本结构单位,这样的说法被其弟子中对立的两派师生简称为“字本位”。 言,在形式上,就是:单音节字;在内容上,言的每一个义项 都是由双或多音节的语来同义并列地加以表述的。 因此,如果仅仅从内容上来看,它不仅与单音节的词素(即语素)而且也与单音节的词甚至还与独字句均有相似之处。所以,为了避免歧义,在言和语的关系这一问题的研究上,仅限于音节的数量形式这样的可区分标志。由此可见,无论是单音节的词素(即语素)、单音节的词、单音节的独字句,还是这三者的双或多音节的形式,以及双或多音节的词组或短语,都不可能独立充当:言,单音节的字。 因为,词素(即语素)、词、句,作为三个类,均在相同的概念之下可兼有言和语双重属性。只有双或多音节的词组或短语,仅仅属于语这个大类。同时,也只有单音节的字,仅仅属于言这个基础类。这样的表述是很明确且相当清晰的。 只有基于这样的可形式化的无歧义的表述,才有利于语言科学内在学科建设的进一步发展。只有摆脱主观臆断的干扰,才能走上科学化道路。 附录 : 字与词的义项分析 摘要:本文回顾了汉语研究的几次“本位”转换,认为这就是前辈在探寻汉语理论体系建构的逻辑起点。如果必须在字与词之间做出选择,那么,赵元任“字是中国人心目中的中心主题”的论断,以及徐通锵“‘词’不能代表‘字’而成为汉语的一种基本结构单位”的论断,都选择了字。而之前,其他人分别选择了词(马建忠1898)、句(黎锦熙1924)、词组(朱德熙1982)。这是为什么呢?难道赵、徐两位语言学教授都不懂字和词的常识性义项吗?显然不是。他们是根据学术直觉作出上述断言的。有没有可支持他们这种学术直觉背后的学术性义项呢?这是笔者提出的问题和思考。本文从宏观的类与微观的例两个层面多个角度,分析了字与词的学术性义项,发现常识性义项往往是造成非学术性争议的起因。本研究采用史论结合形式和学术分类方法,通过对“语”与“字”两个亚系统的二八分类,凸显了音节、字、言“迭交”的特点,得出了“汉语就是组字成语的典例系统”的论断。陆俭明、冯志伟都说如果字本位换成语素本位,也就不会有人再反对字本位了。因此,为避免字本位提法所引起的非学术之争,与其说字不如说言是汉语的基本结构单位,从而便于我们集中精力论述字素关系(周上之)、字词关系(潘文国)、字语关系即言和语的关系(邹晓辉)几组术语及其关系(这是字本位内部尝试统一认识的努力之一)。 关键词:普通语言学、形式信息学、汉语形式化、汉语研究的逻辑起点、字本位、言本位 转载本文请联系原作者获取授权,同时请注明本文来自邹晓辉科学网博客。 链接地址: http://blog.sciencenet.cn/blog-94143-555849.html 下一篇: 习近平治国理政思想精要的计算机辅助研究 收藏 分享 修改 | 删除 | 当前推荐数: 3 推荐人: 谢鑫 崔小云 yishan02 推荐到博客首页 发表评论 评论 ( 5 个评论) 删除 回复 邹晓辉 2017-8-11 13:45 有语言学,也有语言哲学,甚至也有语言工程即语言的形式化技术,其局部成就已经不少,而全局性的整体上的突破--间接形式化的中文棋盘(即形式化的中文房间)还在襁褓之中,由于网络时代的助力,其扩散过程虽然已经很不错了--欧美及亚洲尤其是其原创地中国的有关方面都有所知晓了,但是,依据九级融智台阶的上下包抄特点,因此,对它及其背后蕴含的三大信息基本定律的认知及其行为验证还仅仅处于早期推广普及阶段。随着SCI和SSCI以及AHCI等顶级期刊的检索信息逐步把它及其等价变体纳入体系之后,水到渠成和瓜熟蒂落的节点就会到来。--邹晓辉Geneculture 2017-08-11 附录(回顾索绪尔的论断--再联想:弗雷格和维特根斯坦等人代表哲学领域的语言学转向,乔姆斯基的语言学革命,塞尔对语言哲学、心智哲学的“中文房间”论题和社会哲学的本体论,等等,语言科学已经到了呼之欲出的地步!其突破点之一就是言和语的基本结构关系的形式化表述体系即以中文双列表以及中文棋盘为例可形式化地清晰表述语言科学的研究对象、学科性质、概念框架和方法架构多方面牵一发而动全身的实质性突破!):【What is both the integral and concrete object of linguistics? The question is especially difficult; later we shall see why; here I wish merely to point up the difficulty. Other sciences work with objects that are given in advance and that can then be considered from different viewpoints; but not linguistics.】 删除 回复 王玉锋 2012-4-6 15:35 大致地瞄了一眼,好象讲的是语言单位的问题? 博主回复(2012-4-6 17:54) : 谢谢! 提示: 本文主要探讨的是高等教育学科内在建制的一个根本性问题。 当然,这里是以语言学科的研究对象来做的一项具体的研究。 如果要认真地回答你的这个看似普通且很常见的所谓小问题,那么,还真得要系统地论述类的分析和例的统计、定性研究和定量研究的关系。稍后,我会把《“言本位”及其提出的理论背景——字与词“本位”说隐含的问题》(其前半部分已贴出来了)的后续部分也贴出来。 删除 回复 崔小云 2012-4-6 13:38 1楼说的极有道理!学习了。 博主回复(2012-4-6 18:06) : 谢谢! 删除 回复 周春雷 2012-4-6 13:34 其他科学工作的对象都是预先确定---真心请教个问题,现在是否语言学界也认为“其它”和“其他”无区分必要? 博主回复(2012-4-6 18:05) : 谢谢! “它”和“他”为什么会被一些人(无论是内行还是外行)不加区别的使用?这看似一个很小很小的问题。其实,也都是一个需要认真回答的问题。就我所知,无论是“语言”还是“言语”那一种研究,都没有谈或者说可以不谈这个问题,因为,“其它”或“其他”在英语里面都是other这一个词语。这说明什么呢?这说明汉语和英语(印欧语之一)的基础类和衍生类及其相应的若干的例之间都是存在差距的。它反映人的思维习惯和思考乃至理解或表达的精度也是不同的。 删除 回复 luntan188 2012-4-6 10:10 语言科学的研究对象很多,如字、词、句、段等。将物理、数学、化学自然科学的概念引入到语言的研究中,有利于语言研究的科学化,精准化。借助计算机技术,语言研究会有快速,巨大的发展。 博主回复(2012-4-6 17:40) : 首先,表示感谢! 同时,说明几点: 1.一门完成了内在建制的学科,其研究对象一定是非常明确的;如果它还是不确定或者说是杂多集合,那么,也就说明它还没有完成内在建制虽然其外在建制可能已经相当地庞大了,例如:语言学、信息学、高等教育学,等等。 2.人文学科和社会学科以及交叉学科等,都可以从物理、数学、化学等自然科学的学科研究中得到启示,从而,有利于科学化、精准化;计算机技术的介入也会加速其发展。这是毫无疑问的。 3.自然学科、人文学科和社会学科及其交叉学科各有其自身的独特性当然也有着某些共性。现在,语言学、信息学、高等教育学,等等,之所以内在建制难以健全并完善,主要的困难就在于:其成为之所以具有完善内在建制的学科,没有明确的研究对象(其问题就是它过于冗杂,有的甚至无所不包),于是直接影响到其学科性质的描述,再深入也就必然涉及其是否有自洽的概念体系和独特的方法体系(注:这四个方面是一个有机整体——牵一发而动全身,这也就是研究它们的困难之所在)。
个人分类: 学术研究|819 次阅读|0 个评论
智能教育协同创新:学术引领与产业驱动的数字化进程
geneculture 2017-12-17 00:18
智能教育协同创新:学术引领与产业驱动的数字化进程 邹晓辉 【摘要】: 本文旨在介绍智能教育协同创新数字化平台及其开发环境。其建构方法是集大成、得智慧的方法,其特征是人机协同,其建构的基本步骤是:一方面,依托数字化图书馆及其网络的云计算能力,通过大数据分析,把计算机的批处理能力与人机交互能力相结合,提升其导航能力;另一方面,调动国内外高校的开放教育资源和师资及广大校友的积极性,通过大智慧融合,将自然人的大协作能力与人机互动能力相结合,提升其续航能力。 【作者单位】 : 北京大学数学科学学院信息科学系(国际信息研究学会中国分会教育信息化专业委员会); 【分类号】: G434 特稿| 智能教育协同创新:学术引领与产业驱动的数字化进程 2017-12-20 邹晓辉 本文发表于 《数字教育》 2017年第6期(总第18期)特搞栏目,页码:1-5。转载请注明出处。 摘 要 : 本文旨在介绍智能教育协同创新数字化平台及其开发环境。其建构方法是集大成、得智慧的方法,其特征是人机协同,其建构的基本步骤是:一方面,依托数字化图书馆及其网络的云计算能力,通过大数据分析,把计算机的批处理能力与人机交互能力相结合,提升其导航能力;另一方面,调动国内外高校的开放教育资源和师资及广大校友的积极性,通过大智慧融合,将自然人的大协作能力与人机互动能力相结合,提升其续航能力。 关键词 :双字棋盘;智能教育;协同创新;数字化平台 智能教育协同创新是基于 融智学 理论与 文化基因系统工程 实践而做的顶层设计。一方面是 教管学用 社会化系统工程,可用知识模块 精加工 来概括;另一方面是 言识软硬 形式化系统工程,可用 知识导航仪 来体现。 智能教育协同创新 数字教育模型已可用世上 最简单的语言符号 来无歧义地表达。这就为语言学和语言哲学、教育学和教育哲学、信息学和信息哲学的问题得以数字化或形式化奠定了基础。 “ 一旦我们能够修正并形式化一个哲学问题,从而使我们能够找到一个系统的方法来回答它,那么它就不再是一个 哲学问题 ,而成为了 科学问题 。”形式化、数字化和结构化,在此具有同一种基本属性。本文所述的 知识导航仪 及其背后的 知识中心 所采用的 知识模块精加工 方法是一种系统的形式化方法 。比知识地图 、知识图谱 及思维导图 的做法推进了一步。( 两方面的区别就在于 大生产 与小生产的本质区别 ) 一、智能教育协同创新的目的 席卷全球的“信息化”浪潮推动着人类社会由工业时代快速向信息时代转变,许多人都还没有适应,新一轮的“智能化”巨澜又把它推向更高级且更具有挑战的智能时代。中国政府与时俱进、奋起直追, 相继发布了《国家教育事业发展“十三五”规划》 和《新一代人工智能发展规划》 ,积极推动人工智能研发与应用,促进智能技术与教育教学的融合创新与优化发展。 本文 旨在 从信息化向智能化转变的学术引领与产业驱动的数字化进程角度来介绍智能教育协同创新数字化平台及其开发环境。 二、智能教育协同创新的方法——从数字化进程纯形式体系建构及其存在公理深入 智能教育协同创新数字化平台及其开发环境的建构方法是集大成、得智慧的方法,其特征是人机协同, 其建构的基本步骤是:一方面,依托数字化图书馆及数字网络的云计算能力,通过大数据分析,把计算机的批处理能力与人机交互能力相结合,提升其知识导航能力;另一方面,调动国内外高校的开放教育资源和师资及广大校友的积极性,通过大智慧融合,将自然人的大协作能力与人机互动能力相结合,提升其知 识续航能力。 其中,知识导航能力和知识续航能力分别依托的是本文所述的两大系统工程:一是教管学用社会化系统工程,可用知识精加工来概括 ;二是言识软硬形式化系统工程,可用知识导航仪来体现 。两方面均可汇聚到一个可称之为广义文本基因演绎体系的参照系。它可用世界上最简单的语言或符号来无歧义地表达。人们的抽象思维、直觉思维和形象思维在此发生交叉重叠与融通融合,最后可收敛到广义文本基因及其组合的演绎体系来系统阐述。表1 是广义文本基因及其组合数字化演绎体系的抽象模型。 表1 广义文本基因及其组合数字化演绎体系的抽象模型 由表1 可见,第一进阶(2^1)即单一集合{0,1} 仅含有0 和1 两个基本元素,位于第二与第三进阶的是两个分层集合,它们的元素组合之间,在属性相同的单位上出现了交叉重叠的情形,这就导致属性集合{01,001,010} 和{10,010,100} 的划分必然会发生交叉重叠的情形。换一句话说,单一集合及分层集合的成员存在唯一的序位结构(可称之为本真信息)—— 可用信息量的基本单位“比特(Bit)”来计算,无论是跨层次,还是同层次的元素组合,其构成的属性集合都必然存在组合歧义和聚合歧义(逻辑悖论就蕴含在其中)。各种进制之间相互转换的等价性则预示其数字化进程必然蕴含逻辑悖论。因此,数理逻辑蕴含悖论是不可避免的。这就等于告诉我们,不仅分层集合与属性集合的区分是非常必要的,而且各层的序位是唯一的;人机双方都必须面对单一集合{0,1} 和杂多集合{0,1,00,01,10,11,000, ……,ε……, ∞ } 两个极端;还必须面对各种进制之间的相互转换关系及可视为等价的其他形式的符号乃至图形体系。 学术引领 的要点:首先,广义文本基因及其组合的演绎体系是不证自明的公理体系,尤其是以二进制为典型示例的纯数字的演绎体系。其次,其他进制的或可转化为纯数字的演绎体系的等价形式体系也是不证自明的。最后,务必指出它蕴含着信息基本定律(以二进制为典型示例来阐述和论证最为直接且简明扼要):序位结构及其所蕴含的 本真信息是唯一守恒的,这是第一定律 ;不同文本基因及其组合的演绎体系之间 只要序位一致即同义(第二定律的不动点)且同意(第三定律的枢纽)即可并列(物)、对应(意)、转换(文) 。可区分 现象信息(物、意、文)与本质信息(理、义、法)及本体信息(物+ 文) 。其中,物,不仅蕴含信息, 而且涵盖具有质能时空的载体。如此基本的认识仅限于信息学和信息哲学的范畴是很难说清楚的, 唯有在形式化的信息科学范式体系里才能无歧义地精准表达 。这充分体现出了协同智能理论的作用、价值及意义。用通俗的话来说就是, 具有公尺作用的 基准参照系 一旦被找到,如{0,1} 或{A,T,C,G}——基于它们的各就各位论、各取所需论或各尽所能论的相互结合即可组成有效的 应对参照系 。用它们可很方便地测量和判断相应领域的实际对象,例如各类数字组合或生物种类的基因组合,都是可区分、可鉴别、可计算、可统计的。 体现了人类智力和人工智能相结合所形成的协同智慧能力 。这是单一的人脑或单纯的电脑及其简单结合都做不到的。因此,智能教育协同创新不仅是 特定时代的产物 ,而且,更是探索协同智慧能力的融智学和文化基因系统工程 所具有的独特见解 。 理解这样的方法及其原理,不仅需要相应的背景知识,而且,更需要训练有素的思维习惯。 三、智能教育协同创新的结果——把纯形式体系转换为双字棋盘可形成产业支撑 由各种进制之间可相互转换的等价性,可引出纯形式体系的变体即双字棋盘。其特点就是它所具有的多进制的序位结构可作为形式逻辑推理的大前提,其孪生矩阵所具有的联动函数则预示着一系列的小前提,其结论在逻辑和数学 两个刚性约束条件 上附加 一个 广义翻译的 柔性约束条件 (在特定的情形或局限领域它就可转化为刚性约束条件)的整体限定范围,是可确定的。 其 结果 是智能教育协同创新数字化平台及其 开发环境形成 。该平台的特点是标准化、数字化、个性化和文本化的双字棋盘即语言棋盘与知识棋谱及原创棋魂之间存在联动函数,其所遵循的序位逻辑、双语数学和广义翻译三个约束条件, 体现出该开发环境易普及且易形成产业支撑 。 图1 是中文棋盘及其蕴含的联动函数可识别知识棋谱和原创棋魂的 一个典型实例 。 图1 中文棋盘及其蕴含的联动函数可识别知识棋谱和原创棋魂典型实例 由图1 可见且可推知:第一,人脑的智力成果—— 诗文,不仅蕴含一系列词语形式,而且还蕴含着作者的知识棋谱和原创棋魂;第二,电脑的人工智能—— 程序,自动生成的数字与文字之间构成对应的双字棋盘; 第三,人机交互所选出的“已、真、待、巧”像庖丁解牛一样游刃有余地揭示出了全诗的文脉——可让读者瞬间理解作者的意蕴和主题乃至风格。就该诗而言,“明白、超然、发展、安排”和“详情事理、身心和谐、重构基因、再把人生”均因为“已、真、待、巧”的醒目标注而得以凸显,理解该诗几乎可瞬间而达到预期目的。唯一须做进一步解释的就是这里“重构” 的“基因”, 它显然不是生物基因, 因为人们几乎不可能再重构各自的生物基因,唯一可重构的只能是文化基因, 也就是形式化的广义文本基因, 这就一下子把读者的认知和心境提升到了一个前所未有的境界。这样的计算机辅助与软件工程、知识工程和语言工程都联系到一起了。于是,软件产品应用与软件开发服务,也就由语言棋盘、知识棋谱和原创棋魂三方面联系到一起来了。其结果就是:语言、知识和软件三大系统工程因人机协同的智慧能力而联系在一起了。 读者可充分发挥其推理和想象的能力。不仅一首诗、一篇文章瞬间即可呈现原创作者的意蕴和主题乃至风格(它们就是原创棋魂),而且一本书乃至所有的书里记载的知识棋谱都可从其中的棋子(汉字)各式各样的组合变换中选取。这样,人们就可从中文棋盘上,挑选出各自偏好的知识棋谱乃至原创棋魂(与之配套的大大小小的语言棋盘也可供智能终端的特定用户调用)。 一种新型的数字教育范式,由此也就呈现在广大中小学师生们的面前了。试想:通过双字棋盘可把任何一段文本瞬间数字化和文本化,从而,非常方便地供作者和读者、教师和学生,对其中蕴含的知识模块做精加工,还可因此形成全班、全校及跨校的知识大生产开发环境。 这不仅可以在数字化语文课本的阅读理解上派上用场,而且对数字化英文课本也可派上用场,对记忆思维训练还特别有用。例如笔者2017 年在美国与有关专家交流时它都发挥了很好的作用。“逻辑”这个词, 在数字和文字构成的双字棋盘上,其联动函数关系是非常明确的,但在笔者那段话里所呈现的“逻辑”却有三个不同的语境,即影响理解的上下文。其中,一段话里的“逻辑”一词是亚里士多德的语境,另一段话里的“逻辑”一词是弗雷格的语境,还有一段话里的“逻辑”一词则是笔者邹晓辉的语境。凭借其上下文语境可辨识歧义。 通过这样的方式,作者可教会机器通过上下文来 化解歧义 ,从而可更好地让读者 避免误解 。 用户提取知识棋谱和原创棋魂的过程非常简单, 就像选择棋谱或菜单那样容易。 图2是英文棋盘及其蕴含的联动函数可识别知识棋谱和原创棋魂的 一个典型实例 。 图2 英文棋盘及其蕴含的联动函数可识别知识棋谱和原创棋魂典型实例 由图2 可见且可推知:由于亚里士多德、弗雷格和邹晓辉三个人的语境是不同的,于是也就引出了形式逻辑、数理逻辑和序位逻辑三种表述方式,尤其是双字棋盘序位结构存在公理和联动函数存在公理两个刚性约束条件,具有大小前提的功用,这就为进一步判定“逻辑”的具体词条或义项的理解是否能够被读者所认可奠定了是否“同意”这一柔性约束条件存在公理的基础。无可否认,大家都认可亚里士多德形式逻辑与弗雷格数理逻辑这两个语境约束条件下的用意(这是毋庸置疑的,除非读者不知道相应的背景知识)。有了这个基础再结合图2 及其语境,读者也不难理解邹晓辉的语境条件下“逻辑”这个词的基本用意和序位逻辑的含义。 由此可见,结合表1、图1 和图2 可理解本文所述双字棋盘为何具有知识导航仪的功用,其前提就是它是一种具体的智能教育协同创新数字化平台和加工 知识模块 的 知识大生产 开发环境。(关键在于 知识大生产方式 ) 四、智能教育协同创新的意义 其意义不仅在于 知识导航仪和知识续航支持系统 , 而且,还在于 智能教育协同创新过程及学术引领与产业驱动的数字化进程所遵循的科学原理 。它们都可得到简明扼要的阐述或呈现。 如果说表1 给出了抽象的测序定位系统及其基本原理,那么,图1 和图2 则进一步给出了基于双字棋盘的测序定位系统功能,以及基于其上的知识导航仪和知识续航支持系统所具有的特点、作用、价值和意义。如果图1 里作者借助双字棋盘做的是画龙点睛的功夫——作者标出“已、真、待、巧”不仅让常规的二字和四字词及四字语块可明显区分并瞬间辨识而且还让“重构基因”这样寓意深刻的创新用意得以凸显, 那么图2 作者仅仅突出“逻辑”这个单词就已经十分巧妙地提示读者务必注意作者的语境是建立在亚里士多德和弗雷格两个人及其所代表的形式逻辑和数理逻辑两个等价的表述体系这样的双重基础之上的,进而也就自然而然地清晰地揭示出了该序位逻辑独特且精准的表述形式。举一反三是读书学习和做学问的基本功。因此,本文所展示的数字化进程在学术引领和产业支撑两方面均体现智能教育协同创新的特点。 参考文献 邹晓辉 , 邹顺鹏 . 双语信息处理方法及原理 . 计算机应用与软件 ,2015 , (11) : 69-76. 刘红晶 , 谭良 . 基于教师视角的 SPOC 课程知识地图建构方法研究 . 电化教育研究, 2017 , (9) : 64-70. 乔阔 , 肖世杰 . 学科知识图谱在建构中学英语课程图谱中的运用 . 现代交际 ,2017 , (18) : 155-156. 何靖 . 英语教学中计算机思维导图软件的作用分析 . 电脑迷 ,2017 , (10) : 44. 宗集 . 全面提高教育质量推进教育结构性改革 —— 教育部有关负责人就《国家教育事业发展 “ 十三五 ” 规划》答记者问 . 人民教育 ,2017 , (Z1) : 31-35. 国务院 . 国务院关于印发新一代人工智能发展规划的通知 .(2017- 07-20) .http://www.gov.cn/zhengce/con-tent/2017-07/20/content_5211996.htm. 邹晓辉 , 邹顺鹏 . 当代中国大学新使命:基于汉语思维与双语处理的文化传承和创新 . 南京理工大学学报(社会科学版) ,2012 , (5) : 106-113. 邹晓辉 , 邹顺鹏 . 软件工程学科何以独特 —— 形式化方法的双重路径 . 软件 ,2011 , (7) : 1-14. 作者简介: 邹晓辉 , 男 , 四川成都人 , 中美塞尔研究中心主任研究员 , 智能教育协同创新总课题组长 , 国际信息研究学会中国分会人工智能专业委员会副主任 、 教育信息化专业委员会委员 ( 主任助理 ), 研究方向为语言、信息与智能科学 。 http://mp.weixin.qq.com/s/09uRAAe97Qgkw0ucCvGVdQ
个人分类: 学术研究|1897 次阅读|0 个评论
《语言科学的研究对象:从言和语的关系论中外语言的魂》
geneculture 2017-8-8 06:24
《语言科学的研究对象:从言和语的关系论中外语言的魂》作者:邹晓辉Geneculture2017-8-7晨5:16《汉字的独特性:由字和言的关系论古今汉语的根》作者:邹晓辉Geneculture2017-8-7晨5:16《汉字游戏:中文棋盘的棋子》和《字母游戏:英文棋盘的棋子》是与前面两部理论著作遥相呼应的实际应用(人机互动平台在语言文字的教学、研究、服务、引领社会发展、国际交流、文化的传承与创新诸方面体现超级双脑协作开发环境对人类智慧能力的发掘过程的实际作用、价值和意义)作者:邹晓辉Geneculture2017-8-7晨5:38记毕
个人分类: 学术研究|329 次阅读|1 个评论
经历“语言学、语言哲学、语言形式化”成为“语言科学”
geneculture 2017-8-4 05:05
言和语的关系及其应用:言即单音节(纯形式),语既有双音节又有多音节(纯形式),前者是语言科学的基本研究对象,后者是派生的,其学科性质是可用它衡量语言的形式化特征,例1,书面汉语即中文就是由纯形式的汉字和汉语所构成的,其文字特征是大字符,其语言的结构单位可划分为:言、辞、链、块、读、句、段、篇,其特点在言的内涵即字类可区分为:音、形、实(义)、虚(法)、象、释、用、解,例2,书面英语即英文则是由混音节的词和句来双向区分词组或短语以形成其内容理解与分歧化解的,word,phrase,sentence,非常简捷,其特点是三者都可在做进一步地分析并解构,由例1和例2可见其各自的基本概念体系和基本框架的区别特征,相应的方法体系也都可在其形式分析与解构的过程中发现其基本架构和方法特征。该理论与实际的结合可产生同时有利于人机双向的各类基本操作,既可在纯形式的分析方面做到全自动化计算与统计乃至各类基本比较,又可做到对其承载的义项做一系列的基本分析,三类双语联动机制的发现,蝴蝶模型与语言系统工程涉及的两大类形式化方略,尤其是双语信息处理的方法和原理的发明与发现,对于其应用的广阔前景尤其是三类双语联动处理机制的推广应用对人机双脑协作可产生的实际影响,对英汉或汉英双语(狭义的)、语文与算术(广义双语)、术语和俗语(另类双语)这样典型的三类双语协同处理与理解是是相当典型的,加之双字棋盘的应用,可让人们体会并感受到语言的无穷魅力。--邹晓辉Geneculture2017-08-04凌晨4:48
个人分类: 学术研究|331 次阅读|1 个评论
信息基本定律(三大法则或三个公式)为何就如此重要?
geneculture 2016-8-17 21:52
信息基本定律(三大法则或三个公式)为何就如此重要? 只要回想一下物质不灭定律与化学之父拉瓦锡与整个化学科学大厦建立的理论根基的重要性,也就自然可以明白其中的奥妙了。这里有一个思考题:为什么质量守恒定律对于化学科学的理论体系建立不可或缺? 何况还有一个包含生物学、化学和物理学等涉及能量基本定律对整个自然科学的理论体系大厦的建构所必须的根基作用、价值和意义(其重要性也是不言而喻的)。另一个思考题:没有能量守恒定律行与不行? 由此,就可推断在质量、能量、信息量三个最基本的科学量纲体系中现在所缺的最最基本的最最重要的究竟是什么?可以非常明确旳说,就是图1和图2两块黑板上今天邹晓辉用粉笔再次明确写下来的那些内容:
个人分类: Science Learning|968 次阅读|1 个评论
单音文言镇,词句组不定;混音白话惑,语类亦难分。
geneculture 2012-5-23 09:18
ZouXiaohui 8:46:57 《 言和语的关系及其应用 》 ——第三届全国语言教学研讨会余等两篇论文小结 单音文言镇,词句组不定;混音白话惑,语类亦难分。 注释 :汉语的单音节字类起于文言可视为对象语言,其各个义项的解释语言可以是词、句、短语或词组,它们都是言和语兼有的混音节故在白话中很难区分【语言学面临的第一大类基本问题】而令人迷惑,词类的区分也因兼类现象经常处于不确定状态而很难明确地加以划分【语言学面临的第二大类基本问题】。( 这两类问题在印欧语中也不例外 !。) ZouXiaohui 8:52:03 解决【语言学面临的第一大类基本问题】的 关键在于 形式化描述,涉及 “文”和“法”的关系 ; 解决【语言学面临的第二大类基本问题】的 要害在于 具体的用意,涉及 “意”和“义”的关系 。 两方面 均有“通用常识”和“专用知识”两个层次的一系列可细分 类型,涉及 “教”和“管”、“学”和“用”的关系 。 ZouXiaohui 8:55:54 我想用“单音文言镇,词句组不定;混音白话惑,语类亦难分”这首小诗把它们加以概括,作为修订后的通俗文章开头引子。 ZouXiaohui 8:56:52 为此,希望听听读者的意见——就算代表读者的一类想法吧。 ZouXiaohui 9:08:16 1. 言本为的 言,也是 文言的言 ,即 单音节字 。由于整个言 可视为 对象语言 类,故可说 一言以镇整个汉语的言即对象语言类 。 2.与言或字所不同的 词、句、短语或词组 三类外来语言类在形式上其实都是不确定的,即让人迷惑不解的,因为,解释语言的该三类形式均为 混音节的语 ,即:词语、语句、词组或短语,其中,仅就 词类的兼语 情形而论就可知其难以明确区分。 由此可见,语言学理论 最大的两类难题 在旧的语言学理论体系之中 是不可能解决的 。 新的 语言科学 基本框架及其 实践方略或基本技艺 因此有了进一步发展和普及乃至推广的大小前提——理论空缺和实际需要。
个人分类: 语言学基础研究|1 次阅读|0 个评论
什么是语言科学的研究对象——“言本位”从根上解决问题
热度 4 geneculture 2012-4-6 04:24
什么是语言科学的研究对象——“言本位”从根上解决问题
什么是语言科学的研究对象* ——“言本位”从根上解决问题 作者:邹晓辉(Geneculture)** 1.提出问题 索绪尔曾明确指出:语言学完整而具体的对象是什么呢?这个问题尤其难回答;后面我们还会分析其原因;这里我们只是强调这种困难。其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察;但是语言学不是这样的。*** 索绪尔既然已经认识到:其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察。那他为什么不把语言学的研究对象往这个方向或这个层次上引导呢? 2.分析问题 笔者认为:索绪尔及其后续各个方面的继承者均在对普通语言学的研究对象的取值和确信两个方面迷失了进一步前进的方向。 笔者凭什么可以这样说呢?仅以索绪尔区分语言和言语这一对范畴并至今还得到各派语言学家的一致认可,就足以说明索绪尔在对普通语言学的研究对象的取值问题上所取得的具有里程碑意义的成就和贡献,但是,同时也说明学界在这个问题上再前进一步多么困难。 笔者发现其中至少存在以下两个重要原因: 其一,是英语等西方语言以及受其影响现代汉语的词均存在一个不同于古代汉语的特点,即:词兼有言和语双重属性。这就是在形式上造成语言学研究对象不明确的一个根本性原因。 其二,是不仅索绪尔创立的普通语言学而且乔姆斯基创立的形式语言学均未深入研究过汉语的特点,而这正是可克服西方语言学的基本研究对象不明确的一个非常有效的切入点。 为什么会这样呢?笔者发现西方语言学的价值判断和置信假设共同造成了该局面。 首先,他们在价值判断上排除了汉语研究可对西方语言学做出实质性贡献的机会。 进而,他们在置信假设上确信了汉语研究可与西方语言学的进一步发展没有关系。 也就是说,他们几乎忽略了语言的共性是离不开语言的个性而独立存在这一事实。 尤其必须指出的是:弗雷格和塔斯基所探讨的价值(真值)与索绪尔所探讨的价值(即从经济学引入的可判断语言实体功用或意义——价值)以及它们在确立词语的用法或语法的取值等涉及义项的选择和句子成分的选择的价值(取值)之间,既存在区别又存在联系。其难点在于纯粹形式上的取值与夹杂着内容的选择均与语言使用者的态度即置信程度挂钩。 3.提出进一步的问题 在普通语言学建立之初,由于索绪尔确信:(其他科学工作的对象都是预先确定,然后才能从不同的角度加以考察;但是)语言学不是这样的。从而,导致普通语言学的研究对象长期仅限于语言和言语这两个层面,迄今为止的语言学乃至言语学(虽然暂时还没有此学说但是的确已有此探讨)发展几乎均未突破这两个研究对象的边界。 既然学界早已认识到科学工作的对象能否预先确定是同行之间是否能够合理分工并高效协作从不同的角度来考察或探索同一个研究对象的根本性问题,而且,经过百年探索之后至今还仍然是众说纷纭的这么一个仅有其外在建制而其内在建制仍未建立起来的学科,难道不应该从根上反思一下其问题所在吗?以往语言学界确信的研究对象,为何不能再换一个思路来进一步重新细分一下呢? 4.进一步分析该问题 首先,仅就价值判断而言,虽然索绪尔早已发现语言是一个价值系统,但是,他却未能把可从经济学引入语言学的价值与可从数学引入语言学的价值以及可从逻辑学和化学引入语言学的价值之间的相互关系理顺。这就是本文强调的第一个问题,即:取值问题。 本来早就可以沿着这条路径开辟出一条自然语言理解的间接形式化通途,但是,却由于学界在价值判断和置信假设两方面的错误一而再再而三地给耽误了,因为,学界确信了错误的判断和假设。于是,不仅迷失了语言科学进一步精准发展的研究对象,宏观上说就是混淆了语言符号形式与思想内容以及两者的物质载体乃至支配三者的序位关系四个“类”的界限,中观上说,是学科性质尤其是在学科交叉研究领域的划界时常出现张冠李戴的错误,微观上说,是学界至今仍未确立汉语的“言和语”这一可间接形式化处理与理解的方略在普通语言学和形式语言学中的地位。    接着,仅就置信假设而论,尽管弗雷格早就提出与价值判断密切相关的置信或确信的问题,但是,它却仅限于对真值判断问题以及间接引语置信问题的探讨。这正如前面所说,价值这个词语的用法或义项在不同领域或从不同学科背景来看具有不同的含义,因此,置信或确信什么?也就不能不影响取值。这就是本文强调的第二个问题,即:确信问题。 5.从根上解决问题 普通语言学的研究对象究竟是什么?或者说,什么是语言?它主要指什么?可否进一步区分为言和语?为什么不能在英语的言与汉语的言之间划等号?    索绪尔曾尝试性地回答了前面三个问号,他不仅区分了语言和言语,而且还指出了语言是一个价值系统,为学界系统分析其中音义结合的词素、单词、词组、句子等结构单位指出了方向。从而,开创了科学探讨语言学的先河。 汉语的情形很特殊,因为在文言中根本就没有印欧系语言的词素、单词、词组、句子那样的结构单位,只有偏旁部首、字、辞、链、块、读、句这样的结构单位。 白话文及现代汉语引入印欧系语言的结构单位造成了多次本位转移或本位之争,其中最典型的是马建忠、黎景熙、朱德熙和徐通锵教授等人提出的本位学说。 笔者提出“言”和“语”两个系列的细分价值系统,指出两者的区别在置信而联系却在取值。例如,如果假设英语的言是词(实质上词兼具言和语双重属性),汉语的言是字,那么,英语的语就是词组与句子,汉语的语则是字组1(即:辞、链、块)与字组2(即:读、句)。从普通语言学的基本研究对象“言”及其取值角度来看,说英语与说汉语的社团可视为对英语的言即词与汉语的言即字分别置信的社团。而从普通语言学的派生研究对象“语”及其取值角度看,说英语与说汉语的社团可视为对英语的语即词组与句和汉语的语即字组1(即:辞、链、块)与字组2(即:读、句)分别置信的社团。 这样,就可得到以英语与汉语为例的普通语言学研究的言和语两个系列的细分价值系统,即作为基本符号对象的普通语言学的基本研究对象“言”及如何取值与置信的细分价值系统;和作为符号组合解释的普通语言学的派生研究对象“语”及如何取值与置信的细分价值系统。 图1 言(Yan)和语(Yu)的关系 由图1可见以汉语为例的普通语言学研究可区分两类基本研究对象,然而,以英语(或其他印欧系语言)为例的普通语言学研究却必然遗漏文言的字这样的研究对象。 鉴于白话及现代汉语的词属引进的语言结构单位,故被纳入区别于字的另一类语言结构单位。在以汉语为例的普通语言学的研究对象之中,言具有基本结构单位的地位,简称:言本位。 采用“言本位”这种语言观,不仅可克服以汉语为例的普通语言学研究中其他几种本位说的错误、缺点或不足,而且还可为一种崭新的机译策略奠定语言理论基础,并且也可为语言学迈向语言科学进一步发展奠定形式化处理的基础。 因为,现代汉语必然传承古代汉语的精髓“言本位”,即使引入西方语言(混音节词)形式上混沌即兼具言和语双重属性的所谓“词本位”也掩盖不了汉语形式上清晰即言(单音节字)和语(双音节及多音节的字组)截然分明的本质特性。 参考文献 : 邹晓辉.语言的取值与置信——对语言学研究对象的哲学分析.“语言与价值”国际学术研讨会(2011北京师范大学)论文集,2011;文集双语版,牛津大学出版社,2012 注释 : * 本文是直接从《语言的取值与置信——对语言学研究对象的哲学分析》节选重组而成的短论。仅有极少数涉及文本文字和文体格式上的调适,论点、论据、论证等实质性内容和系统的语言表达风格均无改变。 ** 2000年至2005年邹晓辉由北京大学中文系徐通锵教授一步一步地带入以汉语为例的普通语言学基础研究领域,邹晓辉的研究重点是字与词的关系以及基于双语信息处理的汉语字与字组的计算机辅助分析。分别于2004-2011年期间参加新加坡、北京、青岛、厦门大学(注:此前会议仅是文章上了会议论文集);西班牙、上海、哈佛大学、加州伯克利大学的一系列学术交流,并且发表了相关研究成果,同期,还申请了着重于汉语形式化技术处理的发明专利(2010101752962)。 *** What is both the integral and concrete object of linguistics? The question is especially difficult; later we shall see why; here I wish merely to point up the difficulty. Other sciences work with objects that are given in advance and that can then be considered from different viewpoints; but not linguistics. 【 这一条答复,也可用于回答:科学网读者 】 “ 北大中文论坛 www.pkucn.com 汉语语言学 什么是语言科学的研究对象——“言本位”从根上解决问题 ” http://www.pkucn.com/viewthread.php?tid=277927page=1extra=page=1 (一贴出来不久也很快就有人留言) 原帖由 汝南 于 2012-4-6 09:18 发表 http://www.pkucn.com/images/common/back.gif    这个论文节选很好,想来是反映出了语学界动态的 。至于说论文针对“字本位”和“词本位”而 又新提出“言本位”,由于是第三方观点 ,就不便请教了。只想借此请问一下楼主,不知能否介绍一下 语言里“本位”到底是指 ... 邹晓辉Geneculture答复 如下: 语言学只有摆脱主观臆断的干扰,才能走上科学化道路 。 “本位”这个辞语有两个义项 ,其一由金融学的“金本位”截取并借用到语言学的“词本位”、“句本位”和“短语本位”;其二就是徐通锵教授的《语言论》以及《基础语言学教程》所述的汉语的基本结构单位,即: 字是汉语的基本结构单位,这样的说法被其弟子中对立的两派师生简称为“字本位”。 言,在形式上,就是:单音节字;在内容上,言的每一个义项 都是由双或多音节的语来同义并列地加以表述的。 因此,如果仅仅从内容上来看,它不仅与单音节的词素(即语素)而且也与单音节的词甚至还与独字句均有相似之处。所以,为了避免歧义,在言和语的关系这一问题的研究上,仅限于音节的数量形式这样的可区分标志。由此可见,无论是单音节的词素(即语素)、单音节的词、单音节的独字句,还是这三者的双或多音节的形式,以及双或多音节的词组或短语,都不可能独立充当:言,单音节的字。 因为,词素(即语素)、词、句,作为三个类,均在相同的概念之下可兼有言和语双重属性。只有双或多音节的词组或短语,仅仅属于语这个大类。同时,也只有单音节的字,仅仅属于言这个基础类。这样的表述是很明确且相当清晰的。 只有基于这样的可形式化的无歧义的表述,才有利于语言科学内在学科建设的进一步发展。只有摆脱主观臆断的干扰,才能走上科学化道路。 附录 : 字与词的义项分析 摘要:本文回顾了汉语研究的几次“本位”转换,认为这就是前辈在探寻汉语理论体系建构的逻辑起点。如果必须在字与词之间做出选择,那么,赵元任“字是中国人心目中的中心主题”的论断,以及徐通锵“‘词’不能代表‘字’而成为汉语的一种基本结构单位”的论断,都选择了字。而之前,其他人分别选择了词(马建忠1898)、句(黎锦熙1924)、词组(朱德熙1982)。这是为什么呢?难道赵、徐两位语言学教授都不懂字和词的常识性义项吗?显然不是。他们是根据学术直觉作出上述断言的。有没有可支持他们这种学术直觉背后的学术性义项呢?这是笔者提出的问题和思考。本文从宏观的类与微观的例两个层面多个角度,分析了字与词的学术性义项,发现常识性义项往往是造成非学术性争议的起因。本研究采用史论结合形式和学术分类方法,通过对“语”与“字”两个亚系统的二八分类,凸显了音节、字、言“迭交”的特点,得出了“汉语就是组字成语的典例系统”的论断。陆俭明、冯志伟都说如果字本位换成语素本位,也就不会有人再反对字本位了。因此,为避免字本位提法所引起的非学术之争,与其说字不如说言是汉语的基本结构单位,从而便于我们集中精力论述字素关系(周上之)、字词关系(潘文国)、字语关系即言和语的关系(邹晓辉)几组术语及其关系(这是字本位内部尝试统一认识的努力之一)。 关键词:普通语言学、形式信息学、汉语形式化、汉语研究的逻辑起点、字本位、言本位
个人分类: 语言学基础研究|8380 次阅读|9 个评论
明确两个具有大小前提作用的信息基本定律
geneculture 2012-3-10 19:46
明确两个具有大小前提作用的信息基本定律
修改: 明确两个具有大小前提作用的信息基本定律 提交时间:2012-03-10 19:40:18 提交用户:geneculture 明确两个具有大小前提作用的信息基本定律 作者:邹晓辉 中国地质大学(北京)高等教育研究所研究员 中美双语信息处理塞尔研究中心( PDF016.PDF ) 筹建处 主任 1. 引言 仙农通信数学理论 、图灵的可计算数理论 以及克莱尼星号表达的字符串形式理论 可为本文论证信息基本定律的存在提供形式化检验的基础和背景知识。 为避免歧义,以下论证仅采用比特信息、算术语言和机器语言三位一体的二进制数,其目的在于明确两个具有大小前提作用的信息基本定律。 2. 第一信息基本定律,即:比特定律 从字符串形式理论到理想分类集的划分,即通过定义 0-3 ,证明比特定律的存在。 定义 0 :把克莱尼星号( Σ* )表示的字符集 {ε , 0 , 1 , 00 , 01 , 10 , 11 , 000 , 001 , 010 , 011 , …} 定义为 “ 杂多集合 ” ,其中, “ 杂 ” 描述其性质复杂; “ 多 ” 描述其数量巨大。 定义 1 :把定义 0 的单一元素( 0 )和( 1 )抽取出来构成一个最简单的集合,即: {0,1} ,并定义为 “ 单一集合 ” ,其中, “ 单 ” 仅 描述其元素性质简单; “ 一 ” 仅 描述其元素数量唯一。 定义 2 :把定义 1 所述 “ 单一集合 ” 的元素( 0 或 1 )按其个数逐一排列并逐层递增,构造系列进化阶梯的层次形式,简称 “ 进阶层式 ” ,即: {0,1} ; {00,01,10,11} ; {000,011,010,001 , 100,101,110,111} ; ... { ... } ,并定义为 “ 分层集合 ” ,其中,进阶层式就是分层集合的子集。 定义 3 :根据某个标志,如:( 0 ),( 1 ),( 01 ),( 10 ), ... ,即可由用户(自然人)或其代理(计算机)从定义 1 所述的单一集合和定义 2 所述的分层集合中选取各个进阶层式成员,即涵盖上述某个具体标志的那一系列成员的集合,即可重新组成的 “ 标志集合 ” ,如:含( 0 )这个标志的集合 {0,00,000 , ...} 或含( 1 )这个标志的集合 {1,11,111,...} 。这是用户可选择的。 根据以上理想分类集 蕴含的比特信息系统的序位法则可由言和语的划分而一目了然。 图 1 计算机语言即二进制数与自然语言如汉语的统一理论模型示意图 由图 1 可见,单一集合 {0,1} 与分层集合( LS )构成的理想分类集是从杂多集合( Σ* )中抽取出来的,通过言( Yan )和语( Yu )的划分,明确了语言科学研究对象,把描述基本关系( Fundamental Relation )的单一集合( Single Set , SS )与逐层描述其衍生关系( Derivative Relations )的分层集合( LS , Layered Set )及各个进阶层式蕴含的所有元素的排序定位关系(简称:序位关系)所具有的唯一性和守恒性的存在清清楚楚地揭示了出来。 第一信息基本定律,即:比特信息基本定律,就特指这个采用世界上最简单的二进制数或机器语言描述的比特信息系统的法则,一个最最基本的法则,即:序位关系,唯一守恒。 定义 1 和定义 2 所描述的两类理想集合,其元素以及进阶层式的成员之间的关系,满足 “ 序位关系,唯一守恒 ” 法则。它对定义 3 所描述用户做出的任何选择都具有大前提的作用。 由于计算机语言即二进制数与自然语言如汉语的统一理论模型揭示的仅仅是其类与类的关系,其例与例的关系是不能直接相互转换的,因此,还需要小前提帮助实现例的转换。 3. 第二信息基本定律,即:等价定律 从简单的并行图灵机到特定的孪生图灵机是一个质的飞跃。它可验证等价定律的存在。 图 2 从并行图灵机( a )到孪生图灵机( b )及其典型示例( c )收敛关系示意图 由图 2 可见,并行图灵机( a )、孪生图灵机( b )和以汉语的单音节字为言的一个典型实施例而建构的一个实用的孪生图灵机( c )之间的收敛关系。用关系式( a≥b≥c )来描述这三个计算模型组成的协同智能计算系统具有的双重属性,即:可收敛性(用大于符号表示)与可转换性(用等价符号表示)。换一句话说,就是在世界上最简单的二进制数或机器语言、十进制数或一种典型的算术语言、处理序位关系的超级语言、汉语的言或自然语言之间建构广义的双语并行处理的协同智能计算系统的原型,左右对称的虚拟表( VTL 和 VTR )。 第二信息基本定律,即:等价信息基本定律,就特指孪生图灵机( b )蕴含的等价信息系统所遵循的基本法则,即:同义并列,对应转换。其特例是:同意并列,对应转换。 图 3 可称量其两端的线性计算与多元选择的虚拟天平示意图 由图 3 可见,计算机的数字计算与自然人的多元选择均可由中间的这个虚拟天平来称量。在此,虚拟天平的标准化砝码是数字,而非标准或个性化选择则是待称量的多元信息。 咋一看,很难理解。因为仅仅依据小前提(即第二信息基本定律)当然是不够的,必须把其中隐含的大前提(即第一信息基本定律)也找出来与之配套使用才可行。 因为在 “ 同义并列,对应转换 ” 法则中的 “ 义 ” 所表达的就是唯一守恒的 “ 序位关系 ” 。也就是说,两个法则结合条件是它们共同蕴含 “ 义 ≥ 意 ” 的基本关系或原理。 举例来说,如果图 3 的 {id} 是序号、 {ge} 是位置,那么,只认识二进制数的计算机就可通过二进制数与十进制数之间的算术换算法则间接识别 {id} 序号,同时,还可间接识别各种类型的 “ 字、式、图、表、音、像、立体、活体 ” ,条件是用户要把自己选用的那一部分放入相应的 {ge} 位置,这样就可能实现计算机系统与自然人用户之间的某种默契或协作乃至协同。 通俗地说, “ 序位关系,唯一守恒 ” 法则,作为大前提,实际上规定了所有的 {id} 序号; “ 同义并列,对应转换 ” 法则,作为小前提,则具体指出了被用户选择实际占用的序号。这样,不管用户究竟选用 “ 字、式、图、表、音、像、立体、活体 ” 的那一种具体形式,都可以通过其所在位置及其对应的序号而实现测序定位 —— 这就是结果同时也是结论。 换一句话说,依据这两个定律或法则,就可采用 “ 编号排位 ” 的方式建构具体的协同智能计算系统,而使用它的基本方式则是采取相应的 “ 对号入位 ” 的措施。 4. 结论 综上所述,如果序位关系唯一守恒是大前提,那么,同义并列对应转换就是小前提。基于此就可在 “ 机际、机人、人际 ” 一系列双语之间实现 “ 协同智能计算 ” 。从而为设计或建构各种具体的 “ 孪生图灵机 ” 或 “ 协同智能计算系统 ” 奠定理论基础。 其 意义 是多方面的,例如,在理论上根据序位定律可优化数理逻辑的基础,即可对悖论产生的范围做科学判定;又如,在实践中,根据序位定律和等价定律,可预言并形成有效的协同智能观和相应的融智方法论及各种各样的协同智能计算系统。再如,从理论与实践结合及互动的角度不仅可把信息学、语言学、教育学(尤其是高等教育学)和哲学等特殊且复杂的研究领域长期存在的基础理论问题共同根基或关键问题找出来,而且,对高等教育所涉及的整个人类知识领域与高等教育学及高等教育管理学等特殊而复杂的研究领域之间在理论上隐含的悖论和在实际中表现的冲突也可作为一个长期未被认识的关键问题找出来 。 其应用价值还在于:这种具有 “ 协同智能计算系统 ” 特征的孪生图灵机( b )兼有图灵机和自然人双重技能,即:它不仅可计算线性排列的无歧义的数字(形式信息),而且,还可处理多元智能有歧义的知识(内容信息) —— 未知的情报(专用术语)或消息(通俗用语)。 实际应用中,由于存在 “ 义 ≠ 意 ” 的情形,也就是存在歧义,因此,第二信息基本定律的应用是有条件的,即: “ 义=意 ” 。也就是说,大前提和小前提乃至结论都要保持一致。 参考文献 Shannon, C.E.A Mathematical Theory of Communication . Bell System Technical Journal. Volume 27, Issue 3,July - Issue 4, October 1948 A. M. Turing. On Computable Numbers, with anapplication to the Entscheidungsproblem , Proceedings of the London Mathematical Society. Second Series, 42, 230-265, 1936. 235 Bryant, Randal E.; David, O'Hallaron (2003), Computer Systems: A Programmer's Perspective (2003 ed.), Upper Saddle River, NJ: Pearson Education, p. 40, ISBN 0-13-034074-X, 邹晓辉 , 邹顺鹏 . 间接计算模型与间接形式化方法 . 软件 2011,32 (5) : p1-6. 邹晓辉,邹顺鹏 . 一种基于双语自动转换的间接形式化方法 .2010 ( 2010101752962 ) 邹晓辉 , 邹顺鹏 . 协同智能计算系统 —— 理论模型及其应用 . 软件 2011,32 (6) : p1-8 邹晓辉 , 邹顺鹏 . 软件工程学科何以独特 —— 形式化方法的双重路径 . 软件 2011,32 (7) : p1-14 Zou ShunPeng; Zou XiaoHui; Liu ZhiFang.The Nature of College Education and College Management .Proceedings of 2010 Conference on Higher Education Development . Deguang Yang. London Science Publishing, 2010 Zou Shunpeng; Zou Xiaohui; Liu Zhifang. The Overlapping Model of Education and Management. . ISSN 2160-147X, MSE (2011) Zou Xiaohui. Value-Taking and Confidence-Building of Language. AAAS General Session 2012 http://aaas.confex.com/aaas/2012/webprogram/Paper7342.html from: 我的稿件查看详情----中科院科学智慧火花.rar 我的稿件查看详情----中科院科学智慧火花_files.rar
个人分类: 信息学基础研究|50 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 22:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部