科学网

 找回密码
  注册

tag 标签: Generalized

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

一篇不错的MHD文献-Generalized MHD equations
cynosure 2016-5-7 00:51
http://www.sciencedirect.com/science/article/pii/S0022039603002341 全文链接: http://ddl.escience.cn/f/xNOB 里面关于磁场的理解比较透彻。
个人分类: what i support|2226 次阅读|0 个评论
Basic Law of Information
geneculture 2015-2-27 20:10
ISIS Summit Vienna 2015—The Information Society at the Crossroads : Conference Track: China and the global information society Basic Law of Information:the Fundamental Theory of Generalized Bilingual Processing Xiaohui ZOU * and Shunpeng ZOU * http://in.linkedin.com/pub/xiaohui-zou-邹晓辉/37/46/158 23 February 2015 Abstract The purpose of this paper is generally to introduce the basic law of information. The method is: the generalized bilingual information processing, especially by comparing the two kinds of formal strategy, on the one hand, inherited 'language understanding, knowledge representation, pattern recognition' software engineering approach, on the other hand, to create 'generalized bilingual, knowledge ontology, bilingual programming' systems engineering strategies. The result: standardization and personalized or diversified combination of three aspects, to achieve the best effect of human-computer interaction. Its significance lies in: the Turing test based on English - with Turing computability thesis - view of strong artificial intelligence, the Turing test based on Chinese - with Searle “Chinese room” argument--view of weak artificial intellignence, the two extremes of thesis, both can be seen as the Turing test based on generalized bilingual - as two exceptions within Xiaohui “double chessboard” thesis, thereby, underline the view of basic law of information, and its practical application value. Keywords Information Law,Artificial Intelligence,Human-computer Interaction,Generalized Bilingual Processing 信息基本定律--广义双语处理的基础理论 1.引言 本文旨在通俗地介绍信息基本定律--广义双语处理的基础理论。 其中双语涉及三类:狭义双语,如中英文;另类双语,如术语和俗语;广义双语,如数学语言(算术数字)和自然语言(汉字)。 双语信息处理方法由人际、人机、机际、机人之间一系列双语转换步骤所组成,遵循三大信息定律。其核心困难是翻译和机译中如何化解歧义,这也是本文的焦点。 2. 方法 通过广义双语信息处理,尤其是通过比较两大类形式化方略,一方面,继承“语言理解、知识表达、模式识别”软件工程方略,另一方面,创造“广义双语、知识本体、双语编程”系统工程方略。 本文在两大类形式化方略的研究基础之上,暂时抛开以往形式化路径等技术问题而只讨论我们对比研究的结果,即:“广义双语、知识本体、双语编程”的系统工程方略。 下面重点介绍可操作的三个基本步骤及其配套的三个模型及其理论依据,涉及宏观微观贯通的两类实例。 步骤1及模型1:笔者提炼的汉英翻译蝴蝶模型是在韦弗和沃古瓦的研究成果基础之上发展出来的。前人曾设想基于统计和规则的机译存在中间语,笔者发现事实上没有,最多可以说一系列双语对中的一个可作为“中介语”,关键是双语对的建构。 步骤2及模型2:笔者提炼的知识和常识“双识”本体模型,从总体上优化了人类认知发展与知识积累进程的几个基本范畴,包括最基本的定性分析的“语义三棱”和细化的定性分析“三跨划分”。前者描绘出整个人类知识体系。后者则在跨学科、跨领域、跨行业的术语即知识细分体系之间内架起一道桥梁。 步骤3及模型3:笔者建构的三类双语信息处理系统即“协同”模型,其中广义双语微观操作模型及其实用的关系数据库,可结合索绪尔曾把语言系统比喻的“棋”以及维特根斯坦曾比喻的“语言游戏”,同时再结合模型1和2,即可形成三类双语的超级“棋”和大跨度的“语言游戏”,各式各样的歧义均可在此进程中,遵循三大定律而逐步化解。 3. 结果 其结果是:标准化与个性化、多元化、多样化三方面的结合,达到最佳的人机交互效果。 信息基本定律A“序位关系,唯一守恒”即Id=n n; 信息基本定律B“同义并列,对应转换”即Id=Ik+Iu; 信息基本定律C“同意并列,对应转换”即Ik+Iu=∑m m。 三类双语转换模型1-3与三大信息基本定律ABC之间的关系:A3B;1C2。 广义双语信息处理方法的有效性在于:不仅在人际、人机、机际、机人之间,而且在三类双语之间,都做到了合理分工、优势互补;高度协作、优化互动(16字方针)。 4. 结论 其意义是图灵“可计算性”论题和塞尔“中文房间”论题可被视为晓辉“双字棋盘”论题的两个特例,从而突显信息基本定律及其实际应用价值。 其意义可进一步描述如下: 从理论上开阔思路: 可兼容形式信息论的收敛性与语义信息论的开放性。前者的特点是形式化和可计算;后者的特点是多样化和复杂性。 在实践中发挥作用: 采用广义双语信息处理方法可超越强弱两派的人工智能观点,在三类双语协同处理的系统中实现精准的机器翻译。这是普通的自然人和单纯的计算机都分别做不到的。 可以说,发现了三大信息基本定律就明确了“三类双语”协同互译的依据;实现了广义双语信息处理,也就证明了三类双语协同互译机制存在。它们之间是互为因果的关系。
个人分类: 学术研究|1068 次阅读|1 个评论
Mining Frequent & Maximal Reference Sequences with GST
xiaohai2008 2011-10-18 13:59
Web usage mining (WUM) is the type of Web mining activity that involves the automatic discovery of user access patternsfrom huge Web access logs. In this study, we analyze deeply generalized suffix tree data structure in WUM situations andexplain in detail the reasons why a linear-time traversal on the generalized suffix tree can obtain frequent referencesequences. The key point is that due to the special nature of transactions, for each internal node v, the total number ofleaves in the sub-tree of v is exactly the number of distinct (navigation-content) transaction identifiers that appear at theleaves in the sub-tree of v. After that, with the help of generalized suffix tree, an algorithm on mining maximal referencesequences is proposed. Experimental results indicate that our approach is feasible and has good scalability. 原文见: 2010_6_7_2187_2197.pdf
个人分类: 日志挖掘|2879 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 20:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部