科学网

 找回密码
  注册

tag 标签: 一般形式

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

Zenas 公理的一般形式
热度 4 zlyang 2019-4-13 20:52
“起初,真理不是在多数人手里,而是在少数人手里。” “不做调查没有发言权。”“不做正确的调查同样没有发言权。” “要始终实事求是,勇于直面问题,随时准备坚持真理,随时准备修正错误。” http://www.qstheory.cn/llwx/2018-12/11/c_1123834759.htm 只有蠢人,才是他一个人,或者邀集一堆人,不作调查,而只是冥思苦索地“想办法”,“打主意”。须知这是一定不能想出什么好办法,打出什么好主意的。换一句话说,他一定要产生错办法和错主意。 毛泽东,《反对本本主义》,一九三○年五月, http://www.qstheory.cn/books/2016-08/24/c_1119448591_7.htm Zenas 公理的一般形式 一、 Zenas 公理的一般形式 ( 1 )科技发展,具有独立于人类而客观存在的规律性。 ( 2 )同行评审,是用“旧知识”去评“新知识”,从而具有阻碍创新的天然特性。 ( 3 )大量的历史经验表明: 新领域大多由拿小钱或不拿钱的人开创 , 钱堆不出创新。 二、Zenas 公理的初始形式 Top Journals do not publish Top Results in science and technology. 顶级期刊不发表顶级的科技成果。 相关链接: 张志东,2008-01-05,Top Journals 是标准吗-1 精选 http://blog.sciencenet.cn/blog-2344-13949.html Zenas 公理的初始形式 2012-05-03 科学网—Top Journals 是标准吗-1 .pdf 2018-10-20,千万不要“诺奖基金之三:基金的评审与经费预算” http://blog.sciencenet.cn/blog-107667-1141864.html home.php?mod=attachmentfilename=id=358274 2017-06-18,Zenas 公理:2017年继续领跑世界! http://wap.sciencenet.cn/blog-107667-1061527.html 感谢您的指教! 感谢您指正以上任何错误! 感谢您提供更多的相关资料!
个人分类: 科学 - 艺术 - 本质|888 次阅读|29 个评论
一篇研究论文的一般形式- LetPub SCI论文写作系列10
热度 1 LetPubSCI 2014-2-13 17:40
组织一篇研究论文的目的是让人选择性的阅读你的作品。当我调查一个主题时,我可能只是对它的方法,一个特定的结果及其解释感兴趣;或者我只是看论文的摘要,以确定它是否和我的研究相关。为此,许多杂志要求下面的部分按顺序呈现出来,每部分开始新的一页。这当然也有例外。一些期刊要求结果和讨论合并在一起,或者在论文的主体后面列出材料和方法。著名的杂志《 Science 》 要求除了摘要,全部去掉独立的部分。 一般形式 特定的编辑对一份提交的论文手稿的要求总是遵循下面的一般原则。 ( 1 )使论文具有可读性 打印版或电子版使用12点标准字体,如Times, Geneva, Bookman, Helvetica等; 文本应在8 1 / 2“×11”纸上,双倍行距,页边距1英寸,单面; 页码为连续性; 在新的一页上开始每个新的部分; 遵循页面推荐的范围。 ( 2 )要避免的错误 标题放在页的底部,下一个主题放在下一页(插入一个分页符!); 将一个表或图分开——应将每个图或表限制在一页上; 未按页码顺序提交你的论文。 ( 3 )在你论文的所有部分中 使用正规的语调包括冠词(“a”,“the”等); 专注于文章的研究主题; 使用段落分隔每个重要的观点(摘要除外); 每段的第一行缩进; 按逻辑顺序呈现你的观点; 使用现在时态报道公认的事实——例如,'the grass is green' (“草是绿色的”); 用过去时态描述具体的结果——例如,'When weed killer was applied, the grass was brown' (“当使用 除草剂,草就变成棕色”); 避免非正式用语,不要直接称呼读者,不要使用行话,俚语,或最高级; 避免使用多余的图片——只包括呈现结果所需要的那些图表。 1. 标题页 在你写作组合包的例子中选择一个如所示例子所阐述的信息量大的标题。包括所有作者的名称(S),地址(ES),和提交日期。例如,“生物实验室# 1”不是一个信息量大的标题。 2. 摘要 摘要应在二百字或更少。可参考写作组合包中的例子。 ( 1 )一般目的 摘要是一个简洁的段落,以总结已完成的工作或工作进展。在一分钟或更少时间读者可以了解研究背后的基本原理,解决问题的一般方法,相关的结果,和重要的结论或新的问题。 ( 2 )撰写 摘要 全文的其余部分完成后再写摘要。毕竟,你如何能总结出一些尚未被写的东西?节省字数在整篇文章是非常重要的,尤其是在摘要。然而,为了简洁使用完整的句子并不牺牲可读性。你可以在语句上保持简洁以使他们用于不止一个目的。例如,In order to learn the role of protein synthesis in early development of the sea urchin, newly fertilized embryos were pulse-labeled with tritiated leucine, to provide a time course of changes in synthetic rate, as measured by total counts per minute (cpm). (“为了研究蛋白质合成在海胆早期发育中的作用,新受精的胚胎用氚标记的亮氨酸进行脉冲标记,提供一种合成率变化的时间过程,并用每分钟的总计数进行测量(CPM)。”)这句话在一个句子中提供了整体研究问题,方法,和分析类型。作者可以直接总结结果。 总结研究结果,在任何摘要中包括以下内容。尽量保持前两项不超过一个句子。 研究的意图——假设,整体问题,目的; 模型生物体或系统和实验的简要描述; 结果,包括具体的数据——如果结果是定量的,报告定量数据;结果的任何统计分析也需要报告; 从实验中得到的重要结论或问题。 格式 一个段落,简洁; 作为总结工作,总是用过去时态; 摘要应该是独立的,而不是指文章中,如图形或表格的任何其他部分; 专注于总结性的结果——如果绝对必要,将背景信息限制在一个或两个句子中; 你在摘要中报告的内容必须与你文章中的一致; 拼写正确,句子和短语清晰,以及对数据的适当报告(适当的单位,有效位数)在摘要和文章的任何其他地方是同样重要的。 3. 引言 你的介绍不超过两页(双倍行距)。参考写作组合包中的例子。 ( 1 )一般目的 引言的目的是让读者了解研究背后的基本原理,以支持它的研究意图。它主要是展示你研究的理论背景,使读者了解和欣赏你的研究目标。 ( 2 )撰写引言 摘要是研究论文中唯一一个不为了区分主要观点使用多个段落的部分。写作方法有很大不同,但是为了我们的研究下面的方法可以产生有用的引言。 描述研究的重要性(意义)——这个为什么值得首先提出来研究?提供一个广阔的背景; 保卫模型-你为什么使用这个特定的生物体或系统?它的优点是什么?你可以从理论的角度评论它的适用性,以及表明使用它的实际理由; 提供理论依据。表述你的特定假设(ES)和目的(S),描述导致你选择它们的原因; 非常简要描述实验设计和如何完成既定目标。 格式 除了既定事实其他使用过去时态。毕竟,所有的工作完成后才提交本文; 组织你的想法,每个主要观点成一段。如果你有四个以上的观点,你至少需要列成四段; 只在需要为了支持你的态度时才需提出背景资料。读者并不想阅读你所知道的有关主题的一切信息; 确切清楚地提出研究假设/目的——不要过于简单; 一如既往的注意拼写,句子和短语的清晰性和适当性。 4. 材料和方法 没有页数的限制,但一个关键点是保持这部分尽可能简洁。人们会选择性阅读这部分。读者可能只是对一个公式或程序步骤感兴趣。材料和方法可以在这部分被单独赋予副标题进行描述,也可以结合在一起。 ( 1 )一般目的 这应该是写作最简单的部分,但许多学生误解了它的意图。其目的是记录所有的特殊材料和一般程序,让别人可能在另一个研究中使用部分或全部方法,或判断你工作的科学价值。它不是一步一步描述你所做的一切,也不是一个方法的一组指令,也不是在讲故事。顺便说一下,你的笔记本应该包含你所需要这部分的所有信息。 ( 2 )撰写材料和方法 材料 只有在研究很复杂,想通过这种方式节省篇幅时才单独描述材料; 包括特殊的化学品,生物材料,和实验室不常见的设备或供应品; 不包括常见的用品如试管,移液管,烧杯等,或标准的实验室设备如离心机,分光光度计,移液器等; 使用特定类型的设备,一种特殊的酶,或来自一个特定供应商的培养方式,如果这些是实验成功的关键,那么它及其来源应该列出来,否则不需要; 材料可以作为一个单独的段落,否则他们可能会随着你的实验过程被列出; 在生物科学中,我们常常应用到溶液——应该指出他们的名字并进行具体描述,包括所有试剂的浓度,水溶液或非水溶剂的pH值。 方法 参考写作组合包中的例子; 描述方法(不是每一个步骤的细节都使用相同的方法); 完整描述方法,包括温度,培养时间等; 要简洁明了,主要叙述标题下特定步骤或程序组的方法; 概括——报告程序如何进行,而不是他们如何在特定的一天被具体执行。例如,报告samples were diluted to a final concentration of 2 mg/ml protein; (“样品稀释至终浓度为2毫克/毫升的蛋白质”);不要报道135 microliters of sample one was diluted with 330 microliters of buffer to make the protein concentration 2 mg/ml. (“135微升的样品用330微升的缓冲液稀释成浓度为2毫克/毫升的蛋白质”)。总是要思考什么才是和另一个机构中致力于他们自己的项目的研究者相关; 如果使用有据可查的方法,报告时写上方法的名称,也可以加上参考文献。例如,Bradford法是众所周知的。你不需要写出程序的全过程,你只要用Bradford法检测蛋白浓度,并确定你的标准即可。SDS-PAGE方法和生物学和生物化学中其他许多众所周知的方法也一样。 格式 记录不使用第一人称的方法时不合适也不可使用主动语态,这将使读者的注意力集中在研究者而不是研究工作。因此当写方法时大多数作者使用第三人称被动语态。 在这里和文章的其他部分使用常规的语调——避免非正式的,并使用完整的句子。 需要避免的 材料和方法不是一组指令; 省略所有解释信息和背景——保存它的讨论; 省略与第三部分无关的信息,如你用什么颜色的冰桶,或个人登录的数据。 5. 结果 本节的长度取决于展示数据的数量和类型。继续保持简洁,如果合适,使用图形和表格展示最有效的结果。看下面的建议内容。 ( 1 )一般目的 结果这部分的目的是介绍和阐述你的发现。让这部分完全客观的报告结果,并为讨论保存所有的解释。 ( 2 )撰写结果 重要提示 :你必须明确区分这些来源于原始数据或其他附件材料并且通常包括在研究论文中但不会被发表的资料。事实上,这种材料除非指导者的要求,一般不应提交。 内容 在文本中总结你的发现,如果合适,以图形和表格阐明他们; 在文本中描述你的每一个结果,将读者引向最重要的观察结果; 提供上下文环境,例如描述一个可由特定的观察方法来解决的问题; 描述对照实验的结果,包括不出现在正式的图或表中的观察 分析你的数据,然后以图形(图表),表,或文本的形式起草分析(转换)的数据。 需要避免的 不要讨论或解释你的结果,报告背景信息,或试图解释什么; 在研究文章中不包括研究的原始数据或中间计算; 不要不止一次地呈现相同的数据; 文本应补充的图形或表格,不要重复相同的信息; 不要混淆图形和表格——两者是有区别的。 格式 和往常一样,用过去式时描述你的结果,并按逻辑顺序展示每个结果; 在文本中用“图1”,“图2”等表示每个图;表格也一样(详见参考文本); 列出图形和表格时,以出现的先后顺序正确编号(从其他材料如原始数据,标准曲线,等中将他们清楚区分出来); 如果你喜欢,你可以把图形和表格放在结果这部分中适当的位置。 图形和表格 在结果文本中放置图形或表格,或放在报告后面(既紧随在引用文献后面); 如果将图表放在文章的最后,要确保将他们与任何附件材料,如原始数据明确区别开; 无论放在哪里,每个图形必须有连续编号和完整的标题(标题于图形下方); 无论放在哪里,每个表格必须有连续编号和完整的标题(标题及其描述在表格的上方); 每个图和表必须足够完整,它可以从文本中分开成为独立的部分。 6. 讨论 不同期刊的指南不一样。在生物化学杂志中版面很宝贵,作者被要求将讨论限制为四页或更少,双倍行距。这需要一个印刷页面。当你学习有效的写作,其限制将扩展至五页打印纸。如果你语句简洁,应该有足够的空间可以让你表述所有你想说的内容。 ( 1 )一般目的 如果允许,这里的目的是要用你实验的证据和普遍接受的知识为你的结果提供一个解释,并支持你所有的结论。研究发现的意义应该被清楚地描述。 ( 2 )撰写讨论 在讨论部分以适当的深度解释你的数据。这意味着,当你解释一个现象时你必须描述可以导致该现象的机制。如果你的结果与你的期望不同,你要解释可能发生了什么。如果你的结果与预期一致,要描述证据支持的理论。不可以简单地描述数据与预期一致,并让它落在那什么也不解释。 如果每个假说被支持或拒绝,或如果你没有信心下结论。不要轻易认为一个研究或研究的一部分为“无结果”而不进行考虑; 如果工作是不完整研究论文将不被接受。你能得出什么结论主要根据你有什么结果和是否把研究作为一个完整的工作; 你可能提出未来的发展方向,例如实验将如何被修改以实现其他目标; 尽可能解释所有的检测结果,关注机制; 判断实验设计是否可以充分证实假说,以及它是否可以被适当地控制; 如果存在合理的备选方案可尝试提供更多的解释; 一个实验将不能回答全部问题,所以要纵观全局,你下一步要往哪里去?最好的研究可开辟新的研究途径。还存在什么问题? 特定论文的推荐信将提供额外的建议。 格式 当你提到信息时,要将自己的研究结果和其他已发表或从其他学生获得的信息数据区分开(动词时态是为实现这一目的的一个重要工具); 描述特定的个人(包括你自己)所做的工作用过去时态; 指现在普遍接受的事实和原理用现在时态。例如,Doofus, in a 1989 survey, found that anemia in basset hounds was correlated with advanced age. Anemia is a condition in which there is insufficient hemoglobin in the blood. 在讨论中学生所犯的一个最大的错误是提出一个肤浅的解释,只是或多或少地重述结果。有必要说明的是为什么会出现这样的结果,关键是专注于结果背后的机制。 7.引用文献 需要注意的是,在介绍实验室课程,您将不需要记录你所有的信息来源。一个原因是你的主要信息来源于网站,而网站是不适合作为原始信息来源。第二,它为一百名学生提供平等的潜在参考材料是有问题的。你可能仍然发现外部资料,你应该引用教师提供的或你自己发现的文章。 在你的论文中引用列表中的所有文献,按第一作者的字母顺序排列。在一个适当的研究论文,只引用一次文献(原创者撰写的原创性研究论文)。需要小心的是将网站作为参考,任何人都可以发放网站上几乎所有的信息,你没有办法确切知道这是事实还是虚构。如果你引用一个在线杂志,使用期刊引证(名称,卷,年份,页码)。你的一些文件可能不需要参考,如果是这样只要简单标注“没有参考的意见”。 此文同步 刊载于 LetPub SCI论文写作辅导材料 : www.letpub.com.cn/index.php?page=sci_writing_10 LetPub 提供 专业英语润色 、 同行资深专家修改 、 专业SCI翻译 、 发表支持 www.letpub.com.cn
5333 次阅读|1 个评论
一般形式的EM算法学习
chenhao317 2012-12-23 13:50
一般形式的EM算法学习
先给出一般形式的EM算法问题定义。 给定一个训练集$ X=\{x^{\{1\}},\ldots,x^{\{m\}}\} $,根据模型的假设,每个我们观察到的$x^{i}$ 还对应着一个我们观察不到的隐含变量$z^(i)$,我们记$Z=\{z^{\{1\}},\ldots,z^{\{m\}}\}$, 我们希望拟合得到包含隐藏变量$z$的模型$p(X,Z|\theta)$ 中的参数$\theta$。 我们通过求最大似然$L(\theta|X)$来估计$\theta$的值。 \ 其中 \ 由于在对数函数中又存在加和,所以我们很难直接求导得到$\theta$的值。这里EM算法可以很好地解决这个问题。 首先,我们拆分$\log p(X|\theta)$,利用贝叶斯公式把它变形: \ 等式两边同时乘以$q(Z)$,并对$Z$求和 \ \] 因为$Z$与$p(X|\theta)$独立且$\sum_{z}q(Z)=1$,所以 \ 我们将其写作 \ 其中: \ \ 这里我们可以$KL(q||p)$(注1)描述了概率分布$q(Z)$和$p(Z|X,\theta)$之间的差别。由于$KL(q||p)\geq 0$,而且仅在$q(Z)=p(Z|X,\theta)$时等于0,所以$\mathcal{L}(q,\theta)\leq \ln p(X|\theta)$。因为$\mathcal{L}(q,\theta)$ 也包含了$X,Z$ 的联合分布,可以把它看做$\ln p(X|\theta)$ 的下界函数。 假设参数当前的值为$\theta^{old}$。 在E-step中,我们固定$\theta^{old}$,通过寻找$q(Z)$来最大化下界$\mathcal{L}(q,\theta^{old})$ 的值。这个最大化问题比较简单,因为变量只有$Z$, $\ln p(X|\theta^{old})$与$q(Z)$无关,所以最大值在$KL(q||p)=0$,也就是$q(Z)= p(Z|X,\theta)$ 时取得(这个同时也解释了为什么要用$Z$的后验概率去而不是别的概率求Z的期望值),此时$\mathcal{L}(q,\theta) = \ln p(X|\theta)$(如图1所示)。 在M-step中,我们固定$q(Z)$,通过寻找新的参数$\theta^{new}$来最大化$\mathcal{L}(q,\theta)$ 的值,通过增大下界函数$\mathcal{L}(q,\theta)$的值,来增大似然函数的值。因为概率分布$q(Z)$是用$\theta^{old}$决定的,当$\theta$改变之后,它将不再等于新的后验概率$p(Z|X,\theta^{new})$。因此$KL$散度也大于0.因此似然函数的增大将来自两个方面:下界函数的增大和KL散度的增大(如图2所示)。 然后我们不断运行E步和M步直到算法收敛。如图3所示,红色曲线(未知)是我们想要最大化的似然函数。在第一个E步,我们初始化参数$\theta^{old}$,然后通过它求得下界$\mathcal{L}(q,\theta^{old})$(蓝色曲线)。可以看到,下界函数在$\theta^{old}$时,为似然函数的正切线,所以两条曲线的梯度相同。注意到下界函数是个凸函数(参照国外convex function 定义),所以它有唯一的最大值。在M步中,我们通过${\theta^{new}}$来获取下界函数的最大值。然后在接下来的E步,我们重新构造一个下界函数(如绿色曲线所示),使得它在在$\theta^{new}$ 时,为似然函数的正切线。 我们不仅可以用EM算法估计最大似然值,还能求最大后验概率(MAP)。在给定先验概率$p(\theta)$ 的情况下,后验概率 \ 所以我们有 \ 这里$p(X)$为常数。 这里的EM算法: E-step:固定$\theta^{old}$,那么$\ln p(\theta^{old})$为常数,找一个分布$q(Z)$,使$\mathcal{L}(q,\theta^{old})$最大。 M-step:固定$q(Z)$,寻找参数$\theta^{new}$,使$\mathcal{L}(q,\theta^{new}) +\ln p(\theta^{new})$最大。 除此之外,如果 M-step中的最大化$\mathcal{L}(q,\theta)$的$\theta^{new}$也很难求的话,我们可以把要求放宽,并不一定要求出最大值,只要能够得到比$\theta^{old}$更好的结果就可以,这样的做法叫 Generalized EM (GEM)。 注: 1.KL散度,在信息论中称为相对熵,用于衡量两个函数或概率分布之间的差异程度。 性质如下: 1.$KL(q||p)\neq KL(p||q)$ 2.$KL(q||p)$越大,差异程度越大。当$p$和$q$完全相同时,$KL(p||q)=0$。 参考: 1.Pattern_Recognition_and_Machine_Learning
1785 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-11 02:35

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部