科学网

 找回密码
  注册

tag 标签: frequency

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[转载]GLONASS Frequency Channels
zhoufcumt 2013-10-7 09:13
对应的C++、C、Fortran、Python、Matlab源码可从 http://geodesy.cn/glonass/index.xml 处下载。 GLONASS Frequency Channels (GFC) are generated using data from official information of GLONASS. This file constains all latest data in the form of a set of date and frequency channels of 24 satellites. All satellites' frequency channels remain unchanged until the date in next set. It's not available if a satellite frequency channel is 99.
个人分类: 空间大地测量相关软件|2169 次阅读|0 个评论
[转载]Codon usage bias
syfox 2013-4-7 21:16
Codon usage bias refers to differences in the frequency of occurrence of synonymous codons in coding DNA. A codon is a series of three nucleotides (triplets) that encodes a specific amino acid residue in a polypeptide chain or for the termination of translation (stop codons). There are 64 different codons (61 codons encoding for amino acids plus 3 stop codons) but only 20 different translated amino acids. The overabundance in the number of codons allows many amino acids to be encoded by more than one codon. Because of such redundancy it is said that the genetic code is degenerate. Different organisms often show particular preferences for one of the several codons that encode the same amino acid- that is, a greater frequency of one will be found than expected by chance. How such preferences arise is a much debated area of molecular evolution. It is generally acknowledged that codon preferences reflect a balance between mutational biases and natural selection for translational optimization. Optimal codons in fast-growing microorganisms, like Escherichia coli or Saccharomyces cerevisiae (baker's yeast), reflect the composition of their respective genomic tRNA pool. It is thought that optimal codons help to achieve faster translation rates and high accuracy. As a result of these factors, translational selection is expected to be stronger in highly expressed genes, as is indeed the case for the above-mentioned organisms. In other organisms that do not show high growing rates or that present small genomes, codon usage optimization is normally absent, and codon preferences are determined by the characteristic mutational biases seen in that particular genome. Examples of this are Homo sapiens (human) and Helicobacter pylori. Organisms that show an intermediate level of codon usage optimization include Drosophila melanogaster (fruit fly), Caenorhabditis elegans (nematode worm) or Arabidopsis thaliana (thale cress). The nature of the codon usage-tRNA optimization has been fiercely debated. It is not clear whether codon usage drives tRNA evolution or vice versa. At least one mathematical model has been developed where both codon-usage and tRNA-expression co-evolve in feedback fashion (i.e., codons already present in high frequencies drive up the expression of their corresponding tRNAs, and tRNAs normally expressed at high levels drive up the frequency of their corresponding codons), however this model does not seem to yet have experimental confirmation. Another problem is that the evolution of tRNA genes has been a very inactive area of research. 分析软件:CodonW
个人分类: 学习|2727 次阅读|0 个评论
[转载]CiteSpace重要问题整理
jerrycueb 2013-3-5 12:21
来源于:陈超美教授博客留言板 陈老师,您好,我在用 citespace 3.0.R2 的 RunBatch Mode 一气呵成的时候,生成的 narrative summary 中第一个图表中, TFIDF 、 LLR MI ,分别表示什么意思,我查了好久没有查出来,您能告诉我一下吗? 博主回复 (2011-12-19 11:57) : tfidf = tf x idf = term frequencyby inverted document frequency LLR = log-likelihood ratio MI = mutual information 详见: Chen, C.,Ibekwe-SanJuan, F., Hou, J. (2010) The structure and dynamics ofco-citation clusters: A multiple-perspective co-citation analysis. Journal ofthe American Society for Information Science and Technology, 61(7), 1386-1409.10.1002/asi.21309 陈老师,我想请问下 “The most active citer to the cluster is 0.45ISI:000086822800018 Mines, M (2000) ocular injuries sustained by survivors ofthe oklahoma city bombing.” 里面的 0.45 指的是什么指标呀?看了一些资料没找到答案,谢谢老师啦 ~~ 博主回复 (2011-11-23 23:13) : 0.45=45%. Mines, M. 引用了该类中 45% 的文献。 陈老师好,步骤 3 中所提到的前沿的 “ 脚印 ” ,是不是就是说它们在当时的那个时间里是研究前沿,即曾经是研究前沿?非常谢谢老师详细的解答! 博主回复 (2011-11-21 01:06) : 严谨地说, ‘ 脚印 ’ 只是前沿所留下的线索,蛛丝马迹,并非其真面目。熊猫的脚印不等于熊猫。第 5 步才涉及到脚印到底是那个熊猫的。 陈老师好,我想请问下,一个图谱的研究前沿是怎么确定啊?我看的文章有的是直接把关键节点(有紫色外圈的)看做研究前沿,这样对吗?分析研究前沿时 term type 选择 noun phrases 还是 burst terms ? Node Type 选择 Cited reference ,这样对吗?谢谢老师啦! 博主回复 (2011-11-19 22:38) : 对错往往是相对的,主要取决于你要发现什麽问题。 下面是一种方法: 1. Cited References 2. 生成网络 3. Citation Burst ( 需按 2 次)红色为被引 burst, 是前沿的 ‘ 脚印 ’ 。 Sigma 最高的节点为重要地区留下的脚印。 4. 生成聚类。在 Cluster Explorer 里,选则右侧列表中脚印所在的聚类(参考 #3 )。这时中间列表所显视的论文可视为一组前沿文献。 5. SynthesizeGenerate a Narrative 中包括一写 #4 中提到的文献。 陈老师您好,我在运行 citespace 处理数据时有几点不明白: 1. 在运行 citespace 时,选择 Pruning 里的 pathfinder 与 minimumspanning tree 有什么不同?在什么情况下该选择哪个呢? 2.silhouette 值代表什么呢?值为多大合适?看见您的截图上这个值都比较大,我的也就才 0.7476 ,对图的效果有影响吗? 3. 在进行聚类分析的时候,分别选择 T 和 k 进行聚类,然后选择 clustering-summarization of cluster 显示聚类明细,发现有的聚类在 T 结果中比较好,有的结果在 k 结果中比较好,而且有的聚类 silhouette 值很小甚至为负数,不太明白是什么意思,请问对哪个进行聚类分析比较好呢? 期待老师的解答,谢谢。 博主回复 (2011-11-19 05:54) : 有些问题一两句话说不完全,下面列出的论文中有具体的答案,请参考: 1 。 参见: Chen, C. and Morris, S. (2003) Visualizing evolvingnetworks: Minimum spanning trees versus Pathfinder networks. Proceedings ofIEEE Symposium on Information Visualization, (Seattle, Washington, 2003), IEEEComputer Society Press, 67-74. http://www.pages.drexel.edu/~cc345/papers/infovis03.pdf 2 和 3 。参见: Chen, C., Ibekwe-SanJuan, F., Hou, J. (2010)The structure and dynamics of co-citation clusters: A multiple-perspectiveco-citation analysis. Journal of the American Society for Information Scienceand Technology, 61(7), 1386-1409. 10.1002/asi.21309 http://arxiv.org/abs/1002.1985 陈老师,您好,我刚刚使用您的 citespace ,还是个新手,我有问题向您请教,例如,使用 keyword , c , cc , ccv 为 3.3.15 ; 3.3.20 ; 3.3.20 。 space 右边的数字 317 ,主要是指关键词频次出现三次以上的数量(同一个关键词出现多次算作一次),不知道这样理解对不对,另外的左下角的 Records in the dataset: 2918 , Records withinthe chosen range: 2569 ,是指数据库中关键词的数量吗,还是其他?希望陈老师百忙之中解答。谢谢。 博主回复 (2011-11-11 02:51) : 317 是在其中一年中的 keyword 的个数。 2918 是总数, 2569 是在 From-To 年份之间的总数。 陈老师您好,请问 article labeling 和 termlabeling 分别是指什么类别?在网上查不到精确的解释,不知道哪一个是正确的。谢谢您! 博主回复 (2011-11-7 20:37) : Node Type: Term: Terms Article: Authors, Cited References, Institutions,Countries, Keywords, etc. 陈老师您好!非常抱歉又麻烦您。但我在分析 WOS 数据时,遇到一些问题,还望老师能在百忙之中指点一二。 1. 在关键词可视化视图生成过程中,左边会出现相应的按词频排列的关键词排序,一些关键词会出现两次,这该怎么解释呐?而有些关键词只是单复数的区别,如 library 和 libraries 。在分析时应该将两者的频次相加,还是只取其中一个的数据呢? 2. 您的一篇博文中说 “modularity 大约在 0.4~0.8 时的图谱通常为符合要求的图谱 ” 。但是 modularity 在哪里显示呢?我没找到。 3. 在生成有关 reference 的图谱后,点击 DOI 或 googlescholar ,所得到文献总觉得与主题不相关呢?谢谢陈老师。 博主回复 (2011-11-8 10:21) : 1. 在图中右键将要保留的词选为 Alias Primary ,再将另一词选为 Alias secondary. 重新 GO! 一下 , 会将二者合并。 2 。在图的左上角有几行字,倒数第 2 行。 3 。有具体例子吗? 陈老师您好!感谢你的 CiteSpace ,太牛了。用了很久了,但最近处理的数据集比较大,有些 问题向您请教。 你在 “ 如何增强 CiteSpace 处理数据的多少和快慢 ” 一文中提到了数据集过大的处理办法,但我下载了还是会出现 JVM 不能创建不能运行的问题( could not create the JavaVirtual Machine )啊,在我机器上修改为 1500M 以下有时候能够运行,有时候也不行。我在一个内存为 8G 的机器上试过,也是这样的情况,请问是什么原因呢?该如何解决? 还有其它几个问题向您请教: 1 您的新版本是不是去掉了按住 Alt 键拖动鼠标多选的功能啊?我用的这个功能好像只有 2.8 版本有。 2 关于可视化的聚类图每一年的颜色可以设置吗?我的数据较多,总是看不清楚。 3 可以根据节点的属性而不是勾选左侧的选定节点来决定是否显示该节点吗? 如蒙回复,不胜感激!谢谢! 博主回复 (2011-9-20 20:58) : JVM 如果内存已被其他应用程序占用,就会有这种情况。抢先打开 CiteSpace 是一种办法。 1 。好像是。近似的选法可用右键选择列出同一类里的成员。 2 。 暂且没有这种界面。可试试增加每个时间区的长度, slicelength=3, 5 , 10 ,等。 3 。 没有。可在表中按列排序,然后逐个剔除。以后可以考虑加上类似功能。 陈老师,谢谢您的回复。还有两个问题:第一,在节点个数问题上,一般通过设置,最后多少节点是理想的?(我目前运行时得到节点关键词 308 个,连线 2057 条);第二,在进行时间线视图时( timeline ),每一个聚类后面的名称是依据什么来标注的?(通过运行,发现有的聚类名称和研究领域联系不大) 博主回复 (2011-9-10 23:00) : 1. 这个问题可参考我以前的博客。主要考虑是网络结构是否能回答在比节点本身更高抽象层次上的一些问题。 2 。是由引用各聚类的论文决定的,具体词组可选自论文的标题,摘要,和索引词,再由 3 种办法之一度量。如 “ 联系不大 ” ,可解释为施引 / 被引之间的 “ 距离 ” 较大,参照 silhouette 值。详件: Chen, C., Ibekwe-SanJuan, F., Hou, J. (2010)The structure and dynamics of co-citation clusters: A multiple-perspectiveco-citation analysis. Journal of the American Society for Information Scienceand Technology, 61(7), 1386-1409. 10.1002/asi.21309 陈老师,您好。我想请问下关于 CITESPACE 怎么保存图谱,我是做教育经济的,图点很散,怎么样吧图点聚集起来输出,看起来一目了然 博主回复 (2011-9-6 04:59) : 可以存成 .viz 格式,以后可以直接用 CiteSpace 打开使用: FileSave Visualization 也可以 : FileSave PNG 如能增加更多联接,也许能把整体集中一些 : 增加 time slice 的长度,增加 topN,topN% 等。 陈老师,您好,我想请教您一个问题,我下载 CNKI 或者万方的数据格式,应该如何进行转换,谢谢。 博主回复 (2011-8-2 21:50) : 试试 CiteSpaceDataImport/ExportCNKI 陈老师,再次请教你一个问题,这个问题一直迷惑着我,我在您的有关文献里看到 citespace 的操作步骤 1 、 2 、 3 ( extract noun phrase term from title,abstract,descriptors,identifiersof citing articles in the dataset ) 4---- ,关于步骤 3 我在实际操作的过程中并没有执行,而是直接分析共被引等内容,这样的话结果会有影响吗?如果我在分析了共被引等后,然后想作前沿词的探测的话会对结果有影响吗?另外关于提取名词的操作步骤是这样的对面,选择了 time scling ,term source, 然后在 term type 里选择 noun phrase ,然后点 go 对吗?如果我想探测突现词,必须先进行名词短语的提取然后选择 burst term--detect bursts 吗?可是这样只能在窗口里显示了几个探测词,我往往再选择 go ,才能出现相应谱图? 博主回复 (2011-7-27 09:04) : CiteSpace 中的 burst detection 有两种用法: 1 。名词短语 和 2 。单词。 1 需要事先提取。 2 则不用。 如果后面的分析不涉及名词短语,结果不会受影响。 最后几个问题:对;是;应该如此。 陈老师,您好!我想问下老师:如何用基于 CSSCI 的数据绘制 “ 研究前沿突变术语 ” 的图谱?( burst 来源为名词短语) 博主回复 (2011-7-26 00:13) : 1. 抽取名词短语 选需要的年份 选 Noun Phrases 等左边窗口出现回应后, GO. 等到提示 visualize, save, cancel ,选 cancel. 以上这步只需做一次 2 。 选 burst, 用名词短语 3. Node Type 选 Cited References 和 Terms. 4 。 GO. 陈老师您好,我的疑问与 33 楼得 clover6 相同。在阀值的选择上,如果阀值设的太低的话,会有太多的节点,分析起来可能太复杂,但是设的太高的话,又怕没有可信度。在阀值的设置上,怎么样才能更为科学呢? 博主回复 (2011-7-18 02:49) : 建议你先读一下这两篇: 如何选取 CiteSpace 中的各项参数 http://blog.sciencenet.cn/home.php?mod=spaceuid=496649do=blogid=378974 如何在 CiteSpace 中控制节点的取舍 http://blog.sciencenet.cn/home.php?mod=spaceuid=496649do=blogid=394695 陈老师,您好!关于 citespace 我有几个问题想请教: 1 、在聚类簇图形中右键选择 list citing papers to the cluster ,结果页面中 1 ) Citing Titles 显示的是什么内容?那个圆括号中的数字代表什么含义? 2 ) bibliographic details 显示的又是什么内容呢?那个方括号中的数字代表什么含义? 2 、在 citespace 中如何查看某个聚类簇的主要施引文献及其施引频次呢? 谢谢!祝工作愉快! 博主回复 (2011-7-16 19:51) : 下个版本中会包括一个 Cluster Explorer 的介面,可以用于交互式分析。 目前版本中,在 project 目录下有一个叫 clusters 的子目录,文件以相应聚类号命名。文件内包括施引文献。 陈老师,你好,在选择 “ 节点类型 ” 的问题上有一点不明白。我想做共词分析的图谱,选择 keyword 那一项就可以了吗,感觉这样画出的图谱好像没有体现出共词的关系呐。学生要做共词分析的图谱,还需要如何设置呢? 博主回复 (2011-6-29 02:45) : Term 和 Keyword 都可生成 co-word 网络。 Keyword 是 Web of Science 记录中 KeywordPlus 字段里的词。 陈老师,您好!非常感谢您能回答我的问题。在做作者或机构或国家合作网络知识图谱时, Freq 指的是被引频次呢,还是发文数量? 博主回复 (2011-6-15 23:29) : 这时 Freq 为发文数量。 陈老师您好!在操作过程中经常会遇到有的文献被引频次很高,但是中心度却很低,而有的文献被引频次很低,中心度却很高,对于这样的现象我该怎样去理解?这两类文献中那一种才是关键文献或重要文献?为什么会出现这样的情况。另外,阈值设定中: top N per slice 或者 Threshold ( c , cc , ccv )数值大小,选用 Pathfinder 或者 Minimum Spanning Tree ,即使小小的变化,软件选择出的被引文献或者关键词其中心度变化很大。如果选择了其中的一组数据进行分析,自己都无法解释选择为什么要选择这组数据?我应该依据什么去选择分析?因为自己正在学习过程中,希望得到陈老师的帮助。 博主回复 (2011-5-15 00:41) : 被引频次和中心度是两种不同的度量。中心度是定义在网络结构上的。至于什么是关键文献或重要文献,取决于你要研究什么问题。如果波动很大说明你选的 top N 还不够大。 陈老师请教一个问题,同样的阈值设定,用 Pathfinder 或者 MinimumSpanning Tree ,软件选择出的文献其中心度是不同的,如果中心度高的节点可以将其看成是关键节点,我现在无从下手了,不知道该选择那些文献来进行分析?以 Pathfinder 为准。见 Chen, C. and Morris, S.(2003) Visualizing evolving networks: Minimum spanning trees versus Pathfindernetworks. Proceedings of IEEE Symposium on Information Visualization, (Seattle,Washington, 2003), IEEE Computer Society Press, 67-74. http://www.pages.drexel.edu/~cc345/papers/infovis03.pdf 陈老师您好!我想请教您一个问题。在 citespace 里进行被引文献或被引作者分析时,聚类的依据是什么?根据什么标记聚类的?在被引作者分析过程中,是将每个作者被引的所有文章进行统计然后得出 Freq 吗?还是只分析作者的其中一篇文章? 在被引作者分析中, Freq 最高的作者对应这某一个年份和期刊,是否表示该分析过程只研究该作者的某一篇文章?但是在被引文献分析中,该作者的文章 Freq 不是第一,而且该作者对应的文章显示的年份也不同,为什么? 真心希望得到老师的解答,谢谢您! 博主回复 (2011-4-12 10:49) : 聚类相关的技术细节读一下这篇论文: Chen, C.,Ibekwe-SanJuan, F., Hou, J. (2010) The structure and dynamics ofco-citation clusters: A multiple-perspective co-citation analysis. Journal ofthe American Society for Information Science and Technology, 61(7), 1386-1409. 被引作者分析: Freq 是按每个作者的所有文章的被引情况计算的。这时只有作者字段有意义,其他字段如期刊名称等没有意义。陈老师,再次打扰您了。我最近在谢我的博士论文,现在正整理文献,突然有个想法,就是可不可以把文献综述写成知识图谱呢? 博主回复 (2011-4-4 21:45) : 对了解学科发展历史和现状来说,知识图谱和文献综述异曲同工。这确实是 CiteSpace 所针对的几个核心问题之一 . 还有就是, C 、 CC 和 CCV 阈值的选择有没有什么标准呢?问题较多,因为最近遇到了这些实际问题,麻烦陈老师了! 博主回复 (2011-2-24 11:03) : TopN 和 TopN% 更直接,建议你用这两项。 c , cc , ccv 的选择灵活但较为复杂,参考 2004 年我的 PNAS 文章。从前, c 有选 5 次以上的, ccv 有选 25% 以上等等在文献中都可见到。阈值低的覆盖面会稍微广一些。考虑到文献数据本身的误差,以及大部分人的注意力往往集中在最有代表性的工作,所以阈值的选择总是相对的。 WOS 并不包括所有的文献。另外,信息和噪音比也是一个考虑因素。 有个新的问题问您,我用知识图谱写了一篇文章,现在导师提出一点疑问,我也有些疑惑,特向您请教。 就是利用中心度分析某些关键词的时候,选取的阈值,如 C 、 CC 和 CCV ,会不是对中心度的值有影响呢?选取不同阈值会得到的不同膨胀词,那么我如何说明哪组阈值选择的更加合理呢?我导师问我为什么那么选择阈值,我该怎么回答呢?学生孤陋寡闻,希望得到陈老师的指教! 博主回复 (2011-2-24 11:21) : 会有影响。实际上,绝大多数的网络模型都会受到这类参数的影响,只是大部分条件下用户没有给与选择的机会而已。我在我的数篇文章中反复强调这是个探索性的分析过程,不要望 “ 图 ” 生意,想当然,而是要以图为线索找到确凿证据。
个人分类: 知识图谱|31006 次阅读|0 个评论
[转载]EvidenceUpdates: What's everyone reading now?02月25日
xupeiyang 2013-2-25 14:43
Dear Prof. Peiyang: We thought you might enjoy reviewing the most interesting articles for the past month, based on the frequency with which subscribers viewed these in detail. The top 10 appear below. Brian Haynes MD, Editor, Evidence Updates # Article Title 1 Efficacy and safety of dual blockade of the renin-angiotensin system: meta-analysis of randomised trials. BMJ 2 Probiotics for the prevention of Clostridium difficile-associated diarrhea: a systematic review and meta-analysis. Ann Intern Med 3 Vitamin C for preventing and treating the common cold. Cochrane Database Syst Rev 4 Effect of ramipril on walking times and quality of life among patients with peripheral artery disease and intermittent claudication: a randomized controlled trial. JAMA 5 Neonatal outcomes after gestational exposure to nitrofurantoin. Obstet Gynecol 6 Effect of corticosteroid injection, physiotherapy, or both on clinical outcomes in patients with unilateral lateral epicondylalgia: a randomized controlled trial. JAMA 7 Use of dietary linoleic acid for secondary prevention of coronary heart disease and death: evaluation of recovered data from the Sydney Diet Heart Study and updated meta-analysis. BMJ 8 Prevention of contrast-induced nephropathy with Na/K citrate. Eur Heart J 9 Statins for the primary prevention of cardiovascular disease. Cochrane Database Syst Rev 10 Anti-Diabetic Medications and the Risk of Hepatocellular Cancer: A Systematic Review and Meta-Analysis. Am J Gastroenterol
个人分类: 循证医学|1221 次阅读|0 个评论
能谱指数相互转化(IDL程序)
deliangwang 2013-2-2 19:59
Pro alpaha_corelate,vx=vx,vr=vr,vo=vo,a_ox,a_ro,a_rx ;+ ;NAME: ; alpaha_corelate ;PURPOSE: ; known two alpaha in order to make sure the third alpaha ;CALLING SEQUENCE: ; alpaha_corelate,vx=vx,vr=vr,vo=vo,a_ox,a_ro,a_rx ;INPUT OUTPUT: ; a_ox ; a_ro ; a_rx ;OPTIONAL KEY INPUT: ; vx --- X-ray frequency ; vr --- Radio frequency ; vo --- Optical frequency ;REVISION HISTORY: ; Original by DL.Wang,May-12-2007 ;- if n_params() lt 2 then begin print,'Syntax - alpaha_corelate,a_ox,,a_ro,a_rx' return endif nox=n_elements(a_ox)1 nro=n_elements(a_ro)1 nrx=n_elements(a_rx)1 a=alog10(vx/vo)/alog10(vx/vr) b=alog10(vo/vr)/alog(vx/vr) ;Check which two parameters are defined, and then determine the other if (nox and nro) then begin a_rx = a * a_ox + b * a_ro endif if (nrx and nro) then begin a_ox = (a_rx - b * a_ro)/ a endif if (nrx and nox) then begin a_ro = (a_rx - a * a_ox)/b endif end
个人分类: 编程笔记|2742 次阅读|0 个评论
[转载]EvidenceUpdates: What's everyone read 2012年12月31日
xupeiyang 2012-12-31 12:27
Dear Prof. Peiyang: We thought you might enjoy reviewing the most interesting articles for the past month, based on the frequency with which subscribers viewed these in detail. The top 10 appear below. Brian Haynes MD, Editor, Evidence Updates # Article Title 1 Sequential versus triple therapy for the first-line treatment of Helicobacter pylori: a multicentre, open-label, randomised trial. Lancet 2 Initiation of allopurinol at first medical contact for acute attacks of gout: a randomized clinical trial. Am J Med 3 Reduction versus abrupt cessation in smokers who want to quit. Cochrane Database Syst Rev 4 Beta-blockers for hypertension. Cochrane Database Syst Rev 5 Scores to predict major bleeding risk during oral anticoagulation therapy: a prospective validation study. Am J Med 6 Horse chestnut seed extract for chronic venous insufficiency. Cochrane Database Syst Rev 7 Cognitive behavioural therapy as an adjunct to pharmacotherapy for primary care based patients with treatment resistant depression: results of the CoBalT randomised controlled trial. Lancet 8 Bloodstream infection, venous thrombosis, and peripherally inserted central catheters: reappraising the evidence. Am J Med 9 Vaccines for preventing rotavirus diarrhoea: vaccines in use. Cochrane Database Syst Rev 10 General health checks in adults for reducing morbidity and mortality from disease: Cochrane systematic review and meta-analysis. BMJ
个人分类: 循证医学|2276 次阅读|0 个评论
[转载]EvidenceUpdates: What's everyone reading ? 2012年11月26日
xupeiyang 2012-11-26 15:53
Dear Prof. Peiyang: We thought you might enjoy reviewing the most interesting articles for the past month, based on the frequency with which subscribers viewed these in detail. The top 10 appear below. Brian Haynes MD, Editor, Evidence Updates # Article Title 1 Low sodium versus normal sodium diets in systolic heart failure: systematic review and meta-analysis. Heart 2 Corticosteroids as standalone or add-on treatment for sore throat. Cochrane Database Syst Rev 3 Efficacy and safety of the novel oral anticoagulants in atrial fibrillation: a systematic review and meta-analysis of the literature. Circulation 4 Oestrogen therapy for urinary incontinence in post-menopausal women. Cochrane Database Syst Rev 5 Low-Dose Aspirin for Preventing Recurrent Venous Thromboembolism. N Engl J Med 6 Efficacy of antibiotic therapy for acute exacerbations of mild to moderate chronic obstructive pulmonary disease. Am J Respir Crit Care Med 7 Comparative effectiveness and safety of methods of insulin delivery and glucose monitoring for diabetes mellitus: a systematic review and meta-analysis. Ann Intern Med 8 Incentives for preventing smoking in children and adolescents. Cochrane Database Syst Rev 9 Antibiotics for clinically diagnosed acute rhinosinusitis in adults. Cochrane Database Syst Rev 10 Exenatide once weekly versus liraglutide once daily in patients with type 2 diabetes (DURATION-6): a randomised, open-label study. Lancet
个人分类: 循证医学|1965 次阅读|0 个评论
[转载]EvidenceUpdates: What's everyone reading now? top 10 appear
xupeiyang 2012-8-27 11:01
Dear Prof. Peiyang: We thought you might enjoy reviewing the most interesting articles for the past month, based on the frequency with which subscribers viewed these in detail. The top 10 appear below. Brian Haynes MD, Editor, Evidence Updates 1 Does this adult patient with suspected bacteremia require blood cultures?. JAMA 2 Coronary CT angiography versus standard evaluation in acute chest pain. N Engl J Med 3 Intensive and Standard Blood Pressure Targets in Patients With Type 2 Diabetes Mellitus: Systematic Review and Meta-analysis. Arch Intern Med 4 Pharmacotherapy for mild hypertension. Cochrane Database Syst Rev 5 Randomized clinical trial of antibiotics in acute uncomplicated diverticulitis. Br J Surg 6 Long term hormone therapy for perimenopausal and postmenopausal women. Cochrane Database Syst Rev 7 Immunochemical Fecal Occult Blood Testing Is Equally Sensitive for Proximal and Distal Advanced Neoplasia. Am J Gastroenterol 8 Restenosis after carotid artery stenting and endarterectomy: a secondary analysis of CREST, a randomised controlled trial. Lancet Neurol 9 Capsule Endoscopy or Angiography in Patients With Acute Overt Obscure Gastrointestinal Bleeding: A Prospective Randomized Study With Long-Term Follow-Up. Am J Gastroenterol 10 Intravenous immunoglobulin for Guillain-Barre syndrome. Cochrane Database Syst Rev
个人分类: 循证医学|3088 次阅读|0 个评论
[转载]Matlab中的又一奇迹——复制这些代码并运行!【注意打开音频】
热度 1 sincos 2012-5-17 12:42
fs = 44100; dt = 1/fs; T16 = 0.125; t16 = ; = size(t16); t4 = linspace(0,4*T16,4*k); t8 = linspace(0,2*T16,2*k); = size(t4); = size(t8); mod4=(t4.^4).*exp(-30*(t4.^0.5)); mod4=mod4/max(mod4); mod8=(t8.^4).*exp(-50*(t8.^0.75)); mod8=mod8/max(mod8); mod16=(t16.^4).*exp(-110*(t16.^1)); mod16=mod16/max(mod16); f0 = 2*146.8; % reference frequency ScaleTable = ; % 1/4 notes do0f = mod4.*cos(2*pi*ScaleTable(21)*f0*t4); re0f = mod4.*cos(2*pi*ScaleTable(22)*f0*t4); mi0f = mod4.*cos(2*pi*ScaleTable(23)*f0*t4); fa0f = mod4.*cos(2*pi*ScaleTable(1)*f0*t4); so0f = mod4.*cos(2*pi*ScaleTable(2)*f0*t4); la0f = mod4.*cos(2*pi*ScaleTable(3)*f0*t4); ti0f = mod4.*cos(2*pi*ScaleTable(4)*f0*t4); do1f = mod4.*cos(2*pi*ScaleTable(5)*f0*t4); re1f = mod4.*cos(2*pi*ScaleTable(6)*f0*t4); mi1f = mod4.*cos(2*pi*ScaleTable(7)*f0*t4); fa1f = mod4.*cos(2*pi*ScaleTable(8)*f0*t4); so1f = mod4.*cos(2*pi*ScaleTable(9)*f0*t4); la1f = mod4.*cos(2*pi*ScaleTable(10)*f0*t4); tb1f = mod4.*cos(2*pi*ScaleTable(11)*f0*t4); ti1f = mod4.*cos(2*pi*ScaleTable(12)*f0*t4); do2f = mod4.*cos(2*pi*ScaleTable(13)*f0*t4); re2f = mod4.*cos(2*pi*ScaleTable(14)*f0*t4); mi2f = mod4.*cos(2*pi*ScaleTable(15)*f0*t4); fa2f = mod4.*cos(2*pi*ScaleTable(16)*f0*t4); so2f = mod4.*cos(2*pi*ScaleTable(17)*f0*t4); la2f = mod4.*cos(2*pi*ScaleTable(18)*f0*t4); ti2f = mod4.*cos(2*pi*ScaleTable(19)*f0*t4); do3f = mod4.*cos(2*pi*ScaleTable(20)*f0*t4); blkf = zeros(1,i); % 1/8 notes fa0e = mod8.*cos(2*pi*ScaleTable(1)*f0*t8); so0e = mod8.*cos(2*pi*ScaleTable(2)*f0*t8); la0e = mod8.*cos(2*pi*ScaleTable(3)*f0*t8); ti0e = mod8.*cos(2*pi*ScaleTable(4)*f0*t8); do1e = mod8.*cos(2*pi*ScaleTable(5)*f0*t8); re1e = mod8.*cos(2*pi*ScaleTable(6)*f0*t8); mi1e = mod8.*cos(2*pi*ScaleTable(7)*f0*t8); fa1e = mod8.*cos(2*pi*ScaleTable(8)*f0*t8); so1e = mod8.*cos(2*pi*ScaleTable(9)*f0*t8); la1e = mod8.*cos(2*pi*ScaleTable(10)*f0*t8); tb1e = mod8.*cos(2*pi*ScaleTable(11)*f0*t8); ti1e = mod8.*cos(2*pi*ScaleTable(12)*f0*t8); do2e = mod8.*cos(2*pi*ScaleTable(13)*f0*t8); re2e = mod8.*cos(2*pi*ScaleTable(14)*f0*t8); mi2e = mod8.*cos(2*pi*ScaleTable(15)*f0*t8); fa2e = mod8.*cos(2*pi*ScaleTable(16)*f0*t8); so2e = mod8.*cos(2*pi*ScaleTable(17)*f0*t8); la2e = mod8.*cos(2*pi*ScaleTable(18)*f0*t8); ti2e = mod8.*cos(2*pi*ScaleTable(19)*f0*t8); do3e = mod8.*cos(2*pi*ScaleTable(20)*f0*t8); blke = zeros(1,j); % 1/16 notes fa0s = mod16.*cos(2*pi*ScaleTable(1)*f0*t16); so0s = mod16.*cos(2*pi*ScaleTable(2)*f0*t16); la0s = mod16.*cos(2*pi*ScaleTable(3)*f0*t16); ti0s = mod16.*cos(2*pi*ScaleTable(4)*f0*t16); do1s = mod16.*cos(2*pi*ScaleTable(5)*f0*t16); re1s = mod16.*cos(2*pi*ScaleTable(6)*f0*t16); mi1s = mod16.*cos(2*pi*ScaleTable(7)*f0*t16); fa1s = mod16.*cos(2*pi*ScaleTable(8)*f0*t16); so1s = mod16.*cos(2*pi*ScaleTable(9)*f0*t16); la1s = mod16.*cos(2*pi*ScaleTable(10)*f0*t16); tb1s = mod16.*cos(2*pi*ScaleTable(11)*f0*t16); ti1s = mod16.*cos(2*pi*ScaleTable(12)*f0*t16); do2s = mod16.*cos(2*pi*ScaleTable(13)*f0*t16); re2s = mod16.*cos(2*pi*ScaleTable(14)*f0*t16); mi2s = mod16.*cos(2*pi*ScaleTable(15)*f0*t16); fa2s = mod16.*cos(2*pi*ScaleTable(16)*f0*t16); so2s = mod16.*cos(2*pi*ScaleTable(17)*f0*t16); la2s = mod16.*cos(2*pi*ScaleTable(18)*f0*t16); ti2s = mod16.*cos(2*pi*ScaleTable(19)*f0*t16); do3s = mod16.*cos(2*pi*ScaleTable(20)*f0*t16); blks = zeros(1,k); % Blank Block blkblock = ; % Base Melody cello = ; % So-FUCKING-Long Melody violin = ; % cello c1 = ; % violin1 v1 = ; % violin2 v2 = ; % violin3 v3 = ; % Get dirty s = c1+v1+v2+v3; s = s/max(s); sound(s,fs); 源地址: http://blog.sina.com.cn/s/blog_5f15ead201013i2j.html
1922 次阅读|1 个评论
[转载]phyml 4.0 建树中几个参数的意义
syfox 2012-4-9 09:33
详细的参数请参考: http://atgc.lirmm.fr/phyml/usersguide_cmdline.html 提示:原始序列是fasta格式,用mega打开,比对后可以转换格式成phy或者nex S analyze multiple data sets no - 要分析的数据集的数量。只有在输入文件是类似 PHYLIP seqboot 的输出文件时才使用。 B Non parametric bootstrap analysis no - 对单一的数据集,进行模拟 bootstrap 计算。直接给出数值,如 100 或 1000 E Base frequency estimates (empirical / ML) empirical - 频率估计方法,empirical 较快,ML 更精确。一般 empirical 就行。 V Proportion of invariable sites (fixed/estimated) fixed (p-invar = 0.00) - 非可变位点比率,0.0 - 1.0 之间的数值。可以输入 e,由程序来估计。 U Input tree (BIONJ / user tree) BIONJ - 起始树。直接用默认的 BIONJ 就行。 【转】进化分析常用方法及软件下载 这篇文章是丁香园转帖而来,简单的编辑了一下。 同时也提供冷泉港实验室关于进化分析几种方法的介绍以及不同方法之间的比较的网页版资料。 下载地址: http://good.gd/302439.htm 一、方法的选择 首先是方法的选择。基于距离的方法有UPGMA、ME(Minimum Evolution,最小进化法)和NJ(Neighbor-Joining,邻接法)等。其他的几种方法包括MP(Maximum parsimony,最大简约法)、ML(Maximum likelihood,最大似然法)以及贝叶斯(Bayesian)推断等方法。其中UPGMA法已经较少使用。 一般来讲,如果模型合适,ML的效果较好。对近缘序列,有人喜欢MP,因为用的假设最少。MP一般不用在远缘序列上,这时一般用NJ或ML.对相似度很低的序列,NJ往往出现Long-branch attraction(LBA,长枝吸引现象),有时严重干扰进化树的构建。贝叶斯的方法则太慢。对于各种方法构建分子进化树的准确性,一篇综述(Hall BG. Mol Biol Evol 2005,22(3):792-802)认为贝叶斯的方法最好,其次是ML,然后是MP.其实如果序列的相似性较高,各种方法都会得到不错的结果,模型间的差别也不大。 对于NJ和ML,是需要选择模型的。对于各种模型之间的理论上的区别,这里不作深入的探讨,可以参看Nei的书。对于蛋白质序列以及DNA序列,两者模型的选择是不同的。以作者的经验来说,对于蛋白质的序列,一般选择Poisson Correction(泊松修正)这一模型。而对于核酸序列,一般选择Kimura 2-parameter(Kimura-2参数)模型。如果对各种模型的理解并不深入,作者并不推荐初学者使用其他复杂的模型。 Bootstrap几乎是一个必须的选项。一般Bootstrap的值70,则认为构建的进化树较为可靠。如果Bootstrap的值太低,则有可能进化树的拓扑结构有错误,进化树是不可靠的。 对于进化树的构建,如果对理论的了解并不深入,作者推荐使用缺省的参数。需要选择模型的时候(例如用NJ或者ML建树),对于蛋白序列使用Poisson Correction模型,对于核酸序列使用Kimura-2参数模型。另外需要做Bootstrap检验,当Bootstrap值过低时,所构建的进化树其拓扑结构可能存在问题。并且,一般推荐用两种不同的方法构建进化树,如果所得到的进化树类似,则结果较为可靠。 二、构建分子进化树相关的软件 ClustalX 图形化的多序列比对工具 下载地址: http://bips.u-strasbg.fr/fr/Documentation/ClustalX/ ClustalW 命令行格式的多序列比对工具 下载地址: http://www.cf.ac.uk/biosi/research/biosoft/Downloads/clustalw.html GeneDoc 多序列比对结果的美化工具 下载地址: http://www.psc.edu/biomed/genedoc/ BioEdit序列分析的综合工具 下载地址: http://www.mbio.ncsu.edu/BioEdit/bioedit.html MEGA 图形化、集成的进化分析工具,不包括ML 下载地址: http://www.megasoftware.net/ PAUP 商业软件,集成的进化分析工具 下载地址: http://paup.csit.fsu.edu/ PHYLIP 免费的、集成的进化分析工具 下载地址: http://evolution.genetics.washington.edu/phylip.html PHYML 最快的ML建树工具 下载地址: http://atgc.lirmm.fr/phyml/ PAML ML建树工具 下载地址: http://abacus.gene.ucl.ac.uk/software/paml.html Tree-puzzle 较快的ML建树工具 下载地址: http://www.tree-puzzle.de/ MrBayes 基于贝叶斯方法的建树工具 下载地址: http://mrbayes.csit.fsu.edu/ MAC5 基于贝叶斯方法的建树工具 下载地址: http://www.agapow.net/software/mac5/ TreeView 进化树显示工具 下载地址: http://taxonomy.zoology.gla.ac.uk/rod/treeview.html 关于HGT的分析方法由于工作原因,HGT最近开始来找我麻烦了,一开始接触的时候感觉有点懵,后来交往下之下,发现还有点意思,特此写下个人心得一篇。 Horizontal gene transfer (HGT),有时候也称作later gene transfer (LGT),中文名叫做基因水平转移,讲述的是不同的物种间基因片段交流的故事,大多发生在宿原与宿主之间,是许多微生物进化的一种重要手段。相关的背景知识可以参见google或者baidu,此处不再赘述,但是个人推荐google英文搜索,至于原因,你懂的…… 下面还是来说一下通过何种手段来找到这种HGT的现象吧。 首先假设你要找宿原A与宿主B之间的HGT现象,注意这里的主动者是宿原A,那么请准备好A和B的所有蛋白集,同时准备好与A近缘的相关物种(C、D、E、F ……)的所有蛋白集,材料就这么多了,下面开始操作: (1). 将A的蛋白集(proA,以此类推)分别与proB、proC、proD、proE、proF进行blast m8比对,设置E-value参数为1e-20(E-value值可以根据自己的需求来调整),得到结果*.blast.m8 (2). 分别对(1)中的*.blast.m8结果针对每个proA的蛋白挑选一个最好的比对结果,得到*.blast.m8.besthit (3). 将所有的*.besthit文件合并为all.blast.m8.besthit (4). 然后根据第一列的query protein id(QP id)进行排序,生成*.besthit.sort文件 (5). 然后将*.sort文件中的QP id和第二列的reference protein id(RP id)提取出来,每个QP id单独作为一个cluster,筛选出含有B protein的cluster (6). 针对每个cluster中的所有蛋白序列进行多序列比对,多序列比对可以使用clustalW或者MUSCLE,个人在此选择的是MUSCLE (7). 对多序列比对的结果进行处理,提取保守区域的比对情况,这里使用的软件是Gblocks (8). 根据保守区域的比对结果来构建进化树,构建进化树的软件有许多,比如PHYLIP、PHYML、PAUP、MAGE、TREEBEST …… 这里我选用的有两种:PHYML和TREEBEST。TREEBEST是根据cds的比对结果来构建进化树的,如果你选用这个软件的话,那你就还需要收集相关物种的cds集合,并将蛋白比对的结果转化为cds的比对结果。PHYML既可以根据蛋白的比对结果来构建进化树,也可以根据cds的比对结果来构建进化树,但是输入的比对格式必须是phylip格式,因此如果你的比对结果是fa格式的话,你还需要简单的处理下。这里边需要注意的参数主要有初始的进化关系和bootstrap值,关于具体的事项还请参照构建进化树的相关知识。 (9). 最后一步就是根据构建的进化关系来进行筛选得到HGT了,将那些在一个分支上的A和B的蛋白提取出来,这些蛋白就是发生了HGT现象的蛋白。 最后得到的HGT的蛋白集合只是一个候选集,可能由于蛋白集的不完善,造成一些错误,而且用蛋白比对结果和cds比对结果构建的进化树,最终得到的HGT集合差异甚大。相关文献上都是采用的蛋白比对结果来构建的进化树,可能是希望集合尽量全吧。
个人分类: 组装|1 次阅读|0 个评论
4cfft插值公式证明1
zhwang554 2012-3-13 09:35
4cfft插值公式证明1
用 apfft的证明方式证明4阶 移位 循环卷积窗fft的插值公式 邓振淼. 刘渝. 基于全相位频谱分析的正弦波频率估计. 《数据采集与处理》2008年第23卷第4期 http://www.cqvip.com/qk/96163X/200804/28107551.html 从下面4cfft插值公式证明中,邓振淼博士的证明方法被充分使用了, apfft中有一个循环移位相加措施, 邓法的要点是用了DFT中的循环移位定理. 4cfft插值公式证明看上去很繁杂,思路即很清晰简单, 4cfft中包含了3次嵌套的移位后再作fft, 只要将3个移位找出就可以了. 以N=3矩形窗为例 若单频复指数信号为 n=0,1,2..................(1) 1cfft用了1个长N序列X , 序列的采样时间见图1 图1 1cfft的采样时间 2cfft用了3个长N序列Xi, i=0,1,2. 这些序列中数据的采样时间见图2, 图2中x括号的标号符合n-i. 图2 2cfft的采样时间 右 移位对x(0)对齐后的排列见图3, 图3 2cfft移位后的排列 3cfft用了9个长N序列, Xi+j, i=0,1,2. j=0,1,2. 序列X的下标符号i+j, 这些序列中的数据采样时间见图4, 采样x括号内的标号符合n-i-j. 图4 3cfft的采样时间 3cfft采样 右 移位后对x(0)或x(-3)对齐后的排列见图5, 它嵌套了第1次移位作一次 右 移位, 图5 3cfft移位后的排列 4cfft用了27个长N序列, Xi+j-m,i=0,1,2. j=0,1,2. m=0,,2. 序列X的下标符号i+j, 这些序列中数据的采样时间见图6, 图6中采样x括号内的标号符合n-i-j+m. 图6 4cfft的采样时间 4cfft采样 左 移位对x(0)或x(3)或x(-3)对齐后的排列见图7., 它嵌套了前2次 右 移位再作一次 左 移位, 图7 4cfft移位后的排列 4cfft方框图 如 图8所示. 输入4N-3个采样,乘以N阶矩形窗(或N阶hanning窗)4阶卷积窗, 得4N-3个数据,前面加2个另,后面加1个另,组成4N个数据. 4N个数据分成4个长N序列,移位相加得长N序列,做N阶fft得4cfft频谱. 图8 4cfft方框图 The 4dfft 插值公式证明如下: N=3矩形窗4cfft包含了3次嵌套的移位,见图7. 图3中笫1-3行,或图7中笫19-21行的DFT的和是2cfft的频谱,这3行是笫1次移位( 右 移),引起频谱乘一个相移. ................(2) 图5中笫1-9行,或图7中笫19-27行的的DFT的和是3cfft的频谱,这9行是笫2次移位( 右 移), 又 引起频谱乘一个相移. .................................(3) 图7中笫1-21行的DFT的和是4cfft的频谱,这21行是笫3次移位( 左 移), 又 一次引起频谱乘一个负相移 .........(4) hanning 窗 4cfft 插值公式 ...............(5) 图9 是1,2,4阶移位循环卷积矩形窗的频谱图, 由图可见,4dfft频谱的主辨宽度变窄. 图10 是1,2,4阶移位循环卷积hanning窗的频谱图, 由图可见,对比矩形窗, hanning窗的主辨宽度变宽. 图11是1,2,4阶移位循环卷积矩形窗的log10频谱图, 由图可见,4dfft窗频谱的衰减快. 图12 是1,2,4阶移位循环卷积hanning窗的log10频谱图,由图可见,对比矩形窗,hanning窗频谱的衰减更快, 图9 1,2,4阶移位循环卷积矩形窗的频谱图 图10 1,2,4阶移位循环卷积hanning窗的频谱图 图11 1,2,4阶移位循环卷积矩形窗的log10频谱图 图12 1,2,4阶移位循环卷积hanning窗的log10频谱图 全相位 FFT(2cfft) 的关键是全相位移位叠加后作 DFT, 核心是全相位移位 , 移位 起了二次 DFT 的作用 . 4cfft是 三次嵌套 移位叠加后作 DFT , 附加了三 次 DFT 的作用. 第1,2次位移是右移,相当2次负DFT变换. 第3次位移是 左 移,相当1次正DFT变换. 加上原1次正DFT变换,共2次正DFT变换,二次负DFT变换. 使插值公式4次方,而相位不变. 以上证明中以N=3为实例, 图1--图7都是N=3时的1cfft--4cfft的采样排列和移位后的排列, 对任意N时样排列和移位后的排列类似,但不好图示和理解, 但推算过程相同, 所以在后面的插值公式推算中, 直接用任意N长了. 4cfft须4N-3个数据, n=-2*N+2:2*N-2. 相位谱显示的是4N-3个数据中间采样x(0)的相位. 图8的4cfft方框图中,4N-3个输入数据序列前面加2个另,后面加1个另是为了保证中间采样在移位相加后的N长序列中处在笫一位, 即对x(0)对齐移位. 图7中可见4cfft 的第1个采样和是 19x(0)+4x(3)+4x(-3),fft后的相位是x(0),x(3),x(-3)3个相位之和,而4xfft的相位是第1个采样x(0) 的相位,这是因为x(3)和x(-3)的相位相等又相反,抵消了. 以上证明可用于任意阶移位循环卷积窗fft插值公式的证明,但大於4阶所用原始数据太长,而泄漏4次方己很小了.一般情况下用2阶apfft,特殊情况下用4阶4cfft,但理论上泄漏可以继续减小. 4cfft所用原始数据4N-3太长,但由於泄漏小,镜像频谱影响小,所以N可以选择较小值,使计算量减小. 由於N值小, 4N-3个数据也不会太大, 在某些场合有实用价值. 如近频谱另轴的极低频信号检测. 4cfft是一个节省计算量的选择. 之前还有另一法,见 4cfft插值公式证明2 http://home.chinavib.com/home.php?mod=spaceuid=62061do=blogquickforward=1id=18789 但证明2不如证明1简明. 图13 1,2,4阶移位循环卷积hanning窗的振幅谱,对数振幅谱和fft前的时域波形(f=14.5 N=64) 图13 是1,2,4阶移位循环卷积hanning窗的振幅谱,对数振幅谱和fft前的时域波形(f=14.5 N=64). 频率f=14.5是最大频偏,这时fft的振幅谱图13(1)幅值0.8488,apfft的振幅谱图13(7)幅值0.7205 (=0.8488^2), 4cfft的 振幅谱图13(7)幅值0.5191(=0.8488^4)最小,fft前的时域波形图13(9)振幅最小, 但其泄漏图13(8)也最小. 从图14(1)fft的振幅谱图见, f=14.5有二个相等幅值的峰,但旁峰很大,是峰值的 1/5. 图14(4)apfft的振幅谱图也有二个相等幅值的峰.,但旁峰减小,是峰值的 1/25. 图14(7)4cfft的振幅谱图旁峰更小,是峰值的1/625,.
个人分类: 全相位|5876 次阅读|0 个评论
[转载]R语言 画图函数的参数 介绍
wangleibio 2012-2-13 13:01
hist(): breaks设置每个柱的间距;freq柱图表示count或frequency;polt设置是否画图;density和angle可以设置柱上的斜线;axes设置是否需要画坐标轴; cor设置柱图的颜色;border设置柱图边界的颜色;xlim设置横轴范围;ylim设置纵轴范围。 R的许多函数都有类似的参数名,这些函数往往有同样的功能。因此后面就只介绍比较特殊的参数。 layout(): mat用矩阵设置窗口的划分,矩阵的0元素表示该位置不画图,非0元素必须包括从1开始的连续的整数值,比如:1……N,按非0元素的大小设置图形的顺序。widths用来设置窗口不同列的宽度,heights设置不同行的高度。par()的mfcol,和mfrow参数也有类似layout的功能,不过相对layout就逊色多了。 par(): mar设置图离四个边缘的距离;bg设置背景颜色;xaxt和yaxt设置坐标轴标签的类型(=”n”表示不画轴标签);xlim和ylim设置坐标轴的范围。 axis(): las设置坐标轴标签的方式(水平,垂直……)。 mtext(): 为四个坐标轴添加标签。 text(): 在给定坐标的位置写字。 lines(): lty设置线的类型;lwd设置线的宽度。 points(): pch设置点的类型。 plot(): 最简单的画图函数。type设置画图的类型(type=”n”表示不画数据);axes设置是否画坐标轴。常用的参数还有:xlim和ylim,xaxt和yaxt。 barplot(): space设置bar图间的间距;horiz设置bar的方向是垂直或水平;beside设置height为矩阵时,每列元素的bar排列方式;add设置是否将barplot加在当前已有的图上。 legend(): 除了利用x,y设置图例的坐标外,用”topleft”, "center","bottomright"等设置位置非常方便。ncol设置图例的列数, horiz设置图例的排列方向。常有的参数还有col,lty,pch。 heatmap(): Rowv和Colv设置是否需要按行或列聚类;scale设置是否需要按行或列标准化;na.rm设置是否移去NA;RowSideColors和ColSideColors可以在行或列边缘添加颜色;keep.dendro设置是否画聚类树。 dendrogram(): 'nodePar'和'edgePar'都是list,可以方便的设置节点和边的各种属性,如:颜色,样式,宽度,标签……。 来源: http://blog.sina.com.cn/s/blog_6c9eaa150100pi4t.html
14310 次阅读|0 个评论
6.3.4 Radio Frequency (rf) Sputtering
xpzhanghit 2011-12-9 17:19
6.3.4 Radio Frequency (rf) Sputtering At frequencies above 50 kHz , the ions do not have enough mobility to allow establishing a DC diode-like discharge and the applied potential is felt throughout the space between the electrodes . The electrons acquire sufficient energy to cause ionizing collisions in the space between the electrodes and thus the plasma generation takes place throughout the space between the electrodes . When an rf potential, with a large peak-topeak voltage, is capacitively coupled to an electrode, an alternating positive/ negative potential appears on the surface. During part of each halfcycle , the potential is such that ions are accelerated to the surface with enough energy to cause sputtering while on alternate half-cycles , electrons reach the surface to prevent any charge buildup . Rf frequencies used for sputter deposition are in the range of 0.5–30 MHz with 13.56 MHz being a commercial frequency that is often used . Rf sputtering can be performed at low gas pressures (1 mTorr) . Since the target is capacitively coupled to the plasma it makes no difference whether the target surface is electrically conductive or insulating although there will be some dielectric loss if the target is an insulator . If an insulating target material , backed by a metal electrode is used, the insulator should cover the whole of the metal surface since exposed metal will tend to short-out the capacitance formed by the metal-insulator-sheath-plasma . Rf sputtering can be used to sputter electrically insulating materials although the sputtering rate is low . A major disadvantage in rf sputtering of dielectric targets, is that most electrically insulating materials have poor thermal conductivity , high coefficients of thermal expansion, and are usually brittle materials. Since most of the bombarding energy produces heat , this means that large thermal gradients can be generated that result in fracturing the target if high power levels are used. High rate rf sputtering is generally limited to the sputter deposition from targets of silicon dioxide (SiO2) which has a low coefficient of thermal expansion and thus is not very susceptible to thermal shock. In some cases, 48 hours is used to rf sputter-deposit a film of SiO 2 several microns thick.
个人分类: 读书笔记|13 次阅读|0 个评论
[转载]R 基本画图参数
biowanglei 2011-11-25 23:39
R的基本画图函数非常容易学,看上去也很普通。然而 适当的参数设置,有意义的颜色设置,不同基本图间的互相组合 ,会使你的图更漂亮也更有力的表达数据。下面介绍一些R基本包里画图函数的参数: hist(): breaks设置每个柱的间距;freq柱图表示count或frequency;polt设置是否画图;density和angle可以设置柱上的斜线;axes设置是否需要画坐标轴; cor设置柱图的颜色;border设置柱图边界的颜色;xlim设置横轴范围;ylim设置纵轴范围。 R的许多函数都有类似的参数名,这些函数往往有同样的功能。因此后面就只介绍比较特殊的参数。 layout(): mat用矩阵设置窗口的划分,矩阵的0元素表示该位置不画图,非0元素必须包括从1开始的连续的整数值,比如:1……N,按非0元素的大小设置图形的顺序。widths用来设置窗口不同列的宽度,heights设置不同行的高度。par()的mfcol,和mfrow参数也有类似layout的功能,不过相对layout就逊色多了。 par(): mar设置图离四个边缘的距离;bg设置背景颜色;xaxt和yaxt设置坐标轴标签的类型(=”n”表示不画轴标签);xlim和ylim设置坐标轴的范围。 axis(): las设置坐标轴标签的方式(水平,垂直……)。 mtext(): 为四个坐标轴添加标签。 text(): 在给定坐标的位置写字。 lines(): lty设置线的类型;lwd设置线的宽度。 points(): pch设置点的类型。 plot(): 最简单的画图函数。type设置画图的类型(type=”n”表示不画数据);axes设置是否画坐标轴。常用的参数还有:xlim和ylim,xaxt和yaxt。 barplot(): space设置bar图间的间距;horiz设置bar的方向是垂直或水平;beside设置height为矩阵时,每列元素的bar排列方式;add设置是否将barplot加在当前已有的图上。 legend(): 除了利用x,y设置图例的坐标外,用”topleft”, "center","bottomright"等设置位置非常方便。ncol设置图例的列数, horiz设置图例的排列方向。常有的参数还有col,lty,pch。 heatmap(): Rowv和Colv设置是否需要按行或列聚类;scale设置是否需要按行或列标准化;na.rm设置是否移去NA;RowSideColors和ColSideColors可以在行或列边缘添加颜色;keep.dendro设置是否画聚类树。 dendrogram(): 'nodePar'和'edgePar'都是list,可以方便的设置节点和边的各种属性,如:颜色,样式,宽度,标签……。 在初学一个函数的时候,可能不知道函数有哪些参数,尤其是R中用...省略的参数。这时候看看“See Also:”里面提供的相关函数时非常有用的,R函数多是继承其它的更一半的函数,所以参数也会继承,理解了这一点,就能灵活应用..省略的参数了。另一方面,一些函数返回的对象的类是比较复杂的,有多个属性(一般会在“Value”里面说明这些对象的属性)。但有些函数的帮助里没有“Value”栏, 幸运的是R中的一些函数提供了对各种类通用的处理,通过这些函数你可以大概了解一个对象所有的属性。如: summary() 总结对象的基本特征; attributes() 列出对象的所有属性; attr() 给出对象的指定属性的值; labels() 列出对象的标签;str()展示对象的结构……。 http://hlwyjsh.blog.163.com/blog/static/579533302010616104928853/
4929 次阅读|0 个评论
[转载]TF-IDF
baiyunrui 2011-8-15 18:05
维基百科,自由的百科全书 TF-IDF (term frequency–inverse document frequency)是一种用于 资讯检索 与 文本挖掘 的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个 语料库 中的其中一份 文件 的重要程度。字词的重要性随着它在文件中出现的次数成 正比 增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被 搜索引擎 应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,互联网上的搜寻引擎还会使用基于连结分析的评级方法,以确定文件在搜寻结果中出现的顺序。 目录 1 原理 2 例子 3 在向量空间模型里的应用 4 参考资料 5 外部链接 原理 在一份给定的文件里, 词频 (term frequency,TF)指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被正规化,以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词频,而不管该词语重要与否。)对于在某一特定文件里的词语 t i 来说,它的重要性可表示为: 以上式子中 n i , j 是该词在文件 d j 中的出现次数,而分母则是在文件 d j 中所有字词的出现次数之和。 逆向文件频率 (inverse document frequency,IDF)是一个词语普遍重要性的度量。某一特定词语的IDF,可以由总文件数目除以包含该词语之文件的数目,再将得到的商取 对数 得到: 其中 |D|:语料库中的文件总数 :包含词语 t i 的文件数目(即 的文件数目)如果该词语不在语料库中,就会导致被除数为零,因此一般情况下使用 然后 某一特定文件内的高词语频率,以及该词语在整个文件集合中的低文件频率,可以产生出高权重的TF-IDF。因此,TF-IDF倾向于过滤掉常见的词语,保留重要的词语。 例子 有很多不同的 数学公式 可以用来 计算 TF-IDF。这边的例子以上述的数学公式来计算。词频 (TF) 是一词语出现的次数除以该文件的总词语数。假如一篇文件的总词语数是100个,而词语“母牛”出现了3次,那么“母牛”一词在该文件中的词频就是3/100=0.03。一个计算文件频率 (DF) 的方法是测定有多少份文件出现过“母牛”一词,然后除以文件集里包含的文件总数。所以,如果“母牛”一词在1,000份文件出现过,而文件总数是10,000,000份的话,其逆向文件频率就是 ln(10,000,000 / 1,000)=4。最后的TF-IDF的分数为0.03 * 4=0.12。 在向量空间模型里的应用 TF-IDF权重计算方法经常会和 余弦相似度 (cosine similarity)一同使用于 向量空间模型 中,用以判断两份文件之间的 相似性 。 参考资料 Salton, G. and McGill, M. J. 1983 Introduction to modern information retrieval . McGraw-Hill, ISBN 0-07-054484-0 . Salton, G., Fox, E. A. and Wu, H. 1983 Extended Boolean information retrieval. Commun. ACM 26, 1022–1036. Salton, G. and Buckley, C. 1988 Term-weighting approaches in automatic text retrieval. Information Processing Management 24(5): 513–523. 外部链接 Term Weighting Approaches in Automatic Text Retrieval Robust Hyperlinking :An application of tf–idf for stable document addressability.
个人分类: 信息检索|2486 次阅读|0 个评论
2011-01-05
rrerre 2011-1-5 10:42
1.Tohackandmakeuseofllvm,Ineedtodothefollowingthings: 1.1Tofigureoutthebytecoderepresentationllvmused. 1.2Tofigureoutthepassmanagerandthepassesimplementedbyllvm. 1.3Tofigureouttherepresentationusedbyllvmformachinecode. 1.4Tohackthemachineconfigurationfilesofllvm. 2.TodoSPMallocationonllvminfrastructure,note: 2.1Togettheinterferegraphofvariables. 2.2Togettheaccessfrequencyofthevariables. 2.3Thesituationofvariablesrelatedshouldbeafterregisterallocation,namely,theyareinmachinecodeform. 3.Togettheinterferegraphofvariablesinmachinecodeform,note: 3.1Tocomputetheliverangeofeachvariable,andgettheinterfererelationamongvariablesbycomparingtheirliveranges. 3.2Inllvmtheliverangesarecomputedbeforeregisterallocation,butIneedthetheliverangesafterregisterallocation(see2.3),whichmaybedifferentfromthatcomputedbyllvm,sincethelive-rangesplittingprocessofregisterallocationwillchangeliveranges. Todo:perhapsthereisaneedtorecomputetheliverangesafterregisterallocation. Todo:theliverangcomputingalgorithminllvmmaycomputeliverangesforbothvirtualandphysicalregisters,butthelattershouldberemovedforme. 4.Togettheaccessfrequencyofvariablesinmachinecodeform,note: Totodistinguishvirtualregistersfromphysicalregisters. Todo:todistinguishuse/defforvirtualregisters. 5.Do3first.
个人分类: 学习日记|2927 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-17 20:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部