沉闷科学的掘墓人分享 http://blog.sciencenet.cn/u/Bearjazz

博文

R语言自写小程序清单

已有 7979 次阅读 2013-12-23 09:06 |个人分类:我的研究|系统分类:科研笔记|关键词:学者| R语言, 清单, 自写小程序

#R语言大小写字母转换

熊荣川

六盘水师范学院生物信息学实验室

xiongrongchuan@126.com    

http://blog.sciencenet.cn/u/Bearjazz


本文为笔记用,提供启发,不提供程序及代码交流。


#rm(list=ls()) #R语言去除当前环境所有变量 

#使用方法source('D:/ziliao/zhuanye/R语言构建系统发育树平台/R语言构建系统发育树平台.r')

#批量替换序列名称_树文件专用 Abatchtrans(workID)

#PCR矩阵映射_fas格式 PCRmat(path1,path2,data)

#PCR矩阵映射_ab1原始文件版本 sortab1(path1, path2, indexmat) 

#PCR矩阵映射_ab1原始文件版本_使用excel表进行输入操作 superPCRmatab1(workID)

#ab1文件归类_使用excel表进行输入操作 supersortab1(workID)

#将单元格内容转化为字符变量matchar(name) name表示单元格位置

#序列统一编号 uninumber(workID)

#将文件名作为序列名字Fntosn(filename) 针对单个文件

#将文件名作为序列名字superFntosn(path) 针对文件夹中所有文件

#批量替换序列名称_fas文件专用  Supertrans(workID) 

#搜索在列表中的样品的某个基因信息,返回没在列表中的信息GBvoucher(path,fas)

#提取特定物种的序列 多个同物异名Tiquspecies(fas, sepeciesnamelist) 

#合并某个文件夹中所有表格mergTable(path),表格须为csv格式,具有相同的列 

#批量替换序列名称_树文件专用

#返回list中元素等于某个值的数字位置getpositN(list,v)

#将单元格中的值转化成列加总的百分比rate.row(mat2)

#将单元格中的值转化成行加总的百分比rate.line(mat2)

#获得文本中数字所在的位置position.num(x)

#获得文本中连续数字的范围range.num(x),依赖函数position.num(x)

#R语言-序列更新动态Update.amphibian(olddate,searchdate) 

#R语言序列比对及相关信息提取Staxon.mat <- function(target,queryfile)

#R语言本地blast结果文件整理成表格LBlastF2Tab(LBlastF)

#合并某个文件夹中所有文本文件merge.txt(path,unilist = TRUE) #unilist用于设置是否需要去掉重复

#R语言搜索DNA序列中的碱基组成非碱基符号 check.nucl(inputfilename) # inputfilename为带双引号的文件名

#R语言去掉Genbank序列号的.1后缀 Detag.1(infile) #infile 文件名

#R语言去掉Genbank带NC_的序列号 #infile 文件名

#读取excel表中的一个工作表read.excel(filename,sheetname) #filename excel文件名 #sheetname 工作表名

#R语言两栖动物分类数据库 check.order(checkname) # checkname为字符向量,多个或单个

#R语言输出excel表格 writeWorksheetToFile("大绿臭蛙声谱分析six round.xlsx", data=mat, sheet="小分类")

#遗传距离表,方形矩阵函数-方表 Genetic_matrixA(taglist) ##taglist为字符向量

#遗传距离表,方形矩阵函数-竖表 Genetic_matrixB(taglist) ##taglist为字符向量

#R语言根据经纬度获得海拔数据 googEl(mat) #mat为一个数值矩阵或数据框,第一列为经度,第二列为纬度(转载)

#R语言提取excel表中所有工作表的名字

#R语言进行声谱数据处理info.sonogram(path1,path2,infile) #infile为声谱数据表(手工表,参照“声谱信息数据表-标准格式.csv”), path1为infile存放路径,path2为时间区间文件所在路径

#R语言整合正选择和遗传距离Positive.Dis(Positive.Tab,Genetic.Dis.Tab) #生成4个整合表和一个遗传距离分布曲线,Positive.Tab由DNAsp生成,Genetic.Dis.Tab由mega5生成

#两栖动物样线监测月数据汇总及物种统计# exc1为样线统计原始表格,sheetlist拟统计的工作表清单,month统计的年月以“201404”似的格式

#将本地blast结构以表格形式输出LBlastF2Tab_B(LBlastF,outfile) #LBlastF为本地blast自动生成的文件#输出表格的文件的名称

#R语言简化本地blast R2localblast(path.bin, path.seq,dbname,seqname)#path.bin为本地blast所有程序所在的bin目录位置#path.seq 为需要查询的序列所在的目录#dbname要查询的本地数据库名称

#seqname序列名称

#R语言下载序列并统计序列长度及物种信息 ,Down.seq(File.accession)#File.accession为包含目标下载序列索取号的txt文件,单列

#R语言批量替换系统发育树上序列名称_树文件专_非平台版,TreeNtrans(tree.pre,tree.pos,oldname, newname)

#R语言提取文件夹中的文件名录,dirlist(path),path表示提取名录的文件夹路径

#R语言检查文件夹中是否含有应有的文件,checkexist(path,listfile),path是存放检查文件的路径,listfile是包含检查关键字的清单文件

#师资基本信息表整合新列信息,teacher.t(mat,mat.a,tag),mat核心表格;mat.a #新增信息表;tag新增信息列名

#R语言分割序列清单,Div.namelist (infile,width),#infile 为输入文件名,txt格式,要分割的对象; #width 表示要分割的大小

#R语言按照清单生成文件夹,dir.namelist(path,intxt) #path,生成清单文件夹所在的位置, #intxt,清单文件,须为txt格式

#Genbank文件中去除重复文献,Unique.JOURNAL(infile) #infile 为目标Genbank文件,结果生成paste("Unique-",infile, sep = "")命名的参考文献文件

#R语言将ab1文件名表格化,#输入为ab1文件存放的位置,path.ab1,最好不好把它作为当前工作目录;#结果返回一个表格mat

#R语言把PCR矩阵拉直,infile是PCR样品矩阵PCR20160314.xlsx,promat为标准位置表,pcr.mat为具体某次实验的样品矩阵

#将索取号作为序列名,独立版本,accessNB(acesslist,prefile,outfile),acesslist为索取号清单,prefile替换前的文件名,outfile替换后的文件名

#R语言提取genbank大文件的特定行,序列号行专用,genbank.tag (infle, keyword, outfile),返回mat,infle =  "XX.gb" #要读取的gb格式大文件;keyword = "LOCUS   "  #提取该有该关键词的特定行;outfile = "序列号基本信息.txt" #结果输出到这个文件中

#R语言提取genbank大文件的特定行大文件的特定行,其它行专用,genbank.tagB (infle, keyword, outfile),返回mat,infle =  "XX.gb" #要读取的gb格式大文件;keyword = "LOCUS   "  #提取该有该关键词的特定行;outfile = "序列号基本信息.txt" #结果输出到这个文件中

#R语言新加入的数字在序列中的位置提取,Pisition.newset(newnumber, numberlist);newnumber 为新数字,numberlist,已有数据集合,

#R语言整合Genbank格式序列的相关信息,infile为Genbank中下载的gb格式文件

#R语言生成分子鉴定文件夹,Dir.phylo(path),path为生该系列文件夹的目录位置

#R语言提取genbank大文件的基因标题信息,genbank.DEFINITION(infle, keyword, outfile),无返回值,infle =  "XX.gb" #要读取的gb格式大文件 #结果输出一个文件"基因标题信息.csv"

#R语言生成分子鉴定文件夹,Dir.phylo(path),path为生该系列文件夹的目录位置

#R语言替换fasta格式序列名,Replace.seqname(seqfile,newname,changefilename = T);seqfile为fasta格式的文件,newname为新的序列名,changefilename = T是否以新的文件名保存序列文件

#R语言给fas格式序列所有序列名加上特定标签,Addtagtofas (fastaname, tag),fastaname为fasta格式序列文件名,tag是所加标签的字符串格式

#R语言生成构建系统发育树的标准文件夹,Dir.phylogeneticTree(path),path为生该系列文件夹的目录位置

#R语言解决TCS绘制单倍型网络的格式输入问题,FastoTCS(infas,length.blank,seqlength),infas是mega转化后的fasta格式文件,length.blank为单倍型名称和序列之间空格数,seqlength为序列长度

#R语言把PCR矩阵拉直(A01-H01),infile是PCR样品矩阵PCR20160314.xlsx,promat为标准位置表,pcr.mat为具体某次实验的样品矩阵

#R语言树文件索取号替换为物种名,replace.treetip(pretip, posttip, intree),pretip为替换前的索取号清单文件名,序列名.txt;posttip为替换后的物种名清单文件名,物种名.txt;intree为需要进行替换的树文件,要求为nwk格式。

#R语言在ab1对照文件中筛选批量提取相关信息行。extract.ab1(mat, search.tag, col.tag),其中mat为ab1文件对照表,search.tag为要搜索的关键词,col.tag为要搜索的列名




R语言构建系统发育树平台.r



https://m.sciencenet.cn/blog-508298-752089.html

上一篇:R语言大小写字母转换
下一篇:祝各位朋友新年快乐

0

评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 17:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部