科学网

 找回密码
  注册

tag 标签: 箱线图

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

利用R软件包ggplot2绘制boxplot图
pujvzi 2018-9-10 19:20
利用 R 软件包 ggplot2 绘制 boxplot 图 数据集 : 三个阶段卵母细胞 (NSN,NSN-SN,SN) 的核内组蛋白集落 ( 分大小 ,large foci,small foci) 的数量 。 一般而言 ,ggplot2 需要的数据 , 每个样本为一行 , 样本信息需要有观测值 , 以及样本的属性信息等 。 文件名 :mydata2.txt ***************************** number oocyteType fociType 18 NSN large 18 NSN large 18 NSN large 15 NSN large 25 NSN large 26 NSN large 26 NSN large 11 NSN large 24 NSN large 16 NSN large 21 NSN large 18 NSN large 24 NSN large 19 NSN large 12 NSN large 20 NSN large 11 NSN large 17 NSN large 14 NSN large 18 NSN large 14 NSN large 23 NSN large 22 NSN large 16 NSN large 17 NSN large 15 NSN large 16 NSN large 19 NSN large 23 NSN large 19 NSN large 14 NSN large 3 SN large 6 SN large 9 SN large 0 SN large 11 SN large 1 SN large 3 SN large 1 SN large 2 SN large 2 SN large 5 SN large 2 SN large 4 SN large 3 SN large 4 SN large 7 SN large 7 SN large 5 SN large 15 NSN-SN large 7 NSN-SN large 2 NSN-SN large 13 NSN-SN large 15 NSN-SN large 9 NSN-SN large 8 NSN-SN large 11 NSN-SN large 13 NSN-SN large 9 NSN-SN large 1 NSN-SN large 19 NSN-SN large 8 NSN-SN large 11 NSN-SN large 13 NSN-SN large 35 NSN small 23 NSN small 12 NSN small 15 NSN small 55 NSN small 28 NSN small 21 NSN small 38 NSN small 17 NSN small 18 NSN small 18 NSN small 37 NSN small 19 NSN small 14 NSN small 41 NSN small 21 NSN small 30 NSN small 7 NSN small 9 NSN small 9 NSN small 8 NSN small 29 NSN small 8 NSN small 15 NSN small 8 NSN small 13 NSN small 14 NSN small 6 NSN small 12 NSN small 5 NSN small 23 NSN small 8 SN small 10 SN small 6 SN small 8 SN small 9 SN small 3 SN small 8 SN small 3 SN small 9 SN small 5 SN small 9 SN small 7 SN small 7 SN small 10 SN small 10 SN small 8 SN small 8 SN small 6 SN small 12 NSN-SN small 18 NSN-SN small 16 NSN-SN small 20 NSN-SN small 15 NSN-SN small 10 NSN-SN small 15 NSN-SN small 12 NSN-SN small 11 NSN-SN small 14 NSN-SN small 16 NSN-SN small 13 NSN-SN small 9 NSN-SN small 14 NSN-SN small 11 NSN-SN small ***************************** (1) 读入数据 mydata3-read.table(mydata3.txt,header=T,sep=\\t) (2) 初步绘图 library(ggplot2) ggplot(data=mydata3, aes(x=oocyteType,y=number))+geom_boxplot(aes(fill=fociType)) 得如下之图 : (3) 加横轴纵轴标签 p - ggplot(data=mydata3, aes(x=oocyteType,y=number))+geom_boxplot(aes(fill=fociType)) p1 - p+labs(x = oocyte developmental stage) p2 - p1+labs(y = XXX foci number) p2 (4) 修改坐标轴标签之属性 p3-p2 + theme(axis.title.x=element_text(color=red, size=15, face=bold)) p4-p3 + theme(axis.title.y=element_text(color=red, size=15, face=bold)) p4 (5) 修改背景 p4 + theme_bw() 背景应该在第一步开始设置 , 中途设置背景 , 将上面设置的标签掩盖了 。 背景修改方式 , 可见 ?theme_bw() (6) 更改 Figure Legend 位置 p5 - p4 + theme_bw() p5+theme(legend.position=c(0.8,0.8)) p5 +theme(axis.title.x=element_text(color=red, size=15, face=bold))+ theme(axis.title.y=element_text(color=red, size=15, face=bold)) (7) 修改颜色 p6 - p5 + scale_fill_manual(values=c(red,blue)) p6 (8) 修改坐标轴刻度标签颜色大小 p6-p6+theme(axis.text.x=element_text(size=13,color=black)) p6-p6+theme(axis.text.y=element_text(size=13,color=black)) p6 (9) 修改 legend p6+guides(fill=guide_legend(title=NULL)) (10) 加图题 p7-p6+guides(fill=guide_legend(title=NULL)) p7+annotate(text,label=my boxplot plot,x=2,y=50,color=Green,size=8)
个人分类: 生信|5248 次阅读|0 个评论
ggplot2箱线图
Polya 2017-4-12 16:22
箱线图( Boxplot,Box-whisker Plot ) 组成:五个统计量:最小值,第一四分位数,中位数,第三四分位数,最大值 用途:描述数据的一种方法 粗略地看出数据是否具有有对称性,分布的分散程度等信息, 适用:特别可以用于对几个样本的比较。 绘制箱线图的步骤如下: 1 .画一只箱子,箱子两端分别位于第一个和第三个四分位数上。 2 .在箱子中位数的位置画一条垂直线。 3 .用四分位数全距 IQR = Q3 − Q1 ,确定限制线的位置。箱线图的上、下限制线分别在比 Q1 低 1.5(IQR) 和比 Q3 高 1.5(IQR) 的位置上。两条限制线以外的数据可以认为是异常值。 4 .图 1 中的虚线称为触须线。触须线从箱子两端开始绘制,直至第 3 步中计算的限制线内的最小值和最大值。 5 .最后,每个异常值的位置都用星号“ * ”表示出来。 概念: 第一四分位数 (Q1) : “较小四分位数”等于该样本中所有数值由小到大排列后第 25% 的数字。 第二四分位数 (Q2) : “中位数”,等于该样本中所有数值由小到大排列后第 50% 的数字。 第三四分位数 (Q3) : “较大四分位数”,等于该样本中所有数值由小到大排列后第 75% 的数字。 例如一队数列: 1 , 3 , 10, 16, 19, 20, 21, 22, 83, 87, 200 Q1=10 Q2=20 Q3=83 # Clear workspace rm(list = ls()) #set as your own path .R files. path-setwd(D:/Test/R/R_paint) library(ggplot2) # create fake dataset with additional attributes - sex, sample, and temperature x - data.frame( values = c(1, 3, 10, 16, 19, 20, 21, 25, 83, 87, 200), sex = rep(c('M', 'F'), each = 11), sample = rep(c('sample_A', 'sample_B'), each = 11) ) x png(plotbox_3.png,width = 600,height = 800) ggplot(x, aes(x = sample, y = values, fill = sex)) + geom_boxplot() dev.off() y - rnorm(100) y df - data.frame( x = 1, y0 = min(y), y25 = quantile(y, 0.25), y50 = median(y), y75 = quantile(y, 0.75), y100 = max(y) ) df$y0 df$y25 df$y50 df$y75 png(plotbox_4.png,width = 600,height = 800) ggplot(df, aes(x)) + geom_boxplot( aes(ymin = y0, lower = y25, middle = y50, upper = y75, ymax = y100), stat = identity ) dev.off() Q0=df$y0 Q1=df$y25 Q2=df$y50 Q3=df$y75 Q4=df$y100 geom_boxplot( mapping = NULL, data = NULL, stat = boxplot, position = dodge, ..., outlier.colour = NULL, outlier.color = NULL, outlier.fill = NULL, outlier.shape = 19, outlier.size = 1.5, o utlier.stroke = 0.5, outlier.alpha = NULL, notch = FALSE, notchwidth = 0.5, varwidth = FALSE, na.rm = FALSE, show.legend = NA, inherit.aes = TRUE) 以上为 geom_boxplot() 参数选择项 geom_boxplot(aes()) , aes() 中的参数选项: x lower upper Middle : ymin : 下限 ymax :上限 alpha colour fill group linetype shape size weight 使用方法:示例 aes (ymin = y0, lower = y25, middle = y50, upper = y75, ymax = y100), 参考资料: http://ggplot2.tidyverse.org/reference/geom_boxplot.html http://wiki.mbalib.com/wiki/%E7%AE%B1%E7%BA%BF%E5%9B%BE https://zh.wikipedia.org/wiki/%E5%9B%9B%E5%88%86%E4%BD%8D%E6%95%B0
个人分类: ggplot2|11 次阅读|0 个评论
关于R里面箱线图中去掉异常值的代码
热度 1 laijiangshan 2015-5-21 23:04
刚有学生问如何去掉箱线图中的 异常值(就是用点表示那些数据),然后求各组的平均值。我简单写个代码,供大家参考! 数据 pixcel.csv pixcel=read.csv(pixcel.csv,header=T) outliers=function(data1) {n=ncol(data1) cmean=vector() for (i in 1:n) { a=na.omit(data1 ) cmean =mean(a ) } boxplot(pixcel,outline = F) return(cmean) } outliers(pixcel)
25649 次阅读|2 个评论
如何绘制箱线图(Box-& Whisker Chart)
热度 5 小水獭 2014-2-25 11:50
如何绘制箱线图(Box--Whisker Chart) 厚颜无耻的人肉翻译机小水獭又活奔乱跳滴跳出来了,本獭看到一篇文章上使用了箱线图(box--Whisker Chart)来表示数据的分布,觉得很帅,于是想要学着画一张.可惜Excel不给力啊 不能直接画,还需要转换一下数据值.于是用google百度了一下,网络世界真是能人辈出啊,学会以后为了今后自己的使用方便,在此做个笔记. 首先计算出样本的最大值,最小值,分位数1,中位数,分位数3. 在Excel里 有一个quartile的自带公式.Array选择需要统计的数据,quart值为0就是选出最小值. quart值为1就是选出第一分位数(就是数值在数据中处于25%大小的那个值). quart值为2就是选出中位数,注意不是平均值,是数据刚好处于样本中间(50%)的那个值. quart值为3就是选出第三分位数. quart值为4就是选出最大值. 得出下图 作图不是基于这个数据表而是再进一步计算得出: 然后作图,在chart里选择2D-column中的stacked column. 先选择最底下的蓝色的图块,然后添加error bar. direction选择minus, 选择有帽的cap,数值只选negative error value,大小等于图三的q1-min. 这样最小值就标好了如图 然后就是最大值 最大值同理,点黄色的图块.direction选择plus, 选择有帽的cap,数值只选positive error value,大小等于图三的max-q3. 然后双击蓝色图块,fill选择no fill. 蓝图块消失,盒子图就悬在空中了 好了箱线图画好了,小水獭就满意了.但是闷骚的您可能喜欢高贵冷艳的黑白色,那就 参考文献: 我觉得最好的: http://www.dummies.com/how-to/content/boxandwhisker-charts-for-excel.html 也非常有用的: http://ksrowell.com/blog-visualizing-data/2012/08/24/making-a-box-and-whisker-plot-in-excel/ http://chandoo.org/wp/2012/07/31/excel-box-plot-tutorial/
个人分类: 活色生香de生物科学|55342 次阅读|8 个评论
用OriginPro 8 制作箱线图(boxplot)
Bearjazz 2012-9-7 06:38
用 OriginPro 8 制作箱线图( boxplot ) 熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 为了图文并茂,请下载pdf文件观看 用OriginPro 8 制作箱线图.pdf 箱线图 boxplot ,也叫箱体图, 在文献中经常见到,是对数据分布的一种常用表示方法。关于它的基本常识介绍参考张金龙博士的博文【 1 】 很多软件都可以绘制箱线图,例如 Excel 就可以制作简单的箱线图,参见我转载的博文《 用 Excel 制作箱线图( boxplot ) 》( http://cos.name/old/view.php?tid=41id=36 ) OriginPro 8 是一款功能强大的统计软件【 2 】【 3 】,在统计作图方面也表现出了相对的优势,在笔者看来,和其它统计作图软件对比,其功能更灵活丰富一些。下面我们就介绍一下如何使用 OriginPro 8 制作箱线图。 1、 打开 OriginPro 8 ,界面如图 2、 按列填入数据(即一列代表一组数据)和标题,如下图 3、 选择制作箱线图的数据列,点击软件偏右下方的箱线图标志(红箭头指示处) 4、 这样基本的箱线图就制作完成了 就这么简单,祝您科研愉快。 参考文献 【 1 】 什么是箱线图,张金龙, http://bbs.sciencenet.cn/blog-255662-239993.html 【 2 】 如何使用 origin 8 做作复合线性回归,熊荣川, http://blog.sciencenet.cn/blog-508298-508174.html 【 3 】 Origin 8 延长拟合曲线的方法(图文改进版),熊荣川, http://blog.sciencenet.cn/home.php?mod=spaceuid=508298do=blogid=528555
个人分类: 我的研究|20741 次阅读|0 个评论
[转载]用Excel制作箱线图(boxplot)
Bearjazz 2012-9-7 05:47
用 Excel 制作箱线图( boxplot ) 作者:谢益辉 出处: http://cos.name/old/view.php?tid=41id=36 为了图文并茂,请下载pdf文件观看 用Excel制作箱线图(boxplot).pdf   箱线图( Boxplot )也称箱须图( Box-whisker Plot ),用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱线图的中心位置为中位数(第百分之五十位数, P50 );中部的 “ 箱 ” 范围为四分位间距(即 P75 - P25 ); “ 箱 ” 两端的 “ 须 ” 一般为最大值与最小值,如果资料两端值变化较大,两端也可采用 P99.5 与 P0.5 、 P99 与 P1 或 P97.5 与 P2.5 。大家可根据数据的波动情况作出选择。   例:某研究者分别采用安慰剂、新药 10mg 、新药 20mg 治疗三个随机分组的阻塞性肺病病人,每组 100 例,治疗两周后测量最大呼气量( forced expiratory volume, FEV )。每组测量后计算获得的 P100 、 P75 、 P50 、 P25 、 P0 (即最大值、 75% 百分位数、中位数、 25% 百分位数、最小值 ** )(见下图),试绘制箱线图。 三种方案治疗阻塞性肺病后的最大呼气量箱线图   绘制箱线图需要借助于股价图中的 “ 开盘 - 盘高 - 盘低 - 收盘图 ” ,该图形需要将数据按一定的顺序排列。因此绘制箱线图时也需要将数据按 P25 、 P100 、 P0 、 P50 、 P75 的顺序排列( P25 与 P75 的顺序可对调)。具体绘制步骤如下:    ① 选取单元格区域 A1:D5 ,单击 “ 图表向导 ” 图标 ,在弹出的 “ 图表类型 ” 对话框中选中股价图的 “ 开盘 - 盘高 - 盘低 - 收盘图 ” (第 2 个子图表类型),按下一步键。    ② 在图表数据源对话框的数据区域中将 “ 系列产生在 ” 修改为 “ 行 ” ,按下一步键。    ③ 在 “ 图表选项 ” 对话框的分类( X )轴下方填入 “ 治疗组 ” ,在数值( Y )轴下方填入 “ 最大呼气量( FEV ) ” ,按完成键。    ④ 在绘图区点击右键,选取 “ 数据源 → 系列 → 添加 ” ,在 “ 名称 ” 右侧用鼠标选取单元格 A6 ,在 “ 值 ” 右侧用鼠标选取单元格区域 B6:D6 按确定键。    ⑤ 在网格线上点击右键, “ 清除 ” 网格线;在绘图区单击右键 “ 清除 ” 背景色。    ⑥ 在横坐标上单击右键,选取 “ 坐标轴格式 → 图案 ” ,右上部主要刻度线类型复选 “ 无 ” ,按确定键。    ⑦ 在纵坐标上单击右键,选取 “ 坐标轴格式 → 数字 → 数值 ” ,小数位数改为 “0” ,按确定键。    ⑧ 在箱的中心位置 P50 系列标志上单击右键,选取 “ 数据系列格式 → 图案 ” ,在界面右侧数据标记的样式处选取 “+” ,前景颜色处选黑色, “ 大小 ” 改为 6 磅 ,按确定键;在箱线图的顶部 P100 系列标志上单击右键,选取 “ 数据系列格式 → 图案 ” ,在界面右侧数据标记的样式处选取长横线 “ - ” ,前景颜色处选黑色, “ 大小 ” 改为 6 磅 ,按确定键;在箱线图的底部 P0 系列标志上单击右键,选取 “ 数据系列格式 → 图案 ” ,在界面右侧数据标记的样式处选取长横线 “ - ” ,前景颜色处选黑色, “ 大小 ” 改为 6 磅 ,按确定键。    ⑨ 适当调整绘图区的大小,调整整个图表区域的字体大小,去除图表区的边框等,可获得上图右侧的箱线图。 ----------------------------------------------- 注 ** :这五个值可以在 Excel 中用 QUARTILE(array,quart) 函数求得。由此处也可知,用 Excel 作箱线图实际上也是一种间接的方式,并不是像 SPSS 等软件那样直接生成,从统计的角度来说,更重要的是这种方法不考虑 Outliers ,所以与其他软件作出来的图可能并不一样。
个人分类: 我的研究|11603 次阅读|0 个评论
什么是箱线图
热度 2 zjlcas 2009-6-24 11:46
什么是箱线图 箱线图在文献中经常见到,是对数据分布的一种常用表示方法。但是所见资料中往往说的不是特别清楚,因此需要了解一下箱线图的绘制过程,与部分的意义。 计算过程: 1 计算上四分位数,中位数,下四分位数 2 计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range) 3 绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。 4 大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers)。 5 异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的触须。 6 极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。 7 为箱线图添加名称,数轴等。 在SPSS,SigmaPlot, R,SPlus,Origin等软件中,绘制箱线图非常方便。 下面是R中的一个箱线图举例 箱线图举例: 在R软件中输入如下命令: x-c(25, 45, 50, 54, 55, 61, 64, 68, 72, 75, 75,78, 79, 81, 83, 84, 84, 84, 85, 86, 86, 86, 87, 89, 89, 89, 90, 91, 91, 92, 100) boxplot(x) 对c向量绘制箱线图。
个人分类: 生活点滴|46005 次阅读|6 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 20:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部