科学网

 找回密码
  注册

tag 标签: 标准差

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

关于误差bar的计算以及方差标准差
richor 2018-10-29 21:51
关于误差 bar 的计算 : 应该用样本标准差。 比如 excel 中的 STDEV, STDEVP 函数,前者 1/(n-1) ,后者 1/n ,说明前者用的更多。 https://blog.csdn.net/cqfdcw/article/details/78173839 标准差=均方差, prefer 前者, standard deviation. σ 2 代表方差。是二阶中心矩。 方差有两种,一种是样本方差( sample variance ),一种是总体方差( population variance )。 https://www.zhihu.com/question/20099757 说的很好: S 2 来近似 σ 2 , S 指的是 S ample. 替换 μ 为 \0 ,则 1/n 变成 1/(n-1) 。 考虑到 n-1 之后,将左边变大了。 详细推导: 考虑到: 进一步得到: 如果有: 那么 因此, 1/(n-1) 之后,会得到期望值为 σ 2 . 将 n 个 X i 作为一组随机样本,才可以定义其期望值。 随机变量 X ,才有期望值。概率论的基础。 的证明: https://math.stackexchange.com/questions/1363505/prove-that-e-overlinex-mu2-frac1n-sigma2 这里又用到了这些: 这可从 Var(X) 的定义上很容易得到。
个人分类: 数学|2 次阅读|0 个评论
[转载]慎用excel求协方差(或方差)
meiweipingg 2016-12-6 20:46
  小心你算的协方差(或方差)不是你所要的协方差(或方差)! 原文: http://blog.sina.cn/dpool/blog/s/blog_62b13cf20101355a.html 一、前言 最近发现在用excel 2010时求协方差和方差的命令都变了。以为是微软抽了,仔细研究才发现其中大有奥妙! 直接用excel求协方差算出来的数不是你要的数! 二、关于excel的方差和协方差 2.1 excel的公式 仔细看过excel的公式的,会发现excel的公式有点问题。对于 方差 来说,var命令的公式是 / 。也就是说,这个公式求出来的是“样本方差,也就是除以 分母n-1 ,以消除样本的平均数不是变量的平均值导致估计结果不是无偏的。所以对于方差来说,用var命令一点问题都没有。 而 协方差,covar命令问题就大了 。根据excel帮助,其公式是 1/n{∑(xi-μx)(yi-μy)} 。注意,这里完全是协方差的定义,而变量的平均值μ是不可能求的到的,也就是说,只能用样本的平均数代替变量的平均值,样本量越大偏离越小。但是这个结果不是我们要的结果,我们要的东西可以称作“ 样本 协方差 ”,也就是前面的系数 应该是1/n-1,而不是1/n 。 如果单纯用var和covar求构成协方差矩阵,那么你的协方差 全部有问题! 2.2 excel 2010的结局方案 excel 2010中,微软终于注意到了这个问题 。对此,微软采用了新的命令以取代原有命令。但是原来命令依然可以用以保持兼容性。 对于方差,var.s命令和原先的var命令一样,求得样本方差,而var.p命令公式中是除以n而不是n-1,是按定义求得的方差。 同时,对于协方差,covariance.p函数和原先的covar命令完全一样,是定义的协方差, covariance.s就是求的样本协方差,也就是真正需要的协方差。 2.3 其他统计软件 以eviews为例,在相关性分析中,采用标准算法,默认是按照定义计算。如果勾选 d.f. corrected covariances 选项,则计算结果为样本方差和样本协方差。口径是统一的,不像excel的口径不统一。 2.4 excel 2007以及以前版本的结决方案 从目前结果看,采用部分excel计算的投资学教程是这样算的:方差采用varp而不是va r,也就是n方法计算;协方差直接使用covar计算,也是n方法,从而口径统一。虽然在具体数值上面有偏,但是对于投资组合的相互比较,以及β的计算上完全没有影响。 根据各大计量和统计论坛上的结果看,专业人士普遍采用自己构造方差的方式计算协方差。具体在于使用MMult命令, 举个例子,a的取值放在A1:J1(1x10),a和b不同取值的概率分布是A3:H12(10x8),b的取值在A14:A21(8x1),那么就用: MMULT(MMULT(A1:J1,A3:H12),A14:A21) 求的相应的协方差 具体MMult命令的高级使用,可以参考这里 http://club.excelhome.net/thread-270255-1-1.html 2.5 其他 在诸多资料中,均提及excel 数据分析工具。这是一个独立的分析模块。具体内容我至今未知,也不知道从哪里下载…… 2010中除了var 和 covar外,stdevp命令也改为stdev.p , stdev改为stdev.s。其中stdevp和stdev.p 为n的计算方法,认为参数为整个样本总体; stdev和stdev.s 为n-1的方法以使结果无偏(博主按:这才是正在需求的方差)。  
个人分类: 数据处理与统计分析|4555 次阅读|0 个评论
应用MEGA6进行替换饱和分析作图
tongwenjun 2016-3-23 14:27
步骤: 1.计算序列之间的p距离:Distance--Compute Pairwise Distances--激活数据--设置参数(substitutions type:nucleotide or aa;model/method:p-distanc;substitutions to include:d:transitions +transversions;gaps/missing data treatment:pairwise deletion,选择所有位点)--compute--计算所得的遗传距离为总替换距离。在结果窗口工具栏点击XL按钮,则结果在excel中以三列或四列(多一列标准差)的xls格式输出。 2.计算序列之间的转换距离:计算时将 substitutions to include设置为s:transitions only,其他同上。 3.计算序列的颠换遗传距离: 将 substitutions to include设置为v:transvertions only,其他同上. 4.excel作图: ①导入数据:将计算获得的三种遗传距离排成三列(顶端标识为p距离、Ts、Tv,注意要将p距离放在第一列,因为excel作图时一般将第一列默认为横坐标),列与列之间不要留空白列。 ②作图:选定三列数据,点击主菜单的“插入--图表”,选择XY散点图,设置图例标题等。该图表可直接复制到word中使用,也可以在Photoshop中转换成独立的“*.jpg”文件保存备用,需要时再插入word中。 参考书目:分子系统发生学--黄原--第六章数据集系统发生信号评估P196-197
个人分类: 分子系统发生学|7243 次阅读|0 个评论
[转载]标准差与标准误差的区别
tangshanlhf 2015-12-25 18:58
标准差表示数据的离散程度,或者说数据的波动大小。标准误表示抽样误差的大小。 统计教材上一般都写标准误表示均数的抽样误差,这对于初学者很难理解。这里通过举例来说明含义。 比如,有一个学校,学校中共有1000名学生,则这1000名学生可以作为这个学校学生的总体。如果我想了解所有学生的身高,采用随机抽样,抽取了50人。这50人就是一个样本。这里需要注意:一个样本并不是指一个人,而是指一次抽样。一个样本可以是1个人,也可以是100人,这里的1和100就是样本大小。 从理论上讲,抽样误差表示这样的意思:即如果不止抽样一次,而是抽样10次,每次都50人,那么我就有10个均数和标准差。例如下图,大圈代表总体1000人,一个小圈代表一个样本,即50人。每个样本都能计算计算一个均数和标准差。 以这10个均数作为原始数据,仍然能计算出一个均数和标准差,以这10个均数计算出的标准差就称之为标准误( 实际上是指:样本的平均数的平均数的标准差,即:标准误 )。这是理论上的含义,实际的含义就代表抽样误差的大小,即抽取的样本代表性好不好,抽样误差越小,代表性越好,反之,代表性越差。( 也可以理解为:抽样分布,诸如:T分布,F分布和卡方分布,等等,代表着理论上的抽样分布,可以作为一种常模进行比较,像统计书后面的各种分布表。 ) 如果我对学校中的1000人都测量了身高,那理论上就没有标准误,也就是没有抽样误差了,因为我测量了总体,这时就不存在标准误了。但是标准差是存在的,因为这1000人的身高肯定不同,肯定会有波动。这里就充分表明了 标准差和标准误的区别 了。 标准差与标准误的意义、作用和使用范围均不同。标准差(亦称单数标准差)一般用s 表示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误一般用S x 表示,反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小,是量度结果精密度的指标。 样本标准差: 样本平均数的标准误: 本文引用地址: http://blog.sciencenet.cn/blog-479412-481776.html
个人分类: 教育心理学统计|57 次阅读|0 个评论
[转载]均方根值(RMS)+均方根误差(RMSE)+标准差(Standard Deviation)
dabing 2015-7-21 20:37
1、均方根值( RMS )也称作为效值 , 它的计算方法是先平方、再平均、然后开方。 2、 均方根误差, 它是观测值与真值偏差的平方和观测次数 n 比值的平方根, 在实际测量中,观测次数 n 总是有限的,真值只能用最可信赖(最佳)值来代 替 . 方根误差对一组测量中的特大或特小误差反映非常敏感,所以, 均方根误差能够很好地反映出测量的 精密度。 均方根误差,当对某一量进行甚多次的测量时,取这一测量列真误差的均方根差(真误差平方的算术平均值再开方),称为标准偏差,以σ表示。σ反映了测量数据偏离真实值的程度,σ越小,表示测量精度越高,因此可用σ作为评定这一测量过程精度的标准。 3、标准差( Standard Deviation ) , 标准差是方差的算术平方根, 也称均方差( mean square error ),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示,标准差 能反映一个数据集的离散程度 。 转自:http://blog.163.com/jey_df/blog/static/1825501612013411105655629/
个人分类: 文化底蕴|3839 次阅读|0 个评论
Teradata 中计算方差和标准差
l512002855 2013-12-27 10:47
用Teradata自带的函数 --样本标准偏差--STDDEV_SAMP--等价于样本标准差 --全体标准偏差--STDDEV_POP --等价于总体标准差 --样本变异函数--VAR_SAMP --等价于样本方差 --全体变异函数--VAR_POP --等价于总体方差
个人分类: Teradata|10851 次阅读|0 个评论
[转载]方差、标准差和协方差
热度 2 JRoy 2013-4-6 02:58
方差 样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。 数学上一般用E{ ^2}来度量随机变量X与其均值E(X)的偏离程度,称为X的 方差 。 定义 设X是一个随机变量,若E{ ^2}存在,则称E{ ^2}为X的方差,记为D(X)或DX。即D(X)=E{ ^2},而σ(X)=D(X)^0.5(与X有相同的量纲)称为 标准差 或 均方差 。 由方差的定义可以得到以下常用计算公式: D(X)=E(X^2)- ^2 方差的几个重要性质(设一下各个方差均存在)。 (1)设c是常数,则D(c)=0。 (2)设X是随机变量,c是常数,则有D(cX)=c^2D(X)。 (3)设X,Y是两个相互独立的随机变量,则D(X+Y)=D(X)+D(Y)。 (4)D(X)=0的充分必要条件是X以概率为1取常数值c,即P{X=c}=1,其中E(X)=c。 如果说方差是用来衡量一个样本中,样本值的偏离程度的话, 协方差 就是用来衡量两个样本之间的相关性有多少,也就是一个样本的值的偏离程度,会对另外一个样本的值偏离产生多大的影响,协方差是可以用来计算相关系数的,相关系数P=Cov(a.b)/Sa*Sb,Cov(a.b)是协方差,SaSb分别是样本标准差。 从它的定义来说,叫协方差是比较合适的,表示两个标量之间协变动(comovement)的状况. 对二维随机向量(X,Y)来说,期望E(X),E(Y)只反映了X,Y各自额平均值,方差D(X),D(Y)只反映了它们各自与自己均值的偏离程度,它们对X,Y之间的相互关系不提供任何信息。 我们知道当X,Y相互独立时,有 E((X-E(X))(Y-E(Y))=0由此可知,如不等于0,则它们肯定不独立 于是定义: 设(X,Y)是二维随机变量,若E(|(X-E(X))(Y-E(Y))|)小于无穷大,则称 E((X-E(X)(Y-(Y)))为X与Y的协方差,记为Cov(X,Y). 即: Cov(X,Y)=E(((X-E(X))(Y-E(Y))) 计算式: Cov(X,Y)=E(XY)-E(X)E(Y) 注:关于标准方差和方差的关系很直接就是开方,在matlab里面利用标准方差和协方差生成随机数, Generatevaluesfromanormaldistributionwithmeanaandstandard deviationR. r=a+R.*randn(100,1); Generatevaluesfromabivariatenormaldistributionwithspecifiedmean vectorandcovariancematrix. mu= ; Sigma= ;R=chol(Sigma); z=repmat(mu,100,1)+randn(100,2)*R; 注意,协方差和标准方差都表现为直接乘以随机变量randn
个人分类: 科研笔记|4810 次阅读|4 个评论
两数相除,其方差怎么算
热度 2 pingcn 2012-12-3 23:06
两数相除,其方差怎么算
这两天除了日常工作、年底总结、项目总结之外,一直都在琢磨一下的问题: 如果有两组数,A和B。他们可以用平均值mean±标准差SD表示为: A = 22 ± 0.03 B = 20 ± 0.02 那么 A / B (i.e. A 除以 B)的标准差怎么算? 请教某高人,人家给一个图片就没信儿了。 这个图我琢磨了两天,感悟是,都怪自己大学时候统计没学好啊…… 图片如下: 现在知道了,其中—— μ是平均数mean;δ则是总体标准差; var是方差variance;cov(X,Y)是X,Y的协方差。 目前,其他几个都明白了,只是,还是不太明白这个cov是怎么算的。 PS:突然发现以上公式适用于符合正态分布的数据。那么,对于不符合正态分布的数据,又该怎样处理? 明天继续。欢迎懂的人不吝赐教。
1215 次阅读|9 个评论
26、小波包消噪及曲线光滑度估计
baishp 2012-11-30 00:09
26、小波包消噪及曲线光滑度估计
上一篇博文一维小波消噪,消噪的结果,残差的: 阈值: Fixed SURE Minimaxi 标准差: 15.23、 2.673、 11.97 平均绝对差:12.31、 2.267、9.662 模数: 3679、 645.5、 2890 消噪信号与原信号的模数比: Fixed阈值的:normr1=norm(TWden_fix)/norm(TW4860_r)=0.7205; SURE阈值的:normr2=norm(TWden_rig)/norm(TW4860_r)=0.9846; Minimaxi阈值的:normr4=norm(TWden_mnmx)/norm(TW4860_r)=0.7891。 感觉消噪要么太过,要么不及。觉得模数比在0.9~0.95附近才比较好。 模数与标准差、绝对差的定义、计算方法虽然不一样,但它们的变化步调是一致的。如果用消噪信号的标准差、绝对差比上原信号的标准差、绝对差,所得结果与上面的模数比基本上是一样的。残差的模数、标准差、绝对差与原信号的模数、标准差、绝对差之比也基本上是一样的。所以模数比反映的其实也是消噪信号与原信号的相似度。 将体温信号序列TW4860_r导入小波分析GUI界面,改变各种消噪的方式、参数,完全用它默认的设置进行消噪。下图是用sym5小波对信号进行小波包分解、消噪的截图: 图26-1 界面中小波包最多能分解12层,我的系统资源最多能将此信号分解8层,但消噪最多只能消噪到6层,所以就按6层分解。上左图为最优小波树,各节点上的数字表示各节点所占能量百分比;下左图为我随选的节点 的重构信号(系数);上右图原始信号;下右图为叶子节点染色系数。 点其上De-noise进入消噪界面。截图如下: 图26-2 选定中度惩罚阈值penalize medium,再点其中的De-noise开始消噪。左上图为系数绝对值排序;左下图为系数绝对值的直方图;右上图红色为原始信号,紫色为消噪信号;右中图为原系数,右下图为阈值作用后系数。 点residuals打开残差观察窗口,截图如下: 图26-3 点图26-2的View Denoised Signal,打开消噪信号观察窗口,如下: 图26-4 TW4860_r及其消噪信号时域波形对比 上图信号曲线是局部放大了的。红色为原信号,黑色为消噪信号。将消噪信号导出,记为TWpsy5den_med,表示体温、小波包、sym5小波、消噪信号、中度惩罚阈值。消噪残差也导出,记为TWpsy5res_med,表示体温、小波包、sym5小波、消噪残差、中度惩罚阈值。 下面是TW4860_r、TWpsy5den_med、TWpsy5res_med功率谱比较图。蓝、紫、黄色分别是TW4860_r、TWpsy5den_med、TWpsy5res_med功率谱。 图26-5 TW4860_r、TWpsy5den_med、TWpsy5res_med功率谱比较图 图26-6 图26-5低频端放大 可见消噪信号与原信号功率谱低频端完全重合,残差功率谱图只是极小的一条水平线。 图26-7 图26-5高频端放大 可见消噪信号与原信号功率谱高频端有明显差异。除了消噪信号整体数值变小,波形也不完全一致。图中实标尺线处,消噪信号的一个峰值对应于原信号的一个峰值,但虚标尺线消噪信号的一个峰值对应于原信号的一个谷值附近。 将图26-2界面的阈值改为高惩罚阈值penalize high、低惩罚阈值penalize low消噪,并将消噪信号导出,记为TWpsy5den_hi、TWpsy5den_low。 看看各消噪信号与原信号的模数比(也是相似度度量之一): normrh=norm(TWpsy5den_hi)/norm(TW4860_r) normrm=norm(TWpsy5den_med)/norm(TW4860_r) normrl=norm(TWpsy5den_low)/norm(TW4860_r) 运行,得: normrh = 0.9576 normrm = 0.9662 normrl = 0.9687 下面是各消噪信号与原信号的标准差比: stdrh=std(TWpsy5den_hi)/std(TW4860_r) stdrm=std(TWpsy5den_med)/std(TW4860_r) stdrl=std(TWpsy5den_low)/std(TW4860_r) 运行,得: stdrh = 0.9575 stdrm = 0.9661 stdrl = 0.9686 下面是各消噪信号与原信号的平均绝对差比: madrh=mad(TWpsy5den_hi)/mad(TW4860_r) madrm=mad(TWpsy5den_med)/mad(TW4860_r) madrl=mad(TWpsy5den_low)/mad(TW4860_r) 运行,得: madrh = 0.9575 madrm = 0.9661 madrl = 0.9685 我觉得这几个数值比上篇中的处理结果要好。 曲线的光滑度,我觉得可以用它的功率谱的低、高频部分的能量比来衡量,数值越大越光滑(当然也可以用它的功率谱的高、低频部分的能量比来衡量,数值越小越光滑)。 函数m文件: ----------------------- function S=smn(X,Order,Nfft,Fs) %求函数光滑度S Nfft=2^16;%快速傅立叶算法点数 Order=10000;%参数估计法阶数,选取原则参见第6篇博文 Fs=Nfft;%采样频率取Nfft,为使P_TW序号等于圆频率(再加“1”) P=pyulear(X,Order,Nfft,Fs);%功率谱估计 P_1=P(2:end); Sl=sum(P_1(1:length(P_1)/2));%低频部分能量 Sh=sum(P_1(length(P_1)/2+1:end));%高频部分能量 S=Sl/Sh;%光滑度 end ------------------------ 以文件名“smn”保存。 %消噪信号TWpsy5den_hi的光滑度Sdh: sdh=smn(TWpsy5den_hi) %消噪信号TWpsy5den_med的光滑度Sdm: sdm=smn(TWpsy5den_med) %消噪信号TWpsy5den_low的光滑度Sdl: sdl=smn(TWpsy5den_low) %原信号TW4860_r的光滑度Stw: stw=smn(TW4860_r) 运行,分别得: sdh = 398.4736 sdm = 228.5763 sdl = 196.7536 stw = 53.7294 光滑度分别提高倍数: smnrh=sdh/stw smnrm=sdm/stw smnrl=sdl/stw 运行,分别得: smnrh = 7.4163 smnrm = 4.2542 smnrl = 3.6619 光滑度提高倍数越来越小。可见在信号消噪这件事情中,消噪信号与原信号相似度越高,光滑度提高倍数就越小。用相似度与光滑度当中的一个指标衡量消噪效果就可以了。 (本文首发于: http://blog.sina.com.cn/s/blog_6ad0d3de01013iuc.html 首发时间:2012-03-04 23:09:12)
个人分类: 斤斤计较|3833 次阅读|0 个评论
excel里,快速输入大量“平均值±SD”的方法
热度 2 pingcn 2012-10-7 15:27
处理数据时候,在excel里面计算出平均数(mean) 和 标准差(SD)后,论文里面一般要列成mean ± SD的格式。 以前我都是手动输入输很久。今天研究了一下发现,其实,这个可以用excel直接生成。 比如mean的一列,是C, SD的数据那一列是D,那么 用公式,=C2" ± "D2,就是mean ± SD了 (空格是因为论文里面要求空格,如果不需要空格,公式里的空格去掉) 如果遇到了 mean和SD是用公式计算、小数点后面有N位的情况,上述公式列出数字是N位。 则可以用函数round: =ROUND(C8,2) 可以把C8的数字变成小数点后2位的。 或者,先把单元格里变成数值,显示小数点后两位,然后 点“工具”/“选项”/在“重新计算”标签页中勾选“以显示精度为准”。 然后再使用上述=C2" ± "D2,列出的mean ± SD就是小数点后有2位了。嘻嘻。 分享一下,希望大家做科研能更顺利~~
59 次阅读|2 个评论
不严谨的美中合作金大米一文
热度 6 fs007 2012-9-10 00:42
不严谨的美中合作金大米一文
寻正 金大米中国儿童实验在中国受到广泛关注,这里我不谈其它的,就谈谈文章本身,我发现有几处统计学上不严谨的地方。 一是作者描述在112名学生中选出72名受试者,而最终只有68名受试者提供了足够的血清样本进行研究,这也体现在表1与表2针对受试者的描述中。然而,我诧异地发现,在表3中,统计 β-胡萝卜素的转化率时,忽然样本量增加到了69。在菠菜组增加的这一名受试者是笔误呢?还是其它原因? 二是作者在表3中显示直接服用 β-胡萝卜素组的转化率平均为2.0,然而在男孩平均为2.4,女孩平均为2.7,查表1可知,男孩为13人,女孩为10人,怎么可能总平均小于男孩与女孩的平均值? 三是表3中的标准差,如果我们用表1的男孩女孩分布,结合表中提供的男孩女孩的标准差,计算可得总的标准差分别为1.3,1.1,与3.2,跟表中提供的0.9,0.8,0.8完全合不上。 抛开该研究的伦理学问题,这些明显的数据问题让该文可信度大减。 论文原文见俞强博文: 唐广文大米.pdf
个人分类: 实事评论|5296 次阅读|8 个评论
[转载]标准差与标准误的区别
syfox 2012-8-19 21:35
在日常的统计分析中,标准差和标准误是一对十分重要的统计量,两者有区别也有联系。但是很多人却没有弄清其中的差异,经常性地进行一些错误的使用。 对于标准差与标准误的区别,很多书上这样表达:标准差 表示数据的离散程度, 标准误 表示抽样误差的大小。这样的解释可能对于许多人来说等于没有解释。 其实这两者的区别可以采用数据分布表达方式描述如下:如果样本服从均值为 μ,标准差为δ的正态分布,即 X ~ N( μ , δ 2 ), 那么样本均值服从均值为 0 ,标准差为δ 2 /n 的正态分布,即  ~ N(μ, δ 2 /n) 。这里δ为标准差,δ /n 1/2 为标准误。明白了吧,用统计学的方法解释起来就是这么简单。 可是,实际使用中总体参数往往未知,多数情况下用样本统计量来表示。那么,关于这两者的区别可以这样表述:标准差是样本数据方差的平方根,它衡量的是样本数据的离散程度;标准误是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中,习惯用样本均值来推断总体均值,那么样本均值的离散程度(标准误)越大,抽样误差就越大。所以用标准误来衡量抽样误差的大小。 在此举一个例子。比如,某学校共有 500 名学生,现在要通过抽取样本量为 30 的一个样本,来推断学生的数学成绩。这时可以依据抽取的样本信息,计算出样本的均值与标准差。如果我们抽取的不是一个样本,而是 10 个样本,每个样本 30 人,那么每个样本都可以计算出均值,这样就会有 10 个均值。也就是形成了一个 10 个数字的数列,然后计算这 10 个数字的标准差,此时的标准差就是标准误。但是,在实际抽样中我们不可能抽取 10 个样本。所以,标准误就由样本标准差除以样本量来表示。当然,这样的结论也不是随心所欲,而是经过了统计学家的严密证明的。 在实际的应用中,标准差主要有两点作用,一是用来对样本进行标准化处理,即样本观察值减去样本均值,然后除以标准差,这样就变成了标准正态分布;而是通过标准差来确定异常值,常用的方法就是样本均值加减 n 倍的标准差。标准误的作用主要是用来做区间估计,常用的估计区间是均值加减 n 倍的标准误。
个人分类: 学习|4675 次阅读|0 个评论
[转载]如何进行变量的中性化处理
zhangjing121 2011-10-2 10:18
有几种方法,这里介绍最常用的两种,一种是减去平均值,一种是z分数。 减去平均值:先进行一个description统计,得到描述性统计结果,有平均数和标准差。然后使用compute命令,新建一个变量=原变量-平均数。 z分数,和上面的结果差不多,只不过在新变量的基础之上除以标准差,得到一个分数。
4158 次阅读|0 个评论
关于NeQuick模型的精度比较结果
zheyang 2011-4-8 12:02
1.由电离层参数作为NeQuick模型的输入参数 两个模型的相对标准差均值为24%,其中NeQuick2为17%; 两个模型低估率均值为25%; 2.由STEC计算有效电离层因子作为NeQuick模型的输入参数 两个模型的相对标准差均值为16%,其中NeQuick2为15%; 两个模型低估率均值为8%; 利用前几天的Az参数估计当天的Az使得相对标准差均值为21%; 3.电离层改正算法 GPS ICA 低估率为20%,相对标准差为32%; Galileo ICA 低估率为8%,相对标准差大约为20%左右; GPS ICA 标准差是Galileo ICA 标准差的1.5倍。
个人分类: 专业学习笔记|73 次阅读|0 个评论
标准差与标准误差
热度 3 阿路龟 2010-12-26 20:48
by: ysuncn(欢迎转载,请注明原创信息) 什么是标准差(standard deviation)呢?根据国际标准化组织(ISO)的定义:标准差是方差 2 的正平方根;而方差是随机变量期望的二次偏差的期望,这个就不用解释了。 什么是标准误差(standard error)呢?看了些文献,有的还是大牛的,定义都不统一,通常来说有两种定义方式: 1、样本容量为 的标准误差是样本的标准差除以 。ps:这里还有人用样本的标准差除以n来作为标准误差(估计是弄错了,不过 标准误差是基于总体均值来估计标准差 ,所以也没有必要说人家错); 2、一个统计量的标准误差还可以用估计误差 的标准差来刻画即: 。 下边来自编辑学报郝拉娣的《标准差与标准误》,相关性也比较大,希望对大家有帮助。 标准差作为随机误差(或真差) 的代表,是 随机误差绝对值的统计均值 。在国家计量技术规范中,标准差的正式名称是标准偏差,简称 标准差 ,用符号表示。标准差的名称有10 余种,如总体标准差、母体标准差、均方根误差、均方根偏差、均方误差、均方差、单次测量标准差和理论标准差等。标准差的定义式为: 用样本标准差s 的值作为总体标准差的估计值。样本标准差的计算公式为: 。 在抽样试验(或重复的等精度测量) 中, 常用到样本平均数的标准差,亦称样本平均数的标准误或简称 标准误 ( standard error of mean) 。因为样本标准差s 不能直接反映样本平均数?x 与总体平均数究竟误差多少, 所以, 平均数的误差实质上是 样本平均数与总体平均数之间的相对误 。可推出样本平均数的标准误为 ,其估计值为 ,它反映了样本平均数的离散程度。标准误越小, 说明样本平均数与总体平均数越接近,否则,表明样本平均数比较离散。 标准差是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是 数据精密度 的衡量指标;而标准误反映样本平均数对总体平均数的变异程度,从而反映抽样误差的大小 ,是量度 结果精密度 的指标。 总之: 标准偏差是距离中心点的误差有多大; 标准误差是你测量点的数据的集中度; 所以,标准偏差越大离你的目标越远; 标准误差大,你测量的数据的集中度就分散的很。 参考: http://mathworld.wolfram.com/StandardError.html http://zh.wikipedia.org/zh-cn/%E6%A0%87%E5%87%86%E8%AF%AF http://zh.wikipedia.org/zh-cn/%E6%A0%87%E5%87%86%E5%B7%AE 附件下载: 编辑学报--标准差与标准误
个人分类: 科研|33992 次阅读|3 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-20 23:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部