科学网

 找回密码
  注册

tag 标签: 平均数

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

提高国民数学素质的黄金大道
cgh 2017-7-10 22:29
提高国民数学素质的黄金大道 1、国家统计局的统计数据是国民实践数学,尤其是算术水平的绝好材料。比如,普通人对平均数的感性理解与统计专家的理解就存在很大差异,国民素质有待提高。 2、评审投票表决是高级国民数学考验的生活史。比如,项目评审、职称晋级、文章审稿,三分之二的支持投票是硬道理,谁也改变不了,不要扯什么委员会组成、专家回避、横向对比。成果数量算术和比什么都深刻。 3、收入的计算体现高级算术,用到加权求和。比如,不同级别项目绩效提成比例因子,不同级别文章奖励绩点。 中国国民数学素质好,来源于长期的生活实践,还别提汉语成语一大堆相关的,比如斤斤计较、毫厘不差、化繁为简、九牛二虎、天壤之别……
个人分类: 杂谈|2365 次阅读|0 个评论
[转载]青岛超10%老人患重度精神疾病 孤独是诱因
xuxiaxx 2013-3-7 20:38
青岛一成多老人患重度精神疾病    孤独和经济状况差是致病主因   近日一份调查显示,在青岛有10%以上的老年人患有重度精神疾病,这一惊人的数字再度引起了人们对老年人精神的关注。据介绍,经济状况、空巢、失独、财产继承和婚姻问题成为影响老年人心理的几大原因。   近日,青岛大学国际商学院教授、青岛大学生涯辅导与心理咨询中心主任陶明达关于老年人心理健康的调查显示:青岛有10%以上的老年人患有重度精神疾病。目前青岛市60岁以上老年人为138.8万人,意味着约14万老年人的心理问题亟待解决。而精神和心理方面的问题又容易诱发老年痴呆,记者从青岛市精神卫生中心的调研中了解到,在青岛老年人口中,老年痴呆患者占6.9%,达到9万余人,远远高于中国的平均数4.6%。   陶明达介绍,孤独是诱发老年人精神疾病的重大因素,“孤独”似乎成了老年人的代名词,几乎每个老人都有孤独感,空巢、失独老人的这种感受更为突出。目前,青岛市有66%的城市老人、77%的农村老人为空巢老人,全国每年新增7.8万失独老人,这些老人都在饱受孤独之痛。除了孤独感,经济状况、财产继承、婚姻问题也是导致老年人精神疾病的重大因素。陶明达指出,目前青岛市约有20%的老年人存在经济上的压力,他们大多数子女及自身医药负担严重,两千多元的退休金根本解决不了问题。   如何解决老年人的心理问题?陶明达说,首先是社会应该加大对老年人心理的重视程度,定期为老年人设置心理关爱与咨询,发动社会力量去肯定老年人,认可老年人,给予老年人成就感。其次是解决空巢老人和失独老人的问题,摆脱简单的居家养老,发动社会力量养老,建设社区日间照料中心,政府为老年人购买服务。此外,老年人还需要改变自己的心理状态,摆脱对子女的依赖度,学会独立与自信。(记者 陈之焕) 来源: http://health.people.com.cn/n/2013/0307/c14739-20705161.html
1103 次阅读|0 个评论
两数相除,其方差怎么算
热度 2 pingcn 2012-12-3 23:06
两数相除,其方差怎么算
这两天除了日常工作、年底总结、项目总结之外,一直都在琢磨一下的问题: 如果有两组数,A和B。他们可以用平均值mean±标准差SD表示为: A = 22 ± 0.03 B = 20 ± 0.02 那么 A / B (i.e. A 除以 B)的标准差怎么算? 请教某高人,人家给一个图片就没信儿了。 这个图我琢磨了两天,感悟是,都怪自己大学时候统计没学好啊…… 图片如下: 现在知道了,其中—— μ是平均数mean;δ则是总体标准差; var是方差variance;cov(X,Y)是X,Y的协方差。 目前,其他几个都明白了,只是,还是不太明白这个cov是怎么算的。 PS:突然发现以上公式适用于符合正态分布的数据。那么,对于不符合正态分布的数据,又该怎样处理? 明天继续。欢迎懂的人不吝赐教。
1215 次阅读|9 个评论
excel里,快速输入大量“平均值±SD”的方法
热度 2 pingcn 2012-10-7 15:27
处理数据时候,在excel里面计算出平均数(mean) 和 标准差(SD)后,论文里面一般要列成mean ± SD的格式。 以前我都是手动输入输很久。今天研究了一下发现,其实,这个可以用excel直接生成。 比如mean的一列,是C, SD的数据那一列是D,那么 用公式,=C2" ± "D2,就是mean ± SD了 (空格是因为论文里面要求空格,如果不需要空格,公式里的空格去掉) 如果遇到了 mean和SD是用公式计算、小数点后面有N位的情况,上述公式列出数字是N位。 则可以用函数round: =ROUND(C8,2) 可以把C8的数字变成小数点后2位的。 或者,先把单元格里变成数值,显示小数点后两位,然后 点“工具”/“选项”/在“重新计算”标签页中勾选“以显示精度为准”。 然后再使用上述=C2" ± "D2,列出的mean ± SD就是小数点后有2位了。嘻嘻。 分享一下,希望大家做科研能更顺利~~
59 次阅读|2 个评论
儿戏乎?统计乎?——游戏中的统计思维
热度 3 hhj91 2012-8-2 14:30
儿戏乎?统计乎?——游戏中的统计思维 统计学,从方法特征上讲,是由平均数贯穿统计研究、实践始终的一门科学。平均数,从基础功能上讲,主要是统计描述。因此,又可以把平均数分化为由平均指标、变异指标和相关系数形成的定量描述体系。 统计方法由于复杂性令人生畏,但因其重要性令人无法敬而远之,众人只能望而兴叹。事实上,复杂,只是统计方法的表象,其本质上的逻辑却是平凡的,与生活中的思考方式并无二致。 在日常生活中,我们对一个物体的定量描述包括,①物体自身特征刻画:有多重?有多大? ②该物体与其他事物的关系:和周围的物体是远还是近? 事实上,统计学人对统计研究对象的看法,也不外乎这个逻辑:平均指标有类似于质点的特征 ( 回答有多重 ) ;变异指标有类似于物体长短、大小的特征 ( 回答有多大 ) ;而相关系数则描述了统计对象的相对位置 ( 角度 ) 关系 ( 回答是远还是近 ) 。 为了便于对统计表述逻辑的理解,以便进一步系统理解统计方法,笔者并不追求概念表述的严谨性及物理规律严密性,就以儿时吹气球、玩木棍等生活经历,尝试对统计学的思维逻辑进行直观解释。 一、吹气球与平均指标、变异指标 我们儿时都有吹气球的经历。一个气球,不论吹多大,特征不会变 ( 为了便于说明,按照儿时的认识,假定吹进去的“空气”是“空”的 ) ,本质上就是原先的气球皮——由于生产规格的不同,大号气球皮能吹很大,小号气球则不行。 这一“规格”决定了气球的本质特征,我们可以从吹起来的气球“中间”找到一点代表这个气球。这种物理抽象代表和统计描述中平均指标设置的逻辑如出一辙,即从一堆复杂的事物中整理出一个有代表性的点来。 什么是“中间”?这在统计学中还颇有讲究。可以按照直观认识,把“中间”认为是气球位置的中心,统计上称之为中位数 ( 一种位置平均数 ) ;而按照中学物理的知识,“中间”可以是气球质量的中心 ( 质点 ) ,统计上称之为算术平均数 ( 一种数值平均数 ) 。如果气球皮的生产质量过硬,质地均匀,上述两种“中间”设置应该一致或偏离不大;若气球皮粗制滥造,前重后轻,左厚右薄,则上述两种“中间”设置会存在差异。 按照上述认识,顺便指出,网上流传的“张家有个一千万,邻居九个穷光蛋,平均起来算一算,个个收入过百万”顺口溜,若认为穷光蛋的收入为 0 ,该顺口溜表述的实际上是基尼系数等于 1 的情形。网友正是利用这种极端情况对统计数据提出质疑和误解。事实上,收入的情况一般不会这么极端。因此,对统计指标的概念及使用环境正确理解,也有利于消除不必要的误解。 在搞清楚平均指标的概念后,如何理解变异指标呢?假设我们已经拿到一个气球皮,正准备吹气球。这时,气球的“规格”虽已定了下来,但能吹多大,还是因人而异。力气大的小孩能吹得大,反之,则吹得小。这实际上就是统计上所说的变异性指标的表述逻辑了。 怎么描述统计变异性或气球的大小呢?统计学人也有不同的观察角度。最直观的是,气球的直径有多长,这便是统计上的极差 ( 全距 ) 的表述逻辑;也可以用不穿过球心的弦去描述气球大小,这便是分位数差 ( 如四分位数差 ) 的表述逻辑。当然,还可以作出类似于算术平均数的抽象描述来,用气球内的各个点到气球中心的距离来表述气球的大小,这便是方差 ( 标准差 ) 的表述逻辑。 既然用平均指标对事物做了总体概括,为什么还要变异指标呢? 我们知道,气球吹小了,不好看;吹大了,会爆。这就涉及到变异指标用以衡量系统承载能力的问题。例如,金融中的风险问题,风险小了,难以取得高收益;风险大了,可能导致不可承受的巨大损失。如何使得气球吹得恰到好处呢?这便是系统优化的问题了。 二、玩木棍与相关系数 描述完事物自身,还需要对事物之间的关系作出说明。如果是男性朋友,儿时一定还玩过木棍,而且往往会错过吃午饭。到了中午 12 点,玩法一般就是在太阳底下移动木棍并看影子的长短变化。这里面,实际上隐藏了相关分析和回归分析的逻辑 ( 图 1) 。我们还是把主要精力集中到相关系数 ( 线性 ) 中来,由于回归分析属于统计推断内容,我们仅由相关系数出发稍作解释。 图 1 木棍、影子与相关 图 1 显示,正午 12 点的太阳照在斜放的木棍上,在地面上 ( 虚线 ) 形成木棍的影子。木棍与影子形成的夹角实际上体现了统计上线性相关的描述逻辑。事实上,木棍代表了我们研究的一个变量 ( 应该来说是代表随机变量实现值形成的向量 ) ,影子代表另外一个,两个变量的相关系数正是这个夹角的余弦。 这样说明还不形象,为了对相关系数作出直观解释,利用中学三角函数知识,我们对相关系数 r 和余弦 cos θ 做一下对比: 由于 cos θ 的取值范围在 -1 到 1 之间, 相关系数 r 也有相同的取值范围。从坐标系第一象限上说, θ 越接近于 0 ° , r 越接近于 1 ,即木棍整体离地面越近,正相关程度越高;在坐标轴第二象限, θ 越接近于 180 ° , r 越接近于 - 1 ,此时, 棍子也是离地面越近,和前面的情况相比,只是方向相反罢了,则说明负相关程度越高。换而言之,当 θ 越接近于 90 ° , r 越接近于 0 ,相关程度越低,特别地,当 cos θ =0 时, 木棍垂直立在地面上, 它与影子的相关性顶多为一个点,此时,可以认为棍子和影子不相关,即 r 等于 0 。 事实上,图 1 还可以引申到回归分析中来,鉴于本文目的,在此粗略说之。上述木棍、影子的长度,就是前面分析变异指标中的方差 ( 标准差 ) 概念 。而影子是太阳在地面上的投影,正是回归分析对木棍的预测值,木棍离地面角度越小,预测越好。因此,相关的概念在回归分析中起到关键作用。 进一步地,按照中午 12 点的太阳直射,木棍、影子以及它们连线形成的三角形必定是直角三角形。图 1 中看不到的三角形另一边就是回归分析中常说的残差。由此,代表拟合优度的可决系数、 F 检验都可以通过勾股定理以及三角函数作出形象解释。我们不再赘述。 统 计学的理论、方法对于初学者以及部分实践工作者来讲是十分头疼的事情。然而,正确认识统计的内涵、灵活运用统计思维和正确把握统计逻辑与日益丰富与复杂的人类改造自然的社会实践活动是不可分割的。统计乎 ? 儿戏乎?笔者尝试着用最基本的生活经历以及平常的思维逻辑对统计描述及推断作出直观描述,便于大家理解。当然,本文以偏概全,请勿见笑。
个人分类: 乱弹琴|7966 次阅读|10 个评论
2011年世界航空安全大盘点
热度 2 hongbin 2012-1-5 12:29
2011年对于世界航空来说是不平凡的一年,统计数据表明全年发生了28起多发航空事故,导致了507人遇难,另有地面14人遇难。对于民航业来说,这是迄今按年死亡总人数从少到多排序,年死亡总人数排名第二的安全年份,远远低于10年平均764人的平均水平;按年事故总次数从少到多排序,年事故次数排第三的安全年份,但却高于10年平均16起事故的平均数。 更为令人振奋的是,2011年保持了航空历史上无致命事故时间的最长记录,截止2012年1月1日,该记录保持了80天!!! 2011年最大一起空难发生在1月9日,伊朗航空的波音727在进近时坠毁,导致77人遇难。 数据表明,28起航空事故的7起发生在欧洲的“航空公司黑名单”中;非洲的航空事故占到总事故次数的14%,但其事故记录持续下降;本年度,俄罗斯发生了6起空难,安全形势糟糕。
个人分类: 民航安全|4101 次阅读|2 个评论
关于多重比较的两个疑问~
qibao08 2011-12-19 17:36
1.非正态分布的数据,多重比较怎么实现?(有看到说利用matlab中的两个函数可以,不知是否还有其他方法?) 2.多重比较是否只能比较各处理平均数之间的差异?(可以比较中位数之间的差异吗?) 3.字母标记法的可靠性? 现在的情况是用matlab做了非参数检验及多重比较,可是用字母标记的时候却发现无法标记,问题在哪儿?
5579 次阅读|2 个评论
[转载]如何进行变量的中性化处理
zhangjing121 2011-10-2 10:18
有几种方法,这里介绍最常用的两种,一种是减去平均值,一种是z分数。 减去平均值:先进行一个description统计,得到描述性统计结果,有平均数和标准差。然后使用compute命令,新建一个变量=原变量-平均数。 z分数,和上面的结果差不多,只不过在新变量的基础之上除以标准差,得到一个分数。
4158 次阅读|0 个评论
只有算术平均数,惹出的祸!
可变系时空多线矢主人 2009-5-16 00:28
只有算术平均数,惹出的祸! 前不久,国家统计局发布了工资收入平均数。引来了不少质疑和批评,甚至认为发布的数据是造假。 统计局立即声明:完全是根据实际情况的计算结果,绝对不是造假。 应该相信:统计局完全了解各单位工资收入的分布情况,即使是个体户的收入情况也可由其营业、税收情况审查其真实性。 由此计算得来的平均数,是不至于会造假,也不会有太大错误的。 但是,许多人对比自己的工资收入,总觉得与平均数相差太远,而不能理解。 特别是,平均收入较高的许多银行职员,对比自己的工资收入,就更感到很冤屈。有人还画了漫画,对比满面笑容的,肥大的,高层职员,显著瘦小的,低层职员在哭丧着脸,大喊冤枉。 显然,这是只有算术平均数,而惹出来的祸! 其实,既然有能准确计算得到平均数的,按人的,工资收入分布数据,就应也容易得到:按人数的,工资收入分布数据曲线。 就可以具体计算分析:那个算术平均数,与最大多数人的工资收入数和最高工资数,彼此,相差有多大?是否合理? 还可以展示各类人员工资收入数,逐时提高的比值。 还可以进一步,具体分类对比分析,并结合我国现阶段社会主义的性质,研讨:应做怎样的调控、改进。 而不宜只简单地公布一个算术平均数。
个人分类: 数理|3865 次阅读|2 个评论
只有算术平均数,惹出的祸!
可变系时空多线矢主人 2009-5-16 00:25
只有算术平均数,惹出的祸! 前不久,国家统计局发布了工资收入平均数。引来了不少质疑和批评,甚至认为发布的数据是造假。 统计局立即声明:完全是根据实际情况的计算结果,绝对不是造假。 应该相信:统计局完全了解各单位工资收入的分布情况,即使是个体户的收入情况也可由其营业、税收情况审查其真实性。 由此计算得来的平均数,是不至于会造假,也不会有太大错误的。 但是,许多人对比自己的工资收入,总觉得与平均数相差太远,而不能理解。 特别是,平均收入较高的许多银行职员,对比自己的工资收入,就更感到很冤屈。有人还画了漫画,对比满面笑容的,肥大的,高层职员,显著瘦小的,低层职员在哭丧着脸,大喊冤枉。 显然,这是只有算术平均数,而惹出来的祸! 其实,既然有能准确计算得到平均数的,按人的,工资收入分布数据,就应也容易得到:按人数的,工资收入分布数据曲线。 就可以具体计算分析:那个算术平均数,与最大多数人的工资收入数和最高工资数,彼此,相差有多大?是否合理? 还可以展示各类人员工资收入数,逐时提高的比值。 还可以进一步,具体分类对比分析,并结合我国现阶段社会主义的性质,研讨:应做怎样的调控、改进。 而不宜只简单地公布一个算术平均数。
个人分类: 数理|24 次阅读|0 个评论
生物统计学习笔记—试验资料特征数的计算
wangzhong 2009-2-26 22:26
数据(变量)的分布具有两种明显的基本特征:集中性(centrality)和离散性(discreteness)。所谓集中性是指变量在趋势上有着向某一中心聚集或者说以某一数值为中心而分布的性质;而离散性是指变量有着离中心分散变异的性质。 集中性的反映: 1. 算数平均数(arithmetic mean):总体或样本资料中各个观测值的总和除以观测值得个数。 1.1 对一具有N个观测值的有限总体: 1.2 对一具有n个观测值的样本: 2. 中位数(median):观测值依大小排列时居于中间位置的观测值。 观测值个数n为奇数时:第(n+1)/2个 观测值个数n为偶数时:第n/2和n/2 +1个二者平均数 3. 众数(mode):资料中出现次数最多的那个观测值或次数最多一组的中点值。 4. 几何平均数(geometric mean):n个观测值,其乘积开n次方所得数值。适用于变量x为对数正态分布,经对数转换后呈正态分布的资料。 资料中各观测值与其平均数之差平方的总和较各观测值与任一其它数值离差的平方和都小。 离散性的反映: 1.极差(range):又称全距,样本变量中最大值与最小值之差,R。 2.方差(variance):各观测值离均差平方和除以样本容量n,s2。 n-1为自由度df,而总体方差 为: 3. 标准差(standard deviation):方差开方,还原数值及单位,Sd。样本的标准差为s。 变异系数(coefficient of variability):样本标准差除以样本平均数,用以比较两个样本的变异程度,CV。
个人分类: 资料积累|5188 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-12 16:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部