科学网

 找回密码
  注册

tag 标签: 中位数

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

学生评教数据的统计处理
chwangxg 2016-11-6 23:18
学生评教数据的统计处理 扬州职业大学 王晓刚 摘要: 本文指出了多数院校现行的学生评教的运作过程及对测评数据的处理方法中存在的一些问题,并提出相关对策,以增加学生评教的客观性与有效性。 关键词: 质量控制; 学生评; 数据处理 高等职业教育经过数年的规模扩张,现在已进入一个内涵建设与全面提高质量的阶段,关于高职院校的质量控制体系的研究业已全面展开。作为高职院校的质量控制体系的重要组成部分——学生评教已成为绝大多数院校教学日常管理的项目之一。 一、目前多数院校学生评教中存在的 问题 根据我们的调研,多数职业院校关于学生评教的运作过程以及对测评数据的处理方法存在着如下的一些问题。 第一,是将学生的测评数据简单地相加再除以总人数就作为了某教师的测评成绩。这样做不符合数理统计规律。根据数理统计原理,如果影响某一随机变量的因素是大量的,并且每一因素的影响是细微而独立的,那么,该随机变量可认为是服从正态分布,可用均值作为其集中趋势或一般水平的衡量指标。然而,在学生评教过程中,某一学生的一念之差就可能产生一个极端数据,从而难以排除原始数据中有一部分是带有学生的个人情绪的极端数据,所以测评数据是一种分布类型不明的资料,不能采用算术平均数这一对称分布下的集中趋势指标作为衡量指标。 第二,采用匿名制。对于人生观与价值观还处于相当可塑期的学生来说,难以避免部分学生把给教师打分作为个人情绪宣泄的窗口。即使是具有自主行为能力的成人,处于这样的场合,在打分时也很难 不受自我个人情感取向的影响,从而使得部分测评数据失去了客观性。 二、学生评教的改进对策 面对上述提出的问题,本文建议对学生评教采用如下改进措施: 第一,因为学生评教的原始数据,属于分布类型不明的资料,根据数理统计原理,应采用中位数代替算术平均数作为其一般水平或集中趋势的衡量指标,以避免极端数据对最终结果的影响。 第二,学生评教应采用署名制,同时,对学生的测评数据的客观性进行评价,并将评价结果在不改变该课程实际考核成绩分布的条件下,以一个象征性的比例(如5%-10%)纳入学生该课程的总评成绩,从而对学生评教有一个必要的约束。当然,在学生的测评数据与任课教师之间应该有一层屏蔽。 三、学生评教的数据处理 上文第一点建议较易实现。对于第二点建议,也就是如何对学生的测评数据的客观性进行评价,并将评价结果在不改变该课程实际考核成绩分布的条件下,以一个象征性的比例(如5 % -1 0 % )纳入学生该课程的总评成绩,本文按照数理统计原理,设计了如下的模型: 第一步,计算出一组原始测评数据的中位数(统计总体通常是班级),作为该班对任课教师的最终测评成绩,记之为m .同时, 求出每一名学生的离中差绝对值,记之为g 值。所谓离中差,是指每一名学生的测评原始数据与中位数m 的差。可以认为,某学生的g 值越小,则其原始测评数据客观性越好。 第二步,计算每一名学生的g 值升序秩次rg ,g 值相同的取平均秩次。 第三步, 计算每一学生的百分比值,记之为p 值。假设某班有n 名学生,排序前50% 的与后50% 的学生分别计算p 值。排序前5 0 % 的计算公式是p = 1 - rg / n ,排序后50% 的计算公式是p=1-rg/n+1/n。如果样本容量是奇数,那么处于中位数的p 值取0 . 5 。 某一学生的p 值越靠近1 ,则其原始测评数据的客观性越好,某一学生的P 值越靠近0 ,则其原始测评数据的客观性越差。 第四步,将每一学生的p 值转换成标准正态分布界值u 值,某学生的u 值越大,则其原始测评数据的客观性越好。 第五步,为便于将学生的u 值在尽量不改变该课程实际考核成绩分布的条件下,以一个象征性的比例(如5%-10%)纳入学生该课程的总评成绩,所以将u 值转换成百分制成绩z ,所有学生的z 值的平均 值与标准差分别等于该课程考核成绩的班级平均值xbar 及标准差s ,计算公式是: z = xbar + u . s 如果某学生的原始测评数据与m 值越接近,那么客观性越好,其z 值也越大,如果学生的原始测评数据与m 值相差较大,不管是大于m 还是小于m ,都说明其客观性较差,相应的z 也较小。需要指出的是,上述看似复杂的过程利用数据处理软件处理并不繁琐,下面利用统计软件SPSS 略举一例。 四、实例 现有某班对某教师的测评数据,如图—1中表格第1 列与第2 列数据,已知该课程期末考试成绩平均值xbar 是78 分,标准差s 是9.32 分。 启动SPSS ,创建两个变量,一是学生序号ordinal,一是测评数据data ,输入图-1 中前2 列数据,执行SPSS 数据描述过程“Analyze|Descriptive|Frequencies”,选择选项“Statistics|Median”,可得测评数据的中位数是88 ,作为m 的值。 执行SPSS 变量计算过程“Transform|Compute”,在“Target Variable:”框中输入新变量名“g”,在 “Numeric Expression”框中输入“ABS(88-data)”,“OK ”后得到g 值。 执行SPSS 变量秩次计算过程“Transform|Rank Cases”,在“Variables:”框中添加变量“g”,“OK”后,系统自动生成新变量“rg”以保存变量“g”的秩次,同一秩次的系统自动取平均秩次。 执行SPSS变量计算过程“Transform|Compute”,在“Target Variable:”框中输入新变量名“p”,在 “Numeric Expression”框中输入“1-rg/25”,在“If ”选项中输入条件“rg25/2”,“OK”后得到一半p值;同样,执行SPSS变量计算过程“Transform|Compute”,在“Target Variable:”框中输入变量名“p”,在“Numeric Expression ”框中输入“1-rg/25+1/25 ”,在“If ”选项中输入条件 “rg25/2 ”,“OK”后得到另一半p值。 当n是奇数时,有时需要执行SPSS变量计算过程“Transform|Compute”,在“Target Variable: ”框中输入变量名“p”,在“Numeric Expression”框中输入“0.5”,在“I f ”选项中输入条件“rg=(n+1)/2”,“OK”后得到最后一个p值,本例因为存在相同秩次取平均秩次的情况,所以不需要这一步操作。执行SPSS 变量计算过程“Transform|Compute”,在“TargetVariable :”框中输入新变量名“u”,在“NumericExpression”框中输入“PROBIT(p)”,“If”选项中选择“Include allcases”,“OK”后得到u 值。 执行SPSS变量计算过程“Transform|Compute ”,在“Target Variable:”框中输入新变量名“z”,在“Numeric Expression”框中输入“78+9.32*u”,“If”选项中选择“Include allcases”,“OK”后得到z 值。7 8 是该课程实际考核成绩平均值,9.32是标准差。 现对测评数据作上述的处理,处理结果见图- 1 。最后得到的z 值,象征性地按一定比例(5%-10%)纳入学生的该课程的总评成绩, 以期对学生的评教工作有一定的约束。 五、讨论与延伸 对学生评教作上述改进与处理,至少具有两方面的意义:一是提高学生评教数据的客观性与可信度,恰如其分地从学生的角度评价教师的工作状况;二是提高学生对教学过程的参与程度,强化学生的主体地位。学生要想恰如其分地给任课教师打分,离开了对教学过程的充分参与是不可想象的。 按照本文的对策,某一个班级的学生给若干任课教师打分,客观性是可以保证的,任课教师M 值的相互比较与排名也是可信的。但是在实际操作中会还有这样一个问题有待解决,这就是:对全学院或全 系来讲,某一个班有若干任课教师,某一任课教师又任教若干班级,由于不同的班级给教师打分的松紧程度不一致,导致全院或全系的每一教师的学生评教结果M值相互之间缺少可比性。为此可在测评之前对全院(校)学生进行适当培训,尽量使不同班级之间的测评尺度一致。 以上一管之见,仅供诸位专家与同行参考,不当之处,敬请指正。 参考书目 1 、G.W.斯内德克等著.统计方法.上海:上海翻译出版公司.1991,4:51:82 . 2 、刘洁,李蔚等.美国大学学生评教工作及其启示.中国大学教学,2007(8):87-89. 3 、汪利.高校学生评教有效性的影响因素因素研究.江苏高教,2004(4):75-77. 此文中国知网可查。
4448 次阅读|0 个评论
任何定量指标都难以取代期刊影响因子
热度 4 ZJUlijiang 2016-8-5 09:08
说明:本博客与微信公众号《林墨》同步更新,所有内容均为原创,可授权转载。请扫码关注《林墨》公众号。 小编并非期刊影响因子的粉丝,但与脱缰的同行评议相比,现阶段期刊影响因子不失可靠。再一次被一个宣传可能取代影响因子的指标刷屏之后,小编决定用自己的专业知识写点什么。 期刊影响因子是什么? 1963年,GarfieldSher正式提出“期刊影响因子(JournalImpactFactor)”,起先是为了使SCI数据库选刊时更具有操作性,到后来逐渐被世人所认可,现今成为了JCR期刊引证报告里用于测度期刊影响力的一项重要指标。它的测算公式为:某期刊在2016年的影响因子=该期刊2014和2015两年发表的论文在2016年被引用的次数÷2014和2015两年发表的论文之和。期刊影响因子综合考虑了发文量和被引次数两个因素,本质上是一个均值型算法,即期刊前两年发表论文的篇均被引次数。 中位数能取代影响因子吗? 不能。昨天,Nature刊出的文章提出了中位数的思路,即用期刊前两年发表的论文的引用中位数评价期刊影响力。本质上,中位数是一个分位数算法。当总体频数符合标准正态分布时,算术平均数与分位数相等;当总体频数不符合标准正态分布时,二者不同。尽管二者存在差异,但是与平均数相同的是,分位数依然受“被引次数”左右。“被引次数”存在的缺陷,在期刊影响因子中存在,在分位数中也存在。不能从根本上解决问题,谈何取代? 谷歌h5指数能取代影响因子吗? 不能。如果某期刊在过去5年内所发表的论文中,至少有h篇论文分别被引用了至少h次,那么该期刊的h5指数就是h。h5指数是在h指数的基础上添加了5年的时间窗口限制。H5指数是一个掐尖儿式算法,只考虑被引最高的那一组论文。h5指数也综合考虑了发文量和被引次数两个因素,与期刊影响因子有差异(各有优劣),但并无本质不同,谈何取代? Altmetrics能取代影响因子吗? 不能。Altmetrics基于社交媒体(Facebook、Twitter、G+、Mendeley等)的转发与评论评价学术论文的影响力。Altmetrics评分的用户群体是社交媒体用户,而期刊影响因子的评分用户是科研工作者。因此,与养生、投资、娱乐等社会热点话题相关的研究,能够轻易在社交媒体上获得很高的评分,而NgAgo-gDNA技术并不能引起他们的注意。前沿科学研究内容与大众都能懂的科普知识有相当一段距离,因此,Altmetrics从一诞生就跟期刊影响因子并无交集,谈何取代? 有没有指标能取代影响因子? 有。与期刊影响因子类似的定量评估学术期刊影响力的指标还有很多,但小编认为,能取代影响因子的指标唯有受严格控制的同行评议。早在70年代,F.Narin就勾画了各学术评估指标的客观度(图中的横轴)与真实度(图中的纵轴),理想的学术评估方案是采用受严格控制的同行评议。F.Narin是何许人也?大名鼎鼎的谷歌创始人L.Page与S.Brin曾向F.Narin公开致谢,正是因为受F.Narin提出的加权被引次数的算法的启发,他们才发明了PageRank算法。 在操作过程中,同行评议极易受金钱与权力的侵蚀。于是,我们索性采用客观的评价指标。尽管定量评价指标的导向可能会出现偏差,但作为一名青椒,为了能获得更多的生存与上升空间,小编极力支持以期刊影响因子为代表的定量评价。只是,在使用过程中,我们需要遵循一些原则(参见莱顿宣言)。 参考文献 Timetoremodelthejournalimpactfactor.NatureandtheNaturejournalsarediversifyingtheirpresentationofperformanceindicators.Nature,535,466(28July2016)DOI:doi:10.1038/535466a 文字编辑:李东 图片编辑:李东
4231 次阅读|8 个评论
最小一乘法的解为什么是中位数?
热度 1 yufree 2013-3-31 22:07
之前写过一篇 最小二乘法,为神马不是差的绝对值 ,当时讨论时对最小一乘的基本思想不太了解,只知道不好寻优。后来想想,数值分析里没有解析解的方程多如牛毛也能用一些方法逼近最优值,想来求解也不困难,本来这一页也就翻过去了。However,最近在 统计之都 上看到了一篇介绍统计学思想的 文章 ,顿时感觉醍醐灌顶,对回归问题也有了新的认识,摘要如下: 统计是一种总结的学问,也就是用少量信息反应大量信息的知识 给定一组数让你用一个数描述,最大的矛盾就在于这个数如何处理与原有数据不一致的矛盾,毕竟会丢失信息 这个过程可以分解为选定描述差异算法与最小化这个差异两步,最后给出的数要具有这两重代表含义 选用众数(modes)描述事实上是一个最小零乘问题,也就是二元描述,要么对,要么错 选用中位数(medians)描述事实上是一个最小一乘问题 选用平均值(means)描述事实上是一个最小二乘问题 详细的内容不再赘述,文章通俗易懂,这里要处理的是问题时为什么最小一乘的解是中位数?这一点在文中一笔带过并没有解释,不知道是不是因为这个问题弱爆了,反正我想了半天才搞明白,本文就是对这个思考过程的整理: 从最小二乘入手 因为我对最小二乘比较熟,那么我首先要考虑为什么平均值是最小二乘的解,答案呼之欲出。最小二乘法的表示方式可直接求导,结果就是平均值,换句话讲,最小二乘法得到的回归线是要经过均值点的,下面我用一个例子来说明这个问题 library ( UsingR ) data ( galton ) lm1 - lm ( galton $ child ~ galton $ parent ) newGalton - data.frame ( parent = rep ( NA , 1e+06 ) , child = rep ( NA , 1e+06 ) ) newGalton $ parent - rnorm ( 1e+06 , mean = mean ( galton $ parent ) , sd = sd ( galton $ parent ) ) newGalton $ child - lm1 $ coeff + lm1 $ coeff * newGalton $ parent + rnorm ( 1e+06 , sd = sd ( lm1 $ residuals ) ) smoothScatter ( newGalton $ parent , newGalton $ child ) sampleLm - vector ( 100 , mode = list ) for ( i in 1 : 100 ) { sampleGalton - newGalton sampleLm ] - lm ( sampleGalton $ child ~ sampleGalton $ parent ) } for ( i in 1 : 100 ) { abline ( sampleLm ] , lwd = 3 , lty = 2 ) } abline ( lm1 , col = red , lwd = 3 ) 注释我就不写了,这是C站数据分析课讲解最小二乘的一个例子,当我们用预先回归出的模型随机生成一组数据,然后从里面反复重采样100次,每一次得到一个线性模型,把所有的模型叠加,最后我们看到的图形最为稳健的部分就是平均值所在地。也就是说,最小二乘法的内在含义就是平均值回归,用均值代表整体。同时你会发现,这个解是唯一不变的,因为均值的求法不会得到两个答案。那么从这里出发能不能解决最小一乘的问题呢?先别急,先看一个答案不唯一的表示法。 回顾最小零乘 最小零乘的本质就是找一个数,跟数据中一致就是0,不一致就是1。从数据集的角度看就是找到一个数,使一致的1累计最少,那答案脱口而出:众数。但你应该很快就反应过来了,众数可能不唯一,所以最小零乘给出的答案不唯一,这对回归而言是灾难性的,因为不唯一的描述是不确定不可重复的。OK,在这个基础上,我们可以讨论最小一乘了。 最小一乘与中位数 从刚才的论述中,我希望读者可以明白两件事 回归事实上就是一种简化版的总结,算法是用来支持总结的,不必须唯一 为了求解方便,我们倾向于使用表述上分歧小且求解方法稳定的算法,平均值或者说最小二乘很符合这一点 那么为什么要提最小一乘呢?都用最小二乘不就完了吗?注意第一点,最小二乘仅仅是一种算法,他没有太多的特殊性,也并不完美,一个异常值就足以毁掉一组看似不错的数据,想想统计学里著名的 安斯库姆四重奏 ,这个算法算不上稳健的。而反观中位数却往往可以规避异常值问题,那么这又是如何实现的呢? 我们从最基础的问题开始构建,考虑5个点1,2,3,4,10, 如果找一个数代表这三个数你会选择什么?众数的话哪个都可以,均值的话是4,中位数是3。其实哪个都可以,但如果有个实际背景的话我想更多人会觉得3差不多,有点代表性,毕竟对于10有点信心不足。先不管这些,让我们想想最小一乘算法是如何实现的,如果这5个数分布在一个数轴上,找一个数使其绝对值最小怎么找?很简单分下组,最大值与最小值一组,第二大与第二小一组,以此类推。如果存在一个数满足到所有数的距离绝对值最小,那么它一定位于每一组之间,因为只有这样才能保证其到两端距离最短,这样到了最中间的那个数就直接考虑去中间那个数,这样距离为零,差的绝对值的和自然最小了。同时我们会发现如果我们两个两个的加入数,这个算法也是稳定的,也就是可以推广,这样异常值不过是其中的一组数,求解的结果对特定一组数据并不敏感,这就保证了稳健性。OK,那这个数是什么呢?没错,中位数。 说到这里你会觉得少点什么,没错,这好像只对奇数管用,偶数个数怎么办?其实在处理偶数时,我们最早学到的中位数概念是一种误导,没必要取均值。放到数轴上看,在最中央的两个数之前的任何一个数都可以最为最小一乘的解,那么这就是开始我说到的问题了,寻优结果不唯一。目前可以使用的最小一乘算法应该都无法规避这个问题,但相比众数,起码可以给出一个范围了,同时我们也看到,这个解法具备一定的可编程性,所以也可以拿来用。不过正如谢益辉在其 硕士论文 中所提到的,对中位数敏感一样可以造成回归上信息的缺失,所以也请把最小一乘看成一个普通青年的算法,最小二乘也是,至于众数……最好别用。而这些在建模上都是要反复考虑才能去选择的,不要盲目追新。 OK,如果你能理解数轴,最小一乘的算法及其与中位数的关系对你已经不陌生了,如何实现的问题就交给学统计的来做吧,我们只需要知道调用相关函数就可以了。如果你觉得最小一乘是不是只是一个求解特例,那恭喜你,直觉不错,最小一乘是分位数回归的特例,后面还有很多新知识。 从特殊到一般,从一般到很一般,这个过程的乐趣不是一般的特殊。
个人分类: 科搜研手册|22819 次阅读|2 个评论
[转载]什么是箱线图
热度 1 linpandr 2012-4-22 19:39
什么是箱线图 箱线图在文献中经常见到,是对数据分布的一种常用表示方法。但是所见资料中往往说的不是特别清楚,因此需要了解一下箱线图的绘制过程,与部分的意义。 计算过程: 1 计算上四分位数,中位数,下四分位数 2 计算上四分位数和下四分位数之间的差值,即四分位数差(IQR,interquartile range) 3 绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数。在箱子内部中位数的位置绘制横线。 4 大于上四分位数1.5倍四分位数差的值,或者小于下四分位数1.5倍四分位数差的值,划为异常值(outliers)。 5 异常值之外,最靠近上边缘和下边缘的两个值处,画横线,作为箱线图的触须。 6 极端异常值,即超出四分位数差3倍距离的异常值,用实心点表示;较为温和的异常值,即处于1.5倍-3倍四分位数差之间的异常值,用空心点表示。 7 为箱线图添加名称,数轴等。 在SPSS,SigmaPlot, R,SPlus,Origin等软件中,绘制箱线图非常方便。 下面是R中的一个箱线图举例 箱线图举例: 在R软件中输入如下命令: x-c(25, 45, 50, 54, 55, 61, 64, 68, 72, 75, 75,78, 79, 81, 83, 84, 84, 84, 85, 86, 86, 86, 87, 89, 89, 89, 90, 91, 91, 92, 100) boxplot(x) 对c向量绘制箱线图。 clear all close all a=rand(5)*100 %figure To create default box plot of matlab subplot 221 h=boxplot(a) %figure To change the linewidth of the box plot, subplot 222 hl=boxplot(a) for ih=1:6 set(hl(ih,:),'LineWidth',2); end %figure To change the color of the blox plot, here green is used subplot 223 hc=boxplot(a,'Color','g') %figure, To change colour as well as linewidth subplot 224 hlc=boxplot(a,'Color','r') for ih=1:6 set(hlc(ih,:),'LineWidth',2); end EF -1 EF -2 EF -3 EF -4 7.62E+01 8.51E+01 7.36E+01 6.24E+01 6.41E+01 6.31E+01 5.99E+01 7.01E+01 6.35E+01 5.61E+01 7.48E+01 7.08E+01 6.62E+01 5.79E+01 5.77E+01 6.77E+01 7.75E+01 6.41E+01 5.07E+01 5.82E+01 5.23E+01 7.91E+01 7.43E+01 6.98E+01 7.85E+01 6.70E+01 7.78E+01 8.14E+01 6.09E+01 7.93E+01 8.35E+01 7.68E+01 6.85E+01 8.24E+01 9.34E+01 9.28E+01 6.19E+01 8.32E+01 7.37E+01 6.86E+01 clear;clc X = ; p = anova1(X); fplot('MarkerFaceColor', ); title('npivc') xlabel('Different Classes'); ylabel('Metric');
个人分类: ANOVA|4861 次阅读|1 个评论
关于多重比较的两个疑问~
qibao08 2011-12-19 17:36
1.非正态分布的数据,多重比较怎么实现?(有看到说利用matlab中的两个函数可以,不知是否还有其他方法?) 2.多重比较是否只能比较各处理平均数之间的差异?(可以比较中位数之间的差异吗?) 3.字母标记法的可靠性? 现在的情况是用matlab做了非参数检验及多重比较,可是用字母标记的时候却发现无法标记,问题在哪儿?
5671 次阅读|2 个评论
生物统计学习笔记—试验资料特征数的计算
wangzhong 2009-2-26 22:26
数据(变量)的分布具有两种明显的基本特征:集中性(centrality)和离散性(discreteness)。所谓集中性是指变量在趋势上有着向某一中心聚集或者说以某一数值为中心而分布的性质;而离散性是指变量有着离中心分散变异的性质。 集中性的反映: 1. 算数平均数(arithmetic mean):总体或样本资料中各个观测值的总和除以观测值得个数。 1.1 对一具有N个观测值的有限总体: 1.2 对一具有n个观测值的样本: 2. 中位数(median):观测值依大小排列时居于中间位置的观测值。 观测值个数n为奇数时:第(n+1)/2个 观测值个数n为偶数时:第n/2和n/2 +1个二者平均数 3. 众数(mode):资料中出现次数最多的那个观测值或次数最多一组的中点值。 4. 几何平均数(geometric mean):n个观测值,其乘积开n次方所得数值。适用于变量x为对数正态分布,经对数转换后呈正态分布的资料。 资料中各观测值与其平均数之差平方的总和较各观测值与任一其它数值离差的平方和都小。 离散性的反映: 1.极差(range):又称全距,样本变量中最大值与最小值之差,R。 2.方差(variance):各观测值离均差平方和除以样本容量n,s2。 n-1为自由度df,而总体方差 为: 3. 标准差(standard deviation):方差开方,还原数值及单位,Sd。样本的标准差为s。 变异系数(coefficient of variability):样本标准差除以样本平均数,用以比较两个样本的变异程度,CV。
个人分类: 资料积累|5248 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-18 21:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部