STATMAN分享 http://blog.sciencenet.cn/u/zt2730 流行病与卫生统计学、慢性病与癌症代谢组学、高维数据统计分析与模式识别方法

博文

当前统计学发展的几个方向 精选

已有 13861 次阅读 2013-6-16 15:41 |系统分类:观点评述|关键词:学者| 统计学

在过去的20、30年中,统计学在不少方面取得了很大进展,这主要得益于越来越快的电脑速度,使得很久以前只能停留在理论层次上的一些内容变成了现实。当前的统计学教材内容几乎跟20年前没什么太大变化,但统计学的发展却是有巨大变化,这里根据个人的知识水平将其总结一下,为感兴趣的同仁提供一些发展方向的借鉴。

(1)单一层次数据分析向多层次模型的发展。近20年来,多水平模型已经得到了广泛的应用,包括各种领域,如教育、心理、社会、医学、经济等。当然,不同领域对他的称谓有所不同,分层线性模型、随机效应模型、随机系数模型、混合效应模型、方差成分模型,等等,尽管略有差别,但差不多都是同样的意思。多水平模型使得我们在对数据的认识方面扩展到了更高的层次,因此很多传统的方法也跟着改变,就像是重复测量数据,很久以前一般都作为随机区组数据来分析,现在一般用多水平模型了。多水平模型考虑到了不同层次所造成的误差,与以前的直接将数据合并起来的做法相比,结果更为可靠。

(2)平面数据分析向空间模型的发展。越来越多的人已经开始使用空间分析,因为人们已经逐渐认识到,除了时间上可能具有相关之外,空间地理上有可能具有相关。通常富裕的县周边也不会穷到哪儿去,一个胃癌高发的地区,其周围很可能胃癌也都高发,等等现象在现实中很常见。这与时间序列上的相关道理是一样的,只是变成了空间而已。考虑到地理上可能存在相关性,将这种相关纳入模型,便成了空间回归分析。

(3)线性模型向非线性模型的发展。线性模型已经领到风骚近百年,一直被称为经典,如今已经越来越多的人发现,原来这种经典是需要靠一堆前提条件来堆积的,不是永远的经典。一旦前提条件被打破,经典的神话就不复存在了。所以广义可加模型模型等应运而生,它拓宽了“线性”的局限,只是简单地说,“自变量和因变量是有关系的”,但不说“自变量和因变量之间是有线性关系的”。至于什么关系,自己去探索,找到合适的函数来表达。!

(4)显变量分析向潜变量分析的发展。我们所分析的变量,绝大多数都是直接测量到的,比如血糖与身高、体重的关系,很明显,直接就可以测量到。但有一些是无法测量的,如生存质量与疾病的关系、心理素质与人格的关系,凝聚力与领导力的关系,等等。这些里面,有的可以通过软工具如量表来测量,直接打分,作为其结果。有的却无法直接体现,只能通过其它变量来反映,如学习压力,可以通过父母期望、与其它同学成绩距离等来反映。这时传统的分析方法便不奏效,通常会使用结构方程模型。基于结构方程模型的软件也有很多,像LISREL、M-PLUS、AMOS等。

(5)单一关系向社会网络关系的发展。社会网络分析在近十几年应用越来越多,从文献来看,几乎是呈指数的形状递增。目前的分析大多是仅分析行为人的个体行为,不管是寻找危险因素还是其他分析。但有时人们之间的关系影响更大。如流感期间群体间的接触,可能比单独个体行为更能解释一些流行特征。再如青少年的行为更多是受到自己的朋友圈子的影响,个体特征反而不明显。已有研究分析发现,波多黎各的吸毒者在与认识或陌生人发生关系时,比纽约的吸毒者更容易感染艾滋病毒,这也是社会网络分析多得出的结论。社会网络分析在吸毒者、MSM人群等一些特殊群体中可能会有更大的应用价值。

(6)模拟技术的发展。模拟是一种非常有效的方式,尤其现在计算机已经足够发达可以进行数千数万次的模拟。在这种情况下,模拟技术得到了长足发展,从bootstrap到monte carlo,模拟技术的应用无处不在。几乎所有的统计方法都可以用模拟的技术重新得到结果,尤其一些难以用常规方法得到的统计量,或者说计算起来十分复杂的统计量,模拟的技术就显得很重要了。如主成分回归、主成分logistic回归中,有些参数计算是及其复杂的,可以用模拟技术得到参数估计和可信区间。

(7)缺失数据的填补。缺失数据的方法很多,目前常用的是多重插补法,很多统计软件已经可以实现。基于数据的填补,当我们在面临问卷调查缺失数据且难以回头找到被调查者时,就不会一筹莫展了。

(8)从相关分析到因果分析的发展。30多年前,统计学家提出了以“倾向值得分”为特征的因果分析方法,用来解决一些实际中难以操作的问题,如随机分组尽管是研究的金标准,但有时难以做到,如观察吸烟对肺癌的影响,无法将研究对象随机分为吸烟和不吸烟两组。倾向值分析基于“反事实推断模型”的理论框架,奠定了现代因果关系的理论基础。反事实也就是:如果你不……,那就不会……。但事实是,你已经……,已经……。就像当年庄子与惠子的对话“子非我,安知我不知鱼之乐?

(9)传统统计模型到bayes统计模型的发展。很久以前,bayes统计模型一直被经典统计模型压得抬不起头来,而最近几年却显示出强劲的发展趋势,这很大程度上得益于计算机的飞速发展。目前不少统计软件已经加入了bayes分析的模块,不管是广义线性模型还是生存分析,都可以指定先验分布,进行bayes分析。




https://m.sciencenet.cn/blog-397960-700018.html

上一篇:从国足的恶心表现产生的联想
下一篇:保研季感想:阴盛阳衰,如何招到男学生?

27 周达 荣元华 林涛 胡传圣 田云川 高程 赵君渝 孙瑜隆 梅志平 米春桥 蒋迅 彭思龙 王国强 李郎平 李庆祥 雷栗 秦健勇 hmaoi ttee1 qqlisten yunmu libinfenn liumengfei2 liuchengxii rosejump LeeKepeng ruohanxiaowei

该博文允许注册用户评论 请点击登录 评论 (13 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 13:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部