|||
在过去的20、30年中,统计学在不少方面取得了很大进展,这主要得益于越来越快的电脑速度,使得很久以前只能停留在理论层次上的一些内容变成了现实。当前的统计学教材内容几乎跟20年前没什么太大变化,但统计学的发展却是有巨大变化,这里根据个人的知识水平将其总结一下,为感兴趣的同仁提供一些发展方向的借鉴。
(1)单一层次数据分析向多层次模型的发展。近20年来,多水平模型已经得到了广泛的应用,包括各种领域,如教育、心理、社会、医学、经济等。当然,不同领域对他的称谓有所不同,分层线性模型、随机效应模型、随机系数模型、混合效应模型、方差成分模型,等等,尽管略有差别,但差不多都是同样的意思。多水平模型使得我们在对数据的认识方面扩展到了更高的层次,因此很多传统的方法也跟着改变,就像是重复测量数据,很久以前一般都作为随机区组数据来分析,现在一般用多水平模型了。多水平模型考虑到了不同层次所造成的误差,与以前的直接将数据合并起来的做法相比,结果更为可靠。
(2)平面数据分析向空间模型的发展。越来越多的人已经开始使用空间分析,因为人们已经逐渐认识到,除了时间上可能具有相关之外,空间地理上有可能具有相关。通常富裕的县周边也不会穷到哪儿去,一个胃癌高发的地区,其周围很可能胃癌也都高发,等等现象在现实中很常见。这与时间序列上的相关道理是一样的,只是变成了空间而已。考虑到地理上可能存在相关性,将这种相关纳入模型,便成了空间回归分析。
(3)线性模型向非线性模型的发展。线性模型已经领到风骚近百年,一直被称为经典,如今已经越来越多的人发现,原来这种经典是需要靠一堆前提条件来堆积的,不是永远的经典。一旦前提条件被打破,经典的神话就不复存在了。所以广义可加模型模型等应运而生,它拓宽了“线性”的局限,只是简单地说,“自变量和因变量是有关系的”,但不说“自变量和因变量之间是有线性关系的”。至于什么关系,自己去探索,找到合适的函数来表达。!
(4)显变量分析向潜变量分析的发展。我们所分析的变量,绝大多数都是直接测量到的,比如血糖与身高、体重的关系,很明显,直接就可以测量到。但有一些是无法测量的,如生存质量与疾病的关系、心理素质与人格的关系,凝聚力与领导力的关系,等等。这些里面,有的可以通过软工具如量表来测量,直接打分,作为其结果。有的却无法直接体现,只能通过其它变量来反映,如学习压力,可以通过父母期望、与其它同学成绩距离等来反映。这时传统的分析方法便不奏效,通常会使用结构方程模型。基于结构方程模型的软件也有很多,像LISREL、M-PLUS、AMOS等。
(5)单一关系向社会网络关系的发展。社会网络分析在近十几年应用越来越多,从文献来看,几乎是呈指数的形状递增。目前的分析大多是仅分析行为人的个体行为,不管是寻找危险因素还是其他分析。但有时人们之间的关系影响更大。如流感期间群体间的接触,可能比单独个体行为更能解释一些流行特征。再如青少年的行为更多是受到自己的朋友圈子的影响,个体特征反而不明显。已有研究分析发现,波多黎各的吸毒者在与认识或陌生人发生关系时,比纽约的吸毒者更容易感染艾滋病毒,这也是社会网络分析多得出的结论。社会网络分析在吸毒者、MSM人群等一些特殊群体中可能会有更大的应用价值。
(6)模拟技术的发展。模拟是一种非常有效的方式,尤其现在计算机已经足够发达可以进行数千数万次的模拟。在这种情况下,模拟技术得到了长足发展,从bootstrap到monte carlo,模拟技术的应用无处不在。几乎所有的统计方法都可以用模拟的技术重新得到结果,尤其一些难以用常规方法得到的统计量,或者说计算起来十分复杂的统计量,模拟的技术就显得很重要了。如主成分回归、主成分logistic回归中,有些参数计算是及其复杂的,可以用模拟技术得到参数估计和可信区间。
(7)缺失数据的填补。缺失数据的方法很多,目前常用的是多重插补法,很多统计软件已经可以实现。基于数据的填补,当我们在面临问卷调查缺失数据且难以回头找到被调查者时,就不会一筹莫展了。
(8)从相关分析到因果分析的发展。30多年前,统计学家提出了以“倾向值得分”为特征的因果分析方法,用来解决一些实际中难以操作的问题,如随机分组尽管是研究的金标准,但有时难以做到,如观察吸烟对肺癌的影响,无法将研究对象随机分为吸烟和不吸烟两组。倾向值分析基于“反事实推断模型”的理论框架,奠定了现代因果关系的理论基础。反事实也就是:如果你不……,那就不会……。但事实是,你已经……,已经……。就像当年庄子与惠子的对话“子非我,安知我不知鱼之乐?
(9)传统统计模型到bayes统计模型的发展。很久以前,bayes统计模型一直被经典统计模型压得抬不起头来,而最近几年却显示出强劲的发展趋势,这很大程度上得益于计算机的飞速发展。目前不少统计软件已经加入了bayes分析的模块,不管是广义线性模型还是生存分析,都可以指定先验分布,进行bayes分析。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-4-27 13:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社