科学网-运用结构方程模型（SEM）分析数据时样本容量（sample size）越大越好-谢钢的博文

运用结构方程模型（SEM）分析数据时样本容量（sample size）越大越好

2023-11-6 18:38

阅读：1372

统计推断分析的目的是通过对样本数据的分析对定义研究总体（抽样总体）的统计参数给出最佳的估计结果，按经典的统计推断理论就是一个无偏估计量的点估计值加上一个最小可能的估计误差（an unbiased point estimate associated with a minimal possible standard error）。因此，统计推断分析的前提就是样本数据必须是代表了总体的统计特征的所谓‘代表性样本’。在此条件下，样本容量越大估计误差就越小。所以，纯粹从统计分析的角度，不论是用什么具体的统计模型分析样本数据，研究人员应该采用尽可能大的样本作数据分析。运用结构方程模型（SEM）分析数据当然也不例外。那么为什么文献上（那么多学者们）还会提出‘运用结构方程模型（SEM）分析数据时样本容量多大合适’这样明显有悖于统计推断理论的问题呢？

以David Trafimow 为第一作者的五位学者2021年在‘商业研究期刊’(Journal of Business Research, 英文原文链接https://www.sciencedirect.com/science/article/abs/pii/S0148296320308298)发表了一篇文章（The harmful effect of null hypothesis significance testing on marketing research: An example，中译‘原假设显著性检验对市场研究的有害影响：一个例子’）对此问题作了分析解答。

这篇文章告诉我们，按照一篇2004年发表的被运用结构方程模型（SEM）做数据分析的研究人员们普遍引用的文章（S. McQuitty，Statistical power and structural equation models in business research，Journal of Business Research(2004)）所提出的理由：由于SEM的好坏是以原假设显著性检验（NHST）的结果来评判的，因此样本容量‘太小’的话会因为统计功效太低而无法有效检测出不正确的模型；但若样本容量‘过大’的话又会把所有的模型都拒绝掉。所以我们必须确定一个适中的‘不大不小’的样本做SEM的数据分析。问题是这样的结论是错误的。原因很简单，因为这个结论的逻辑推理是以一个错误的前提为基础的，那就是‘原假设显著性检验的推理在逻辑上是不成立的’。如果原假设显著性检验的推理在逻辑上是成立的话，S. McQuitty 2004年这篇文章的结论当然也成立；不幸的是太多的理论分析与应用例证都证明了‘原假设显著性检验的推理在逻辑上是不成立的’，因而以此为基础推论出的结论‘所以我们必须确定一个适中的‘不大不小’的样本做SEM的数据分析’也就不成立了。

正确的答案/结论是：运用结构方程模型（SEM）分析数据时样本容量（sample size）越大越好。

在日常生活中我们常说‘好货不便宜’但我们并不会因此就得出‘不便宜的就是好货’这样的逻辑上不成立的结论。不幸的是，原假设显著性检验的推理在逻辑上与这个日常生活经验告诉我们都不会犯的逻辑错误是一样的：在原假设（null hypothesis）成立的条件下这样一组样本数据是不太可能出现的；我们得到了这样一组不太可能出现的样本数据，所以原假设不太可能成立。结构方程模型（SEM）的推断分析恰恰就是依据于这个原假设显著性检验范式的（NHST）的推理逻辑。

转载本文请联系原作者获取授权，同时请注明本文来自谢钢科学网博客。

链接地址：https://m.sciencenet.cn/blog-3503579-1408677.html?mobile=1

分享到:

当前推荐数：12

推荐人：

尤明庆杨正瓴郑永军孙颉宁利中黄河宁崔锦华刘炜朱晓刚刘秀梅陆仲绩马鸣

推荐到博客首页

网友评论6 条评论

该博文允许注册用户评论请点击登录