电脑输出的多元回归分析结果中,衡量拟合公式优劣的4类指标 平面上的 xy 散点图及其一元回归拟合分析是常用的科研手段,是寻找变量之间相互关系、因果关系线索等的重要手段。自然界变量之间的关系极其复杂,两个变量之间可以是线性相关、非线性相关,还可以是不相关;一个因变量可能只与一个自变量相关,也可能与几个自变量都相关;有简单的因果关系(一因一果),还有复杂的因果关系(多因一果、一因多果等)。 多元回归分析是研究复相关、寻找多因一果的重要手段,是认识自然、改造自然的新式武器。 最近,我初步学会了利用 Excel 进行多元回归分析,下面是我的学习体会,与大家分享,请专家学者批评指正。 一、回归统计表中,复测定系数 R 2 (含复相关系数 R ) 据 http://blog.sina.com.cn/s/blog_a20c88b601014j9x.html 介绍:复测定系数 R 2 被“用来说明自变量解释因变量 y 变差的程度,以测定因变量 y 的拟合效果。此案例中的复测定系数为 0.8343 ,表明用自变量可解释因变量变差的 83.43% ”。 复测定系数 R 2 越接近于 1 ,相关程度越好。 二、方差分析表中, Significance F ( F 显著性统计量)的 P 值 据 http://blog.sina.com.cn/s/blog_a20c88b601014j9x.html 介绍:“方差分析表的主要作用是通过 F 检验来判定回归模型的回归效果。该案例中的 Significance F ( F 显著性统计量)的 P 值为 0.00636 ,小于 显著性水平 0 .05 ,所以说该回归方程回归效果显著,方程中至少有一个回归系数显著不为 0. ( Significance :显著)”。 据 http://wenku.baidu.com/link?url=AfOs9lDjrUbLV5xUviK0T-FwkVScFe8kMI6MmlwtGrxEB6qF4pzwhAzfRw-S_35eA3SJZP1llpFUIhaSePqhkq85q6NTJsbXgokdBoaKM6u 介绍:“ Significance F 对应的是在显著性水平下的 F α 临界值,其实等于 P 值,即弃真概率。所谓“ 弃真概率 ”即模型为假的概率,显然 1- P 便是模型为真的概率。可见, P 值越小越好。对于本例, P =0.00000005420.0001,故 置信度 达到 99.99% 以上。 ” 由以上分析可知, Significance F ( F 显著性统计量)的 P 值越小越好。 三、回归参数表中, P-value 对应的是 t 统计量的 P 值 据 http://blog.sina.com.cn/s/blog_a20c88b601014j9x.html 介绍:“其中 b1 、 b7 的 t 统计量的 P 值 为 0.0156 和 0.0175 ,远小于 显著性水平 0.05 ,因此该两项的自变量与 y 相关。而其他各项的 t 统计量的 P 值远大于 b1 、 b7 的 t 统计量的 P 值,但如此大的 P 值说明这些项的自变量与因变量不存在相关性,因此这些项的回归系数不显著” 。 据 http://wenku.baidu.com/link?url=AfOs9lDjrUbLV5xUviK0T-FwkVScFe8kMI6MmlwtGrxEB6qF4pzwhAzfRw-S_35eA3SJZP1llpFUIhaSePqhkq85q6NTJsbXgokdBoaKM6u 介绍:“ 第四列 P value 对应的是 参数的 P 值(双侧) 。当 P0.05 时,可以认为模型在 α =0.05 的水平上显著,或者置信度达到 95% ;当 P 0.01时,可以认为模型在 α =0.01 的水平上显著,或者置信度达到 99% ;当 P 0.001时,可以认为模型在 α =0.001 的水平上显著,或者置信度达到 99.9% 。对于本例, P=0.00000005420.0001 ,故可认为在 α =0.0001 的水平上显著,或者置信度达到 99.99% 。 P 值检验与 t 值检验是等价的,但 P 值不用查表,显然要方便得多 ” 。 P-value 对应的是 t 统计量的 P 值 ? P value 对应的是 回归参数的 P 值(双侧)? t 统计量的 P 值 和 回归参数的 P 值 是同一个问题的不同表述。 由以上分析可知, P-value 回归参数 t 统计量的 P 值越小越好。 四、回归参数表中, t Stat 对应的是 统计量 t 值 ,用于对模型参数的检验 据 http://wenku.baidu.com/link?url=8fp7SIqZft1VD_xFSEM81CzzYQIudrdVoJvwiVEYeYrn4EBt1JYMCiYSuZI78sij5m2Mg0-XkQNuPFOjjC_q3d8kUXBAJKDh4JJX-yXpmmm 介绍(第 34 页), t >1有一定影响,t>2影响重要,t<1无影响,可不参加回归。 五、学习多元回归常识的体会小结 如果某个自变量的 统计量 t 值 (与t Stat对应)<1 ,或者 t 统计量的 P 值 (与 P-value 对应)太大,满足不了显著性 0.05 的要求,那么,这个自变量就不应该参与因变量的多元回归分析。多元回归分析中,每一个自变量都有一个 统计量 t 值 (与t Stat对应) 和一个 t 统计量的 P 值 (与 P-value 对应),要求每一个自变量对应的 统计量 t 值 和 t 统计量的 P 值 都处于良好状态,再加上拟合公式整体上 复测定系数 R 2 和 Significance F ( F 显著性统计量)的 P 值 也处于良好状态,即要求 2n+2 个指标 ( n 为自变量的个数)都处于良好状态,并不容易。如果自变量与因变量之间没有任何程度的因果逻辑,纯粹偶然的情况下, 2n+2 个指标都处于良好状态,这是不可能的。多元回归分析中, 2n+2 个指标都处于良好状态,因变量与自变量之间一定存在一定程度的因果逻辑。