因变量与次要影响因子之间的拟合结果是怎样的? 假设某个因变量 Y 与三个自变量 X 1 、 X 2 、 X 3 的 三元线性拟合公式 高度正相关(相关系数 R 大于 90% ),并且知道自变量 X 1 是 主要影响因子(权重大约占 60%~70% ) ,其它两个自变量 X 2 、 X 3 都是 次要影响因子 (请特别注意 主次有别! ),那么,采用 Excel 多元回归现成的命令,由电脑进行因变量 Y 与次要影响因子 X 2 或者 X 3 的 一元线性回归分析 ,得到的结果是不是相关判定系数 R 2 不太理想而 Significance F 比较理想?其理由是 X 2 和 X 3 的的确确是因变量 Y 的影响因子,但不是主要影响因子。 如果以上判断(观点)不完全正确,因变量 Y 与次要影响因子 X 2 或者 X 3 的 一元线性拟合 的相关判定系数 R 2 和 Significance F 都有比较理想的可能,那需要什么条件?也就是说,什么条件下因变量与次要影响因子一元拟合的效果比较好?什么条件下因变量与次要影响因子一元拟合的效果不好? 由电脑进行因变量 Y 与两个次要影响因子 X 2 和 X 3 的 二元线性回归分析 ,相关判定系数 R 2 有可能比较理想吗?两个自变量的 P-value 有可能都比较理想吗( P-value 越小越好、一般要求小于 0.05 )?拟合得到的结果是不是相关判定系数 R 2 不理想、两个自变量或者其中一个自变量的 P-value 也不理想?其理由是自变量 X 2 和 X 3 都是次要影响因子,二元线性回归拟合公式中没有主要影响因子。 (请专家特别是数理统计专家、气象专家、水利专家赐教)
小女子是做临床代谢组学的,先有两组样本,各19例,两组之间差异代谢物共鉴别10个,现在想用这10个差异代谢物作为预测,方法为留一法,也叫leave-one-out test ,即每次留出一个样品,以其余的变量继续构建OPLS-DA模型,priori截留值设置为0.5.对留下的样品预测,重复该过程,直到所有的样品都测试过一次,从而计算灵敏度和专属性。 另外我是通过OPLS-DA鉴别的差异代谢物,主成分为1+5,在构建新的OPLS-DA模型时,希望主成分保持不变,我希望得到的图示如下: 讲了这么多,我就是希望各位牛人支支招,用什么软件(R?Matlab?)代码(code?)若能给予帮助,感激不尽,金币肯定少不了