中人网

标题: 请教一个回归分析的问题 [打印本页]

作者: 梅恩 时间: 2014-10-9 20:50
标题: 请教一个回归分析的问题
罗老师和各位同仁好！抱歉我发现连最基本的回归我都没有搞定，我遇到三个问题：1. 相关系数是正的，但回归系数是负的；2. 回归分析F检验不显著，但个别回归系数显著；3. F检验和回归系数都显著，但R方只有0.02左右，回归系数也很小，这样能接受吗？前两个问题我猜想是不是操作上有问题，因为自变量有十多个维度，就将十多个维度及6个控制变量同时放入回归（多重共线性其实不明显），自变量过多且彼此之间具有较强相关性是否会造成1和2的问题？如果自变量彼此之间相关性很强，那是否可以做单独挑一些维度做一元回归？另外我们在不同的样本中比较这些因果关系，但四个样本差距很大（97,455，2066,1354），这样的差距是否可以比较？97的那个样本所有的回归都不显著，是不是样本太少的缘故呢？
真的非常抱歉问的比较琐碎，可是查阅了工具书都没有涉及到这么琐碎的问题，所以只好在这儿求助了，拜托拜托，谢谢谢谢！

作者: Kenneth 时间: 2014-10-10 22:17
1. X1 的回归系数是当 X1与Y在控制住其他的X后的关系。当不同的X有很大的相关时(多重共线性)，你说的结果是可能的。把相关很大的X删掉一点吧。

能否单挑，是理论的问题，不是统计的问题。

2&3. 什么叫 “回归分析F检验”？是R平方的检验吗？不显著是因为 R-sq 等于.02吗？如果是的话，你的模型就有问题了。当模型没有预测能力时，个别的X的回归系数的t-检验，就算是显著也没有用的。这就好比一个国家衰弱，你说我自己很强，那你在谈判桌上有力吗？相反的，你的国家很强，如果你自己很弱，你自己在谈判桌上也是没用的。只有当你的国家强，你也强时，你“自己”及就很有力了。

作者: 梅恩 时间: 2014-10-11 10:21
谢谢罗老师！我表达有误，“回归分析F检验”就是回归模型的方差分析，对R方的显著性检验。我做出来的R方只有0.02左右，但是F检验是显著的，可能跟样本比较大有关。

作者: Kenneth 时间: 2014-10-11 18:03
本帖最后由 Kenneth 于 2014-10-11 18:06 编辑

梅恩,
对不起，漏答的一点。

1. 四个样本的大小差别这么大，很难比较。一般来说，样本数越大，估计越准确、越可信。一个非常可信，一个不太可信，如何比较呢？

2. 你的样本数上了一千，统计上显著是很自然的。我猜你的问题是你混肴了 statistical significance 与 practical signifcance。统计显著性是统计项是否为0，显著就是 R-sq 不等于0。就算是 R-sq 是 0.0001, 只要你的样本数有1,000,000，它都会显著的。好，我们知道 R-sq 不等于0（显著）了，那等于什么呢？答案就是等于 0.0001 了！

因此下一个问题是，纵然是统计上显著，那么实用上是否显著呢？ Is it practically significant? 这是一个主观的判断，不过R-sq等于 .02，大部分的人都会说是太少了。意思是，你所有的自变量加起来，说解释的因变量的方差都只是2%，那实在是很少、很少。

作者: 梅恩 时间: 2014-10-11 21:56
看到罗老师这么认真耐心地解答，真的好感动，感谢上帝借着您将这样的恩典带给科研路上懵懂的我们，谢谢您！您是好榜样。我会再仔细读读相关的一些文献再分析。

作者: Kenneth 时间: 2014-10-12 21:19
不用客气。既然我选择了老师这个职业，也接受别人称呼我老师，在可能的情形尽自己的义务是应该的。

欢迎光临中人网 (http://bbs.chinahrd.net/)