查看: 1753|回复: 5

请教一个回归分析的问题

梅恩

1 主题	5 听众	26 积分

书童

Rank: 1

注册时间: 2011-2-18
最后登录: 2014-10-28
积分: 26
精华: 0
主题: 1
帖子: 3

电梯直达

楼主

发表于 2014-10-9 20:50:55 |只看该作者 |倒序浏览

罗老师和各位同仁好！抱歉我发现连最基本的回归我都没有搞定，我遇到三个问题：1. 相关系数是正的，但回归系数是负的；2. 回归分析F检验不显著，但个别回归系数显著；3. F检验和回归系数都显著，但R方只有0.02左右，回归系数也很小，这样能接受吗？前两个问题我猜想是不是操作上有问题，因为自变量有十多个维度，就将十多个维度及6个控制变量同时放入回归（多重共线性其实不明显），自变量过多且彼此之间具有较强相关性是否会造成1和2的问题？如果自变量彼此之间相关性很强，那是否可以做单独挑一些维度做一元回归？另外我们在不同的样本中比较这些因果关系，但四个样本差距很大（97,455，2066,1354），这样的差距是否可以比较？97的那个样本所有的回归都不显著，是不是样本太少的缘故呢？
真的非常抱歉问的比较琐碎，可是查阅了工具书都没有涉及到这么琐碎的问题，所以只好在这儿求助了，拜托拜托，谢谢谢谢！

转播0 淘帖0 分享0 收藏0 支持0 反对0 @朋友

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

沙发

发表于 2014-10-10 22:17:36 |只看该作者

1. X1 的回归系数是当 X1与Y在控制住其他的X后的关系。当不同的X有很大的相关时(多重共线性)，你说的结果是可能的。把相关很大的X删掉一点吧。

能否单挑，是理论的问题，不是统计的问题。

2&3. 什么叫 “回归分析F检验”？是R平方的检验吗？不显著是因为 R-sq 等于.02吗？如果是的话，你的模型就有问题了。当模型没有预测能力时，个别的X的回归系数的t-检验，就算是显著也没有用的。这就好比一个国家衰弱，你说我自己很强，那你在谈判桌上有力吗？相反的，你的国家很强，如果你自己很弱，你自己在谈判桌上也是没用的。只有当你的国家强，你也强时，你“自己”及就很有力了。

使用道具举报

梅恩

1 主题	5 听众	26 积分

书童

Rank: 1

注册时间: 2011-2-18
最后登录: 2014-10-28
积分: 26
精华: 0
主题: 1
帖子: 3

板凳

发表于 2014-10-11 10:21:59 |只看该作者

谢谢罗老师！我表达有误，“回归分析F检验”就是回归模型的方差分析，对R方的显著性检验。我做出来的R方只有0.02左右，但是F检验是显著的，可能跟样本比较大有关。

中人网社区招募“中国好版主”11月话费已送出

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

地板

发表于 2014-10-11 18:03:47 |只看该作者

本帖最后由 Kenneth 于 2014-10-11 18:06 编辑

梅恩,
对不起，漏答的一点。

1. 四个样本的大小差别这么大，很难比较。一般来说，样本数越大，估计越准确、越可信。一个非常可信，一个不太可信，如何比较呢？

2. 你的样本数上了一千，统计上显著是很自然的。我猜你的问题是你混肴了 statistical significance 与 practical signifcance。统计显著性是统计项是否为0，显著就是 R-sq 不等于0。就算是 R-sq 是 0.0001, 只要你的样本数有1,000,000，它都会显著的。好，我们知道 R-sq 不等于0（显著）了，那等于什么呢？答案就是等于 0.0001 了！

因此下一个问题是，纵然是统计上显著，那么实用上是否显著呢？ Is it practically significant? 这是一个主观的判断，不过R-sq等于 .02，大部分的人都会说是太少了。意思是，你所有的自变量加起来，说解释的因变量的方差都只是2%，那实在是很少、很少。

使用道具举报