中人网

标题: 请教一个回归分析的问题 [打印本页]

作者: 梅恩    时间: 2014-10-9 20:50
标题: 请教一个回归分析的问题
罗老师和各位同仁好!抱歉我发现连最基本的回归我都没有搞定,我遇到三个问题:1. 相关系数是正的,但回归系数是负的;2. 回归分析F检验不显著,但个别回归系数显著;3. F检验和回归系数都显著,但R方只有0.02左右,回归系数也很小,这样能接受吗?前两个问题我猜想是不是操作上有问题,因为自变量有十多个维度,就将十多个维度及6个控制变量同时放入回归(多重共线性其实不明显),自变量过多且彼此之间具有较强相关性是否会造成1和2的问题?如果自变量彼此之间相关性很强,那是否可以做单独挑一些维度做一元回归?另外我们在不同的样本中比较这些因果关系,但四个样本差距很大(97,455,2066,1354),这样的差距是否可以比较?97的那个样本所有的回归都不显著,是不是样本太少的缘故呢?
# V* U( O% g, F9 O8 r真的非常抱歉问的比较琐碎,可是查阅了工具书都没有涉及到这么琐碎的问题,所以只好在这儿求助了,拜托拜托,谢谢谢谢!
作者: Kenneth    时间: 2014-10-10 22:17
1. X1 的回归系数 是当 X1与Y在控制住其他的X后的关系。当不同的X有很大的相关时(多重共线性),你说的结果是可能的。把相关很大的X删掉一点吧。
7 Y" T; ~1 [/ O- H% t! b- j& o  l- K) b  ]1 S9 N
能否单挑,是理论的问题,不是统计的问题。
1 i' G* x9 p; N
) m0 `' d- |& E; u( r2&3. 什么叫 “回归分析F检验”? 是R平方的检验吗?不显著是因为 R-sq 等于.02吗? 如果是的话,你的模型就有问题了。当模型没有预测能力时,个别的X的回归系数的t-检验,就算是显著也没有用的。这就好比一个国家衰弱,你说我自己很强,那你在谈判桌上有力吗?相反的,你的国家很强,如果你自己很弱,你自己在谈判桌上也是没用的。只有当你的国家强,你也强时,你“自己”及就很有力了。
作者: 梅恩    时间: 2014-10-11 10:21
谢谢罗老师!我表达有误,“回归分析F检验”就是回归模型的方差分析,对R方的显著性检验。我做出来的R方只有0.02左右,但是F检验是显著的,可能跟样本比较大有关。
作者: Kenneth    时间: 2014-10-11 18:03
本帖最后由 Kenneth 于 2014-10-11 18:06 编辑 : ^, @0 ^& ^. S( C% u
7 y0 w) U, k1 m% d& v
梅恩,
/ E' t+ Q" C1 ]对不起,漏答的一点。( F; S  Y/ C# B1 ?0 f1 t9 u

4 [, f0 ?# `" N" r" j1. 四个样本的大小差别这么大,很难比较。一般来说,样本数越大,估计越准确、越可信。一个非常可信,一个不太可信,如何比较呢?4 z: k; `& ^8 C( R8 @0 W; \

/ p3 x+ O4 D' d* K% P2 F$ i/ _# N2. 你的样本数上了一千,统计上显著是很自然的。我猜你的问题是你混肴了 statistical significance 与 practical signifcance。统计显著性是统计项是否为0,显著就是 R-sq 不等于0。就算是 R-sq 是 0.0001, 只要你的样本数有1,000,000,它都会显著的。好,我们知道  R-sq 不等于0(显著)了,那等于什么呢?答案就是 等于 0.0001 了!4 [0 H# ~' r; W) i( I

) Q4 f5 Z6 J& h! b9 u: u( {2 U因此下一个问题是,纵然是 统计上显著,那么实用上是否显著呢? Is it practically significant? 这是一个主观的判断,不过R-sq等于 .02,大部分的人都会说是太少了。意思是,你所有的自变量加起来,说解释的因变量的方差都只是2%, 那实在是很少、很少。
作者: 梅恩    时间: 2014-10-11 21:56
看到罗老师这么认真耐心地解答,真的好感动,感谢上帝借着您将这样的恩典带给科研路上懵懂的我们,谢谢您!您是好榜样。我会再仔细读读相关的一些文献再分析。
作者: Kenneth    时间: 2014-10-12 21:19
不用客气。既然我选择了老师这个职业,也接受别人称呼我老师,在可能的情形尽自己的义务是应该的。




欢迎光临 中人网 (http://bbs.chinahrd.net/) Powered by Discuz! X2.5