中人网
标题:
请教一个回归分析的问题
[打印本页]
作者:
梅恩
时间:
2014-10-9 20:50
标题:
请教一个回归分析的问题
罗老师和各位同仁好!抱歉我发现连最基本的回归我都没有搞定,我遇到三个问题:1. 相关系数是正的,但回归系数是负的;2. 回归分析F检验不显著,但个别回归系数显著;3. F检验和回归系数都显著,但R方只有0.02左右,回归系数也很小,这样能接受吗?前两个问题我猜想是不是操作上有问题,因为自变量有十多个维度,就将十多个维度及6个控制变量同时放入回归(多重共线性其实不明显),自变量过多且彼此之间具有较强相关性是否会造成1和2的问题?如果自变量彼此之间相关性很强,那是否可以做单独挑一些维度做一元回归?另外我们在不同的样本中比较这些因果关系,但四个样本差距很大(97,455,2066,1354),这样的差距是否可以比较?97的那个样本所有的回归都不显著,是不是样本太少的缘故呢?
# W6 z- E' {8 Y8 X
真的非常抱歉问的比较琐碎,可是查阅了工具书都没有涉及到这么琐碎的问题,所以只好在这儿求助了,拜托拜托,谢谢谢谢!
作者:
Kenneth
时间:
2014-10-10 22:17
1. X1 的回归系数 是当 X1与Y在控制住其他的X后的关系。当不同的X有很大的相关时(多重共线性),你说的结果是可能的。把相关很大的X删掉一点吧。
T c, b ?9 L: f& k" p
/ k% j7 t# Y! u" C- ]4 k
能否单挑,是理论的问题,不是统计的问题。
5 S. R- Z G0 t: O1 V
+ l! s V2 X# @
2&3. 什么叫 “回归分析F检验”? 是R平方的检验吗?不显著是因为 R-sq 等于.02吗? 如果是的话,你的模型就有问题了。当模型没有预测能力时,个别的X的回归系数的t-检验,就算是显著也没有用的。这就好比一个国家衰弱,你说我自己很强,那你在谈判桌上有力吗?相反的,你的国家很强,如果你自己很弱,你自己在谈判桌上也是没用的。只有当你的国家强,你也强时,你“自己”及就很有力了。
作者:
梅恩
时间:
2014-10-11 10:21
谢谢罗老师!我表达有误,“回归分析F检验”就是回归模型的方差分析,对R方的显著性检验。我做出来的R方只有0.02左右,但是F检验是显著的,可能跟样本比较大有关。
作者:
Kenneth
时间:
2014-10-11 18:03
本帖最后由 Kenneth 于 2014-10-11 18:06 编辑
( M, ]. ]% c+ @/ b/ `/ C- D
% d6 g4 A( v, ^' A5 S \, Q3 c
梅恩,
' r3 P+ {" i+ F) W
对不起,漏答的一点。
! I$ b5 n; E% \3 D. f3 \
# g. `; l8 K0 s8 D0 w8 {
1. 四个样本的大小差别这么大,很难比较。一般来说,样本数越大,估计越准确、越可信。一个非常可信,一个不太可信,如何比较呢?
+ d6 Z5 c: p' @0 Q& ~. R
5 g# j3 z" Y8 j& _" f' P- W
2. 你的样本数上了一千,统计上显著是很自然的。我猜你的问题是你混肴了 statistical significance 与 practical signifcance。统计显著性是统计项是否为0,显著就是 R-sq 不等于0。就算是 R-sq 是 0.0001, 只要你的样本数有1,000,000,它都会显著的。好,我们知道 R-sq 不等于0(显著)了,那等于什么呢?答案就是 等于 0.0001 了!
; W5 P. |+ I3 u& z/ O. U. j8 d
) y8 B9 a. P3 e
因此下一个问题是,纵然是 统计上显著,那么实用上是否显著呢? Is it practically significant? 这是一个主观的判断,不过R-sq等于 .02,大部分的人都会说是太少了。意思是,你所有的自变量加起来,说解释的因变量的方差都只是2%, 那实在是很少、很少。
作者:
梅恩
时间:
2014-10-11 21:56
看到罗老师这么认真耐心地解答,真的好感动,感谢上帝借着您将这样的恩典带给科研路上懵懂的我们,谢谢您!您是好榜样。我会再仔细读读相关的一些文献再分析。
作者:
Kenneth
时间:
2014-10-12 21:19
不用客气。既然我选择了老师这个职业,也接受别人称呼我老师,在可能的情形尽自己的义务是应该的。
欢迎光临 中人网 (http://bbs.chinahrd.net/)
Powered by Discuz! X2.5