设为首页 登录 注册
首页 中人社区 中人博客
查看: 1661|回复: 5
打印 上一主题 下一主题

请教一个回归分析的问题

[复制链接]

1

主题

5

听众

26

积分

书童

Rank: 1

注册时间
2011-2-18
最后登录
2014-10-28
积分
26
精华
0
主题
1
帖子
3
跳转到指定楼层
楼主
发表于 2014-10-9 20:50:55 |只看该作者 |倒序浏览
罗老师和各位同仁好!抱歉我发现连最基本的回归我都没有搞定,我遇到三个问题:1. 相关系数是正的,但回归系数是负的;2. 回归分析F检验不显著,但个别回归系数显著;3. F检验和回归系数都显著,但R方只有0.02左右,回归系数也很小,这样能接受吗?前两个问题我猜想是不是操作上有问题,因为自变量有十多个维度,就将十多个维度及6个控制变量同时放入回归(多重共线性其实不明显),自变量过多且彼此之间具有较强相关性是否会造成1和2的问题?如果自变量彼此之间相关性很强,那是否可以做单独挑一些维度做一元回归?另外我们在不同的样本中比较这些因果关系,但四个样本差距很大(97,455,2066,1354),这样的差距是否可以比较?97的那个样本所有的回归都不显著,是不是样本太少的缘故呢?
( f. X6 E. |7 A# q真的非常抱歉问的比较琐碎,可是查阅了工具书都没有涉及到这么琐碎的问题,所以只好在这儿求助了,拜托拜托,谢谢谢谢!

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

沙发
发表于 2014-10-10 22:17:36 |只看该作者
1. X1 的回归系数 是当 X1与Y在控制住其他的X后的关系。当不同的X有很大的相关时(多重共线性),你说的结果是可能的。把相关很大的X删掉一点吧。
+ r6 S& A8 T3 n- U+ B3 W! N& ~! {* s0 i- l
能否单挑,是理论的问题,不是统计的问题。1 C' H7 {1 M$ m- u
9 C+ B: `$ f1 O
2&3. 什么叫 “回归分析F检验”? 是R平方的检验吗?不显著是因为 R-sq 等于.02吗? 如果是的话,你的模型就有问题了。当模型没有预测能力时,个别的X的回归系数的t-检验,就算是显著也没有用的。这就好比一个国家衰弱,你说我自己很强,那你在谈判桌上有力吗?相反的,你的国家很强,如果你自己很弱,你自己在谈判桌上也是没用的。只有当你的国家强,你也强时,你“自己”及就很有力了。
回复

使用道具 举报

1

主题

5

听众

26

积分

书童

Rank: 1

注册时间
2011-2-18
最后登录
2014-10-28
积分
26
精华
0
主题
1
帖子
3
板凳
发表于 2014-10-11 10:21:59 |只看该作者
谢谢罗老师!我表达有误,“回归分析F检验”就是回归模型的方差分析,对R方的显著性检验。我做出来的R方只有0.02左右,但是F检验是显著的,可能跟样本比较大有关。
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

地板
发表于 2014-10-11 18:03:47 |只看该作者
本帖最后由 Kenneth 于 2014-10-11 18:06 编辑
5 n1 r! x% J3 T1 v& z7 f! e- L
$ k4 X! ~  F, |. U+ F! d5 f8 z梅恩,
- y* V" O0 V) T! O1 ]5 X) S2 X对不起,漏答的一点。
( F5 u  Y! _& E1 n' l3 F4 T5 w6 Q5 g1 k) m3 k
1. 四个样本的大小差别这么大,很难比较。一般来说,样本数越大,估计越准确、越可信。一个非常可信,一个不太可信,如何比较呢?
. W; y* x# x/ ]- y/ @+ t/ A& \/ {) _* t; q
2. 你的样本数上了一千,统计上显著是很自然的。我猜你的问题是你混肴了 statistical significance 与 practical signifcance。统计显著性是统计项是否为0,显著就是 R-sq 不等于0。就算是 R-sq 是 0.0001, 只要你的样本数有1,000,000,它都会显著的。好,我们知道  R-sq 不等于0(显著)了,那等于什么呢?答案就是 等于 0.0001 了!$ W7 D4 Y9 R: F/ s/ S
' R- \8 j& I; a+ f8 J
因此下一个问题是,纵然是 统计上显著,那么实用上是否显著呢? Is it practically significant? 这是一个主观的判断,不过R-sq等于 .02,大部分的人都会说是太少了。意思是,你所有的自变量加起来,说解释的因变量的方差都只是2%, 那实在是很少、很少。
回复

使用道具 举报

1

主题

5

听众

26

积分

书童

Rank: 1

注册时间
2011-2-18
最后登录
2014-10-28
积分
26
精华
0
主题
1
帖子
3
5
发表于 2014-10-11 21:56:42 |只看该作者
看到罗老师这么认真耐心地解答,真的好感动,感谢上帝借着您将这样的恩典带给科研路上懵懂的我们,谢谢您!您是好榜样。我会再仔细读读相关的一些文献再分析。
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

6
发表于 2014-10-12 21:19:42 |只看该作者
不用客气。既然我选择了老师这个职业,也接受别人称呼我老师,在可能的情形尽自己的义务是应该的。
回复

使用道具 举报