- 最后登录
- 2016-11-27
- 注册时间
- 2003-1-21
- 威望
- 250
- 金钱
- 16832
- 贡献
- 11934
- 阅读权限
- 255
- 积分
- 29016
- 日志
- 4
- 记录
- 0
- 帖子
- 1438
- 主题
- 69
- 精华
- 0
- 好友
- 380
    
- 注册时间
- 2003-1-21
- 最后登录
- 2016-11-27
- 积分
- 29016
- 精华
- 0
- 主题
- 69
- 帖子
- 1438
|
本帖最后由 Kenneth 于 2014-10-11 18:06 编辑 ' G. T4 j( |4 A7 m, I
; ]/ d* J8 A/ |6 I! }! B: s梅恩,. Q) ]5 r" Q. N- H/ C0 x" w
对不起,漏答的一点。* { A7 g* I) E* {, G
* I5 C J; f4 D: c6 N1. 四个样本的大小差别这么大,很难比较。一般来说,样本数越大,估计越准确、越可信。一个非常可信,一个不太可信,如何比较呢?. q7 x! O0 i( G
% `; C3 J3 ^3 t+ B9 c9 ]+ ^7 s% j$ s a$ s
2. 你的样本数上了一千,统计上显著是很自然的。我猜你的问题是你混肴了 statistical significance 与 practical signifcance。统计显著性是统计项是否为0,显著就是 R-sq 不等于0。就算是 R-sq 是 0.0001, 只要你的样本数有1,000,000,它都会显著的。好,我们知道 R-sq 不等于0(显著)了,那等于什么呢?答案就是 等于 0.0001 了!9 d9 @1 u. r% M; g
/ L# M5 H' g1 N/ }6 k" V因此下一个问题是,纵然是 统计上显著,那么实用上是否显著呢? Is it practically significant? 这是一个主观的判断,不过R-sq等于 .02,大部分的人都会说是太少了。意思是,你所有的自变量加起来,说解释的因变量的方差都只是2%, 那实在是很少、很少。 |
|