设为首页 登录 注册
首页 中人社区 中人博客
查看: 1356|回复: 2
打印 上一主题 下一主题

缺失值引起的拟合度和稳健性问题

[复制链接]
Ruder    

5

主题

4

听众

940

积分

秀才

Rank: 5Rank: 5

注册时间
2002-10-12
最后登录
2015-12-15
积分
940
精华
0
主题
5
帖子
18
跳转到指定楼层
楼主
发表于 2013-5-8 11:20:02 |只看该作者 |倒序浏览
问卷调查经常会有很多缺失值,因此,加入不同变量进行分析就会对应不同的观察值数量,这就会造成两个问题:一是回归模型的匹配度可能发生逆转,变量越多对应的观察数量就越少,即越多变量可能反而模型拟合度越差;二是在做稳健性检验的时候,因为对比的模型包含的变量可能是不一样的,因此所包含的观察值数量是不同的,可能因为这个原因造成无法通过稳健性检验。请教各位老师和同学,如何处理这类问题?
: ?% n/ g) p# f

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

沙发
发表于 2013-5-9 08:54:57 |只看该作者
Ruder, 如果缺失值(missing values)不多的话,你可以考虑把缺失的值估计出来。最简单的就是用其他数据的平均。也可以用回归分析来估计。在 “missing value” 这个文献里有很丰富的讨论。
回复

使用道具 举报

Ruder    

5

主题

4

听众

940

积分

秀才

Rank: 5Rank: 5

注册时间
2002-10-12
最后登录
2015-12-15
积分
940
精华
0
主题
5
帖子
18
板凳
发表于 2013-5-10 23:44:27 |只看该作者
谢谢kenneth的回复,我原来是担心用估计值代替缺失值会有一种人为创造数据的感觉。
回复

使用道具 举报