- 最后登录
- 2016-11-27
- 注册时间
- 2003-1-21
- 威望
- 250
- 金钱
- 16832
- 贡献
- 11934
- 阅读权限
- 255
- 积分
- 29016
- 日志
- 4
- 记录
- 0
- 帖子
- 1438
- 主题
- 69
- 精华
- 0
- 好友
- 380
- 注册时间
- 2003-1-21
- 最后登录
- 2016-11-27
- 积分
- 29016
- 精华
- 0
- 主题
- 69
- 帖子
- 1438
|
回复 1楼 Kenneth 的帖子8 l2 p, Y9 Z' }* e! x+ i8 }3 Q2 T
nancyzju,: G( p: D1 P! _$ g9 w- s- U( B) t
第一个问题:
0 j/ G; h- a9 P, s我偏向第一种方法,虽然两种我都见过。原因很简单,就是如何订立应该先放A和A*X,还是B和B*X呢?其实在普通回归也有同样的问题。你要证明A与B都影响Y,可以先放A,然后在放B。如果A与B的相关大的话,先放A,A就显著;后放B,B就不显著了。但是我们如果先放B,B就显著;后放A,A就不显著了。结果刚刚相反。 所以,除非你有特别的理论上的理由(比如要先控制什么),不然都是一同进去,公平竞争好。3 ?3 b, W/ y+ n1 _+ p
第二个问题:- n/ X, W3 D* y4 `# y" ?% w
类别变量转化为虚拟变量后,要整个虚拟变量来理解才有意义,不可以单放一个进去(因为单放一个进去的话,意义就大大不同了)。比如企业类型有三种(国有企业、合资企业、私营企业), 我就做两个虚拟变量,叫做SOE 和JV (注,不需要第三个,因为第三个是完全依赖与头两个的,一个企业,如果不是SOE,也不是JV,SOE=0,JV=0 的话,就一定是私营企业了,所以SOE=0,JV=0 就代表是Private=1,private这个变量是多余的,根本不需要)。
& q% O+ M8 y- e& f5 _, I好,分析的时候,如果单放SOE进去,你只可以知道“是国有”(SOE=1)和“非国有”(SOE=0)的分别,就是SOE这个变量的回归系数。但是你却不知道“企业类型”对Y的影响。所以一定要SOE和JV一同放进去,然后用层级回归(hierarchical regression)看同时放了这两个变量后,模型的总R-平方多了多少,是否显著。那才是回答“企业类型有没有影响”这个问题的答案。& C+ ~$ P" `/ U+ K
7 r2 W# G3 b( x( m3 A |
|