中人网
标题: 假设与模型如何给出? [打印本页]
作者: zhouluyang 时间: 2012-2-6 13:29
标题: 假设与模型如何给出?
本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑 6 K3 s+ p/ ]- B+ v0 `
4 v- B; S- `) Q- _7 o
文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
$ \4 k% P/ }3 `6 p$ e' o' G# L$ L
假设,存在这样一种研究目的与理论背景。
8 W* v% W" D' y4 G9 P/ {7 g, o9 h
我想要研究X1、X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。
. Z% i. x* C4 o* O
通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现:
`, h$ J" r8 F/ R0 _, Q, n
(1)X1、X2对Y之间可能存在某种显著的影响。
2 _# r" P6 [& ~* }+ X/ U/ z" ] (2)X1与X2之间也存在某此关联,包括,X1对X2与Y的关系可能存在调节效应,X1对X2可能存在直接的效应。
" {! F$ m; T' P8 I) J2 [: a; u0 W (3)M1可能对X1与Y之间的直接效应存在调节效应。
6 Y5 e) |& u: {' ?1 z (4)X2与Y之间可能还存在中介变量M2,即X对M2的直接效应可能显著,M2对Y的直接效应也可能显著。
+ P, V& @' M) R2 a3 ?4 ]( _
(5)除了上述X1、X2、M1、M2以外,已有的研究表明,C1与C2是对Y具有重要影响的两个变量;C3、C4、C5、C6、C7、C8对Y也有影响,但已有研究表明,其影响与C1与C2相比显得不那么重要。
- ~3 W7 z( ?! l3 b: g (6)已有的研究提醒我们,P1对X1有重要的影响,P2对X2有重要的影响。
, I% }7 b2 S, Z. T' J3 j: F/ g3 g6 E 下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1、X2、M1与M2。
1 x0 P( m( a& K" H" Z+ m
我认为,图2是正确的,图1是错误的。理由如下。
6 _2 ]5 e7 q* L. S# y; H/ `
一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1与X2如何对Y产生影响,因此我们要考察的是从X1与X2到Y的影响路径,而不是从P1、P2到Y的路径。至于P1、P2到X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1、P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。
, @9 t+ C: N: \4 @' w" `0 i C1到C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1、C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1与X2对Y的影响,因此,我们对C1与C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1与Y之间、C2与Y之间画一个箭头纳入分析就好了,以至于C1、C2对Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。
0 X$ ?- n. F! Y3 L4 { D& T5 S
最后,在SEM分析中,只须纳入C1与C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1、X2这两个前因变量时,X1与X2及其路径中出现的M1、M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1、X2、M1、M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。
6 J/ q# I# K0 ~: M
这是我最近的一点心得。我的理解正确吗?
望Kenny指正。
0 f2 c3 H5 b- p( v0 Y[attach]290457[/attach]
作者: Kenneth 时间: 2012-2-13 19:35
我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?
5 I! v* u/ K" W! W! G" g后者包含了前者,有什么问题呢?当然,有没有这个必要是另外一个问题。但是,别人多做了一点分析难道是错吗?
4 R6 h: W! k8 @; s& l6 t+ i6 Z) A! l; W至于控制的问题,我同意当然是只要控制最重要的变量了。
作者: zhouluyang 时间: 2012-2-14 00:10
本帖最后由 zhouluyang 于 2012-2-14 00:11 编辑 # g8 Y2 k- h; m' \& x# J
1 `* Q) V& _( S1 G; ]+ o谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。! p/ K4 N0 A% H9 g
一、“至于控制的问题,我同意当然是只要控制最重要的变量了。”这句话,对我很重要。因为我正遇上这种问题。我想这应该是研究策略的问题吧。属于艺术范畴的东西吧。另外,能否谈谈你的理由?为什么只要控制最重要的就行了?听你的口气,好像是理所当然的问题,而我却是思考很长时间才这么想的。
. x4 M- |. Y+ ?3 z: Z. B: k, S) T, f二、“我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?”我同意,这里没有对错的问题。但是,从写作与文章的角度来说,如果研究目标在于考察B的影响,那么,再将A对B的影响也纳入文章中,除非很有必要加以补充说明,我认为,A也在行文中加入,可能就会使文章偏题了。这也就是你说的“是否必要”的问题了。
作者: Kenneth 时间: 2012-2-14 16:17
zhouluyang 发表于 2012-2-14 00:10 
7 [' S3 }8 S+ }& Y- j# N谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。
* k {- m8 `* `5 i! T4 ~# I一、“至于控制的问题,我同意当然是只要控制最重要 ...
b! P9 c* D2 U: z/ V
1. 不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。/ W2 j5 W; Q- C4 @
2. 你这样讲是对的,但是假设是作者把两组的效应一视同仁,等同的来研究,同样的重视。
作者: zhouluyang 时间: 2012-2-15 12:50
本帖最后由 zhouluyang 于 2012-2-15 22:42 编辑
8 Y1 h" _* u- V1 P# |+ _9 F1 `) ]. {. x& u8 A1 w' U5 o, c
"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
- B1 F9 q6 G7 S/ q进一步地,我再询问一下:
/ ^: `: u. }' Z+ G以您的研究经验,纳入模型中的控制变量,通常是几个?1个,还是多个?
4 w( Z1 h) g8 V6 ^) Q+ T; k, _3 u4 B( J4 C% [, K( d" W
在我最近的研究中,简单起见,假如我的研究模型是X——>Y;依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?- ^) V% O1 R4 I9 U/ u; Z
作者: Kenneth 时间: 2012-2-16 09:28
zhouluyang 发表于 2012-2-15 12:50
- y# w- ]; V6 {1 x% ?
"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
. h. Z% z+ N7 S0 | w7 a( f5 [进 ...
. v" G: j5 l* ?8 r3 `zhou,
9 c5 r# g/ t/ M8 q, W( x8 t/ l
3 z# W9 h- o& |5 ?2 I- X1. 通常是几个?1个,还是多个?
3 y4 w9 W6 ~9 c5 J( n* `9 I* q5 l* W8 t3 }0 X
很少是一个,通常是几个。
7 B! f4 [6 x ]6 x9 R0 y. k2 \2 u9 L( s0 y' j, I( I, C2 S5 D
2. 依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?3 |6 z; X, T' v
) Y/ W8 x3 D) x r
我会这样做。
作者: zhouluyang 时间: 2012-4-14 10:51
本帖最后由 zhouluyang 于 2012-4-14 10:54 编辑
, S' I* z ?0 B* o2 ]Kenneth 发表于 2012-2-16 09:28 
+ [: L7 m% t* L5 ?- x L# ~3 kzhou,
) ^. Q6 l4 P7 N+ H: b" S; ~& f$ e$ j) M( X
1. 通常是几个?1个,还是多个?
9 Q7 Y' o! C* O+ C0 y
Kenny,
& Z$ G. H, I& O$ d s也许是我突发奇想的问题。
- L8 R+ {4 p J8 A3 |, C A: z我现在很想知道,我的三个控制变量,是否已经充分了。
) E# @; D% S; O/ j5 f: r& v我在SEM中,逐步累积地添加三个控制变量,当添加到最后一个控制变量时,模型的系数估计值已经变化很小了。但是,我如何证明,模型的这最后一个控制变量,对模型的系数估计值 已经没有显著影响了呢?
4 `! V3 q6 C' ?: ^7 Q8 A我不知道我的意思表达清楚没有,因此,我再换个方法说一下。
; U5 `% L6 t/ l( z6 ~! h, ~
/ s& k. x% @5 V* C6 J F+ R(1)Y=a0+a1X1+........+e15 d# N* }7 G& P. ?/ T4 W
(2)Y=b0+b1X1+b2X2+........+e2
4 x! ]( S6 t6 j- P7 i2 ]上面这两个模型,模型(1)中,当模型中只有一个作为我研究目标的自变量X1时(省略号中的变量为控制变量),X1的系数估计值用a1表示;当我在模型(1)的基础上再额外添加一个自变量X2(即最后一个控制变量)形成模型(2)时,X1的系数估计值用b1表示。
8 X, I$ R% P! r: ?5 ~' O; f2 e! G! ~1 `( l
问题:
9 t" }( D2 b4 o8 E J我在SEM中估计两个模型,
* V- o# v, }6 |) \- X我该如何检验a1与b1之间无显著不同?(比如,a1=0.61,b1=0.60,我应该采用什么方法来检验这个0.61与0.60之间是没有显著不同的呢?)
作者: Kenneth 时间: 2012-4-14 16:53
zhouluyang 发表于 2012-4-14 10:51
& L3 M c8 M: k+ c- ?$ P
Kenny,
5 ?4 R$ Q8 s* ^5 B) `也许是我突发奇想的问题。' C) v6 Q1 P# j/ p5 d" i/ S4 e5 V
我现在很想知道,我的三个控制变量,是否已经充分了。
- E+ r0 z8 G, }; k* S3 m
我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:! H. v4 w' I, d. u* @' l$ R! j7 p
1. 模型自由估计b1时,b1=0.60,模型卡方是 C1;
" v' \2 o: F! u, q2 t) T& e# \2. 你可以在同一个模型,把b1限制为 b1=.61 (由你设定,不是估计出来的),模型卡方是 C2;
! A+ j5 c# x7 Y/ j/ }这两个模型是嵌套的,可以用卡方差来验证。
作者: allevon 时间: 2012-4-14 20:49
我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计参数,变成不显著!所以,从这个角度看,控制变量并不是越多越好!当然,控制变量的选择,是一个理论问题。
作者: zhouluyang 时间: 2012-4-15 15:08
Kenneth 发表于 2012-4-14 16:53
. l3 H) X* M9 X
我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:9 A* c1 Q Y- j5 {1 Z
1. 模型自由估计b1时,b1=0.60,模型卡方是 ...
# p5 F0 Z' X1 X! W
谢谢KENNY,我试试。
作者: zhouluyang 时间: 2012-4-15 15:10
allevon 发表于 2012-4-14 20:49 
+ u2 ?1 V( ^, u我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计 ...
0 Z* l7 U# X* K& M# Q8 V如KENNY上面所言,控制变量加到后面,其实对其它系数的估计已经没有什么影响了。我的研究也表明了这一点,加到第三个控制变量,系数的估计值完全不变化。所以,你所说的,“会导致很多原本显著的估计参数,变成不显著”,这个问题并不存在。3 n- K( W3 z) T; J9 M% n
有一个问题,倒是确实存在:即控制变量多了goodness of fit会变得不太好。
欢迎光临 中人网 (http://bbs.chinahrd.net/) |
Powered by Discuz! X2.5 |