本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑 ) f0 K) R' R. u, ^( e. N; C# Z; u
6 U5 v/ X4 O p2 M, H8 ^5 b% h
文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
1 F% r' N' U0 v5 b8 v' w' t 假设,存在这样一种研究目的与理论背景。
6 [0 Q0 Z' i3 C$ ^) M$ }, H2 p: ] 我想要研究X1、X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。 $ L' _$ n- z; Q$ |
通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现:
7 B0 O: ~! A7 ?6 ^: ?. s9 f2 T% ] (1)X1、X2对Y之间可能存在某种显著的影响。
4 l+ G9 I# C h) M( O" r (2)X1与X2之间也存在某此关联,包括,X1对X2与Y的关系可能存在调节效应,X1对X2可能存在直接的效应。 * f3 Z+ f1 E3 X, ^8 x5 P& n
(3)M1可能对X1与Y之间的直接效应存在调节效应。
5 e! x R$ x; B, @6 N3 T (4)X2与Y之间可能还存在中介变量M2,即X对M2的直接效应可能显著,M2对Y的直接效应也可能显著。 " j6 w: A: t a1 q. [7 U5 {/ K
(5)除了上述X1、X2、M1、M2以外,已有的研究表明,C1与C2是对Y具有重要影响的两个变量;C3、C4、C5、C6、C7、C8对Y也有影响,但已有研究表明,其影响与C1与C2相比显得不那么重要。
- x% g3 e) S* k: w' q: e$ M) j (6)已有的研究提醒我们,P1对X1有重要的影响,P2对X2有重要的影响。 - f0 L& Z0 A: M9 a5 L
下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1、X2、M1与M2。
+ z1 a0 y' B) A) [ S 我认为,图2是正确的,图1是错误的。理由如下。
6 E2 A3 _1 U. l! Z# w B 一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1与X2如何对Y产生影响,因此我们要考察的是从X1与X2到Y的影响路径,而不是从P1、P2到Y的路径。至于P1、P2到X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1、P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。 : @& a6 @5 i8 b. X. W, N6 y
C1到C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1、C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1与X2对Y的影响,因此,我们对C1与C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1与Y之间、C2与Y之间画一个箭头纳入分析就好了,以至于C1、C2对Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。 ! a# m- g2 @& d- E$ {( |. D
最后,在SEM分析中,只须纳入C1与C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1、X2这两个前因变量时,X1与X2及其路径中出现的M1、M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1、X2、M1、M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。
6 u* _3 e2 Z' u: c 这是我最近的一点心得。我的理解正确吗? 望Kenny指正。 6 ], D' b2 U$ P* q( Q% A0 T
|