本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑 $ v } D# e9 \! a
2 H2 z8 F, d& k0 h" p! K
文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
0 k# o) B$ j' e 假设,存在这样一种研究目的与理论背景。 2 o, T1 F. e* {5 I7 ^* |6 h3 N
我想要研究X1、X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。
. b5 M9 Q2 ~$ P3 S p 通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现: 4 v5 x) ?2 M$ N8 K$ F! ?
(1)X1、X2对Y之间可能存在某种显著的影响。
1 o; @, L/ e$ W8 H (2)X1与X2之间也存在某此关联,包括,X1对X2与Y的关系可能存在调节效应,X1对X2可能存在直接的效应。 : r1 F- a5 t7 X" D9 j1 f, Q
(3)M1可能对X1与Y之间的直接效应存在调节效应。 - p2 n: j L+ T* [5 A& O
(4)X2与Y之间可能还存在中介变量M2,即X对M2的直接效应可能显著,M2对Y的直接效应也可能显著。
, E& s g3 C' T (5)除了上述X1、X2、M1、M2以外,已有的研究表明,C1与C2是对Y具有重要影响的两个变量;C3、C4、C5、C6、C7、C8对Y也有影响,但已有研究表明,其影响与C1与C2相比显得不那么重要。 0 D7 G+ }1 h5 U$ c4 L7 e4 ^
(6)已有的研究提醒我们,P1对X1有重要的影响,P2对X2有重要的影响。
_9 @6 s" I+ I* ^ 下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1、X2、M1与M2。 ' o! Z- x& X2 `# |& e; ]2 C: ~+ c
我认为,图2是正确的,图1是错误的。理由如下。
6 z+ B; S$ [3 _ 一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1与X2如何对Y产生影响,因此我们要考察的是从X1与X2到Y的影响路径,而不是从P1、P2到Y的路径。至于P1、P2到X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1、P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。
5 v' ]' U' j9 |: I9 k8 } C1到C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1、C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1与X2对Y的影响,因此,我们对C1与C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1与Y之间、C2与Y之间画一个箭头纳入分析就好了,以至于C1、C2对Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。 . p; O8 e W' F! g, z# \0 n
最后,在SEM分析中,只须纳入C1与C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1、X2这两个前因变量时,X1与X2及其路径中出现的M1、M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1、X2、M1、M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。 ! {1 y& x/ x. m- _
这是我最近的一点心得。我的理解正确吗? 望Kenny指正。
1 T2 g$ f5 O4 U! ? |