本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑 " \. w/ \% l5 J' p: f" b, r
, E9 Z. Z& W! n6 v/ i
文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
: y0 ^" H% j9 a( N5 g 假设,存在这样一种研究目的与理论背景。 $ k5 z5 T7 z8 U' J7 a7 |# c
我想要研究X1、X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。
5 O5 M- D* H+ _& y% { 通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现: u3 B% s' {- n. U2 h0 f2 A' A
(1)X1、X2对Y之间可能存在某种显著的影响。
8 O1 @6 {- j- B" y8 b8 X (2)X1与X2之间也存在某此关联,包括,X1对X2与Y的关系可能存在调节效应,X1对X2可能存在直接的效应。
: R+ S( G. O! N6 P2 P9 I (3)M1可能对X1与Y之间的直接效应存在调节效应。 - r6 n& O1 [" E4 k! _
(4)X2与Y之间可能还存在中介变量M2,即X对M2的直接效应可能显著,M2对Y的直接效应也可能显著。
+ T" N: C4 ]; u. I: E J5 _* y (5)除了上述X1、X2、M1、M2以外,已有的研究表明,C1与C2是对Y具有重要影响的两个变量;C3、C4、C5、C6、C7、C8对Y也有影响,但已有研究表明,其影响与C1与C2相比显得不那么重要。
* n d1 e% m' d# `4 \8 Y9 q (6)已有的研究提醒我们,P1对X1有重要的影响,P2对X2有重要的影响。 % K" ~$ K7 y6 w& ~1 L- ^8 m5 i& V
下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1、X2、M1与M2。 5 g( ^9 U( V% ^" `1 L
我认为,图2是正确的,图1是错误的。理由如下。
4 q. K2 }/ [. j8 J3 { 一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1与X2如何对Y产生影响,因此我们要考察的是从X1与X2到Y的影响路径,而不是从P1、P2到Y的路径。至于P1、P2到X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1、P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。 ; U# S2 Y! a t1 L
C1到C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1、C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1与X2对Y的影响,因此,我们对C1与C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1与Y之间、C2与Y之间画一个箭头纳入分析就好了,以至于C1、C2对Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。
" B3 H5 k F4 ], ?7 b- V 最后,在SEM分析中,只须纳入C1与C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1、X2这两个前因变量时,X1与X2及其路径中出现的M1、M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1、X2、M1、M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。 % D8 X! K+ U8 k! ]
这是我最近的一点心得。我的理解正确吗? 望Kenny指正。 . `0 S) \5 g$ y
|