本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑
' [/ k% S7 e4 S6 J" o" d/ s! j9 G! p/ s% q, F# ?" `
文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。 2 f# Z, ^3 u% [1 _* \4 p
假设,存在这样一种研究目的与理论背景。
9 ^3 n) `- K1 T8 r. Y7 Z 我想要研究X1、X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。 0 C5 v; P' ^( Z) i
通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现: 6 g( [# c& ? o& `
(1)X1、X2对Y之间可能存在某种显著的影响。
4 _3 E5 ?; Y8 L" @- M' p7 s4 T (2)X1与X2之间也存在某此关联,包括,X1对X2与Y的关系可能存在调节效应,X1对X2可能存在直接的效应。
N% K+ V8 G4 n" Z/ E. ? (3)M1可能对X1与Y之间的直接效应存在调节效应。 9 w6 v: Q4 M1 [/ v+ V4 M, T9 m
(4)X2与Y之间可能还存在中介变量M2,即X对M2的直接效应可能显著,M2对Y的直接效应也可能显著。
8 p; a v" w- S5 m3 b9 Z+ q2 t# i" s (5)除了上述X1、X2、M1、M2以外,已有的研究表明,C1与C2是对Y具有重要影响的两个变量;C3、C4、C5、C6、C7、C8对Y也有影响,但已有研究表明,其影响与C1与C2相比显得不那么重要。 2 W8 @/ j; z+ j8 u" H8 P! S; s
(6)已有的研究提醒我们,P1对X1有重要的影响,P2对X2有重要的影响。
& h- ^$ w/ J0 |* f7 v 下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1、X2、M1与M2。 3 C7 H' X* R( J. v$ ]& A# @/ n
我认为,图2是正确的,图1是错误的。理由如下。 ( B5 U& w( Z T* T1 {/ b0 R( N
一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1与X2如何对Y产生影响,因此我们要考察的是从X1与X2到Y的影响路径,而不是从P1、P2到Y的路径。至于P1、P2到X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1、P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。 9 q8 Q" ^1 L" G' ]% I3 ^! U n3 R
C1到C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1、C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1与X2对Y的影响,因此,我们对C1与C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1与Y之间、C2与Y之间画一个箭头纳入分析就好了,以至于C1、C2对Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。 . [% U$ n! Y7 l6 m6 h& y4 k9 {: k
最后,在SEM分析中,只须纳入C1与C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1、X2这两个前因变量时,X1与X2及其路径中出现的M1、M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1、X2、M1、M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。
8 ~6 ?' x: f& } 这是我最近的一点心得。我的理解正确吗? 望Kenny指正。
- i& p/ \8 `0 T! W# o8 N5 o |