本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑
9 S* v# z+ k) d# P& a, ?- p, Y! ~8 }" B& \3 O
文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
% }! M, R1 O! @$ ~/ c) O 假设,存在这样一种研究目的与理论背景。 ' B+ N- P& z! V
我想要研究X1、X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。 4 w' K4 h/ c2 i$ r% K9 W5 N
通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现: $ @" v& D( I! ?& }( l7 f* V
(1)X1、X2对Y之间可能存在某种显著的影响。
7 p( v9 n# e3 F+ M. M' E" _7 n5 L (2)X1与X2之间也存在某此关联,包括,X1对X2与Y的关系可能存在调节效应,X1对X2可能存在直接的效应。
# L0 E# ]& a+ t4 n6 Q, \0 b (3)M1可能对X1与Y之间的直接效应存在调节效应。
6 D5 f0 [; L, d, ^0 _3 M3 O (4)X2与Y之间可能还存在中介变量M2,即X对M2的直接效应可能显著,M2对Y的直接效应也可能显著。 $ A! M {' q% b+ c0 u& [3 d! [
(5)除了上述X1、X2、M1、M2以外,已有的研究表明,C1与C2是对Y具有重要影响的两个变量;C3、C4、C5、C6、C7、C8对Y也有影响,但已有研究表明,其影响与C1与C2相比显得不那么重要。
, k; X0 `1 H( I4 x6 k9 `% n (6)已有的研究提醒我们,P1对X1有重要的影响,P2对X2有重要的影响。
& A7 D* X8 B- S' ]1 y! _6 Z 下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1、X2、M1与M2。 ! _! c7 X1 ?. ?; @! X! `. \
我认为,图2是正确的,图1是错误的。理由如下。 0 x" d% J$ h# L( i: p
一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1与X2如何对Y产生影响,因此我们要考察的是从X1与X2到Y的影响路径,而不是从P1、P2到Y的路径。至于P1、P2到X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1、P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。 $ N0 t- Z8 j# y' [" B2 u* k! A# o
C1到C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1、C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1与X2对Y的影响,因此,我们对C1与C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1与Y之间、C2与Y之间画一个箭头纳入分析就好了,以至于C1、C2对Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。 $ Z+ q+ |/ \( M6 E
最后,在SEM分析中,只须纳入C1与C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1、X2这两个前因变量时,X1与X2及其路径中出现的M1、M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1、X2、M1、M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。 0 |) M5 R9 G; i2 r4 W& u
这是我最近的一点心得。我的理解正确吗? 望Kenny指正。 * \" O" a8 u( {% U! q F
|