中人网

标题: 假设与模型如何给出? [打印本页]

作者: zhouluyang    时间: 2012-2-6 13:29
标题: 假设与模型如何给出?
本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑 ' n3 h% k, k& |$ l
' K( Z5 P. a7 e) W1 e* l
          文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
) G, j* t* O' W( M# R$ _( [. l
          假设,存在这样一种研究目的与理论背景。

5 ?% D/ {# J9 d; f, z$ w+ X
          我想要研究X1X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。
" o: Y5 E5 `/ b# a& a4 ?
        通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现:
1 K4 f; x# V. f4 |
          (1X1X2Y之间可能存在某种显著的影响。
) m- \; ?0 t/ M: r* g( Y$ ?# Q8 G
        (2X1X2之间也存在某此关联,包括,X1X2Y的关系可能存在调节效应,X1X2可能存在直接的效应。
2 M1 I4 i$ Z* u0 C: X+ X4 m
        (3M1可能对X1Y之间的直接效应存在调节效应。

  K' c! q# a7 O. M7 B0 U
        (4X2Y之间可能还存在中介变量M2,即XM2的直接效应可能显著,M2Y的直接效应也可能显著。
6 i0 O  Q5 J' z5 a/ }7 w, t& c
        (5)除了上述X1X2M1M2以外,已有的研究表明,C1C2是对Y具有重要影响的两个变量;C3C4C5C6C7C8Y也有影响,但已有研究表明,其影响与C1C2相比显得不那么重要。

: a3 s" G. t1 S
        (6)已有的研究提醒我们,P1X1有重要的影响,P2X2有重要的影响。
: }/ r2 x, k  k( r
        下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1X2M1M2
( E5 l! Z0 D; _" `( b3 B; Q
        我认为,图2是正确的,图1是错误的。理由如下。
2 o) K- u  ?# L% ?* d" s: e. P# T
        一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1X2如何对Y产生影响,因此我们要考察的是从X1X2Y的影响路径,而不是从P1P2Y的路径。至于P1P2X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。

$ j- Z$ F% X. F8 R, Z' d
        C1C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1X2Y的影响,因此,我们对C1C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1Y之间、C2Y之间画一个箭头纳入分析就好了,以至于C1C2Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。
+ P# p. k9 v7 s, P; M- }! ?+ x
         最后,在SEM分析中,只须纳入C1C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1X2这两个前因变量时,X1X2及其路径中出现的M1M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1X2M1M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。

$ a' K6 |9 _7 P; p* j, Z7 n
        这是我最近的一点心得。我的理解正确吗?
        望Kenny指正。
/ {) F) n2 `* Q" b0 v  v2 U
[attach]290457[/attach]

作者: Kenneth    时间: 2012-2-13 19:35
我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?
: K3 K$ b3 B1 c后者包含了前者,有什么问题呢?当然,有没有这个必要是另外一个问题。但是,别人多做了一点分析难道是错吗?
2 \+ V/ f: W1 W( s至于控制的问题,我同意当然是只要控制最重要的变量了。
作者: zhouluyang    时间: 2012-2-14 00:10
本帖最后由 zhouluyang 于 2012-2-14 00:11 编辑
' n, I6 S3 B3 t0 @
6 O- V+ ^! X. Q1 w8 ?谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。
* a' P/ W: f/ ^: F. |' N5 G一、“至于控制的问题,我同意当然是只要控制最重要的变量了。”这句话,对我很重要。因为我正遇上这种问题。我想这应该是研究策略的问题吧。属于艺术范畴的东西吧。另外,能否谈谈你的理由?为什么只要控制最重要的就行了?听你的口气,好像是理所当然的问题,而我却是思考很长时间才这么想的。- @. M9 d2 f. T, L3 Z" D
二、“我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?”我同意,这里没有对错的问题。但是,从写作与文章的角度来说,如果研究目标在于考察B的影响,那么,再将A对B的影响也纳入文章中,除非很有必要加以补充说明,我认为,A也在行文中加入,可能就会使文章偏题了。这也就是你说的“是否必要”的问题了。
作者: Kenneth    时间: 2012-2-14 16:17
zhouluyang 发表于 2012-2-14 00:10 & z" [( y9 G3 e. z, ]/ T& V
谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。
( i" s8 q5 a. R8 R一、“至于控制的问题,我同意当然是只要控制最重要 ...
) A, B  G$ z* m4 c, H
1. 不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。  `- E4 N4 V4 `) O7 u* ?
2. 你这样讲是对的,但是假设是作者把两组的效应一视同仁,等同的来研究,同样的重视。
作者: zhouluyang    时间: 2012-2-15 12:50
本帖最后由 zhouluyang 于 2012-2-15 22:42 编辑 ' I7 V2 h0 v2 m8 P* i% U
3 `, n* y) q: t
"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
& y( b! ?& m( G: I进一步地,我再询问一下:. b$ y$ `0 b  n! |1 e% X
以您的研究经验,纳入模型中的控制变量,通常是几个?1个,还是多个?/ ^3 M2 T/ G+ C
/ w$ q" Y6 y' R! p3 u/ I/ f
在我最近的研究中,简单起见,假如我的研究模型是X——>Y;依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?' e" \$ Q  q+ J6 m

作者: Kenneth    时间: 2012-2-16 09:28
zhouluyang 发表于 2012-2-15 12:50
4 M. y$ M$ h6 n"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
: T/ N1 {! E6 L0 T9 Z进 ...
5 }9 c5 x  c* B! b
zhou,
- F# y+ z0 R+ W% v
, \1 i  X" _! n  w" K1. 通常是几个?1个,还是多个?. l' I0 P- c7 ?: |( D" W) W9 }# l
; u% r2 R0 p% d( `
很少是一个,通常是几个。
0 D) ?% K0 q* ~9 m3 x7 z5 x: o  p; e; ^
2. 依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?
  l; Y1 l3 e1 Q: v4 ^# ^0 u% `9 D, i! p8 o. t, e/ u$ X; C! |7 P
我会这样做。
作者: zhouluyang    时间: 2012-4-14 10:51
本帖最后由 zhouluyang 于 2012-4-14 10:54 编辑 & l9 x0 }! ~5 c
Kenneth 发表于 2012-2-16 09:28 * h: l6 j0 \6 S1 P4 i0 O# t
zhou,! U" i+ m1 k  W& \3 t+ c- c
' C3 V  h8 h. z! M( v
1. 通常是几个?1个,还是多个?

, }' c- I& t1 H& rKenny,& S5 o: o8 Q8 I& v8 Z) E6 X
也许是我突发奇想的问题。- l5 i! K% n5 N- \* N9 A2 ]! [
我现在很想知道,我的三个控制变量,是否已经充分了。- L$ V. U: `2 _/ ?8 p
我在SEM中,逐步累积地添加三个控制变量,当添加到最后一个控制变量时,模型的系数估计值已经变化很小了。但是,我如何证明,模型的这最后一个控制变量,对模型的系数估计值 已经没有显著影响了呢?
; D0 ?3 J- n) [3 q8 I$ P; B1 o* j我不知道我的意思表达清楚没有,因此,我再换个方法说一下。
) n0 X7 M4 v# Z: Y# E8 W( p5 i/ ]8 `( S4 H* y) b( k
(1)Y=a0+a1X1+........+e1' W+ c+ ^8 i3 j/ q- M. u
(2)Y=b0+b1X1+b2X2+........+e2
  a- U; ?( j5 ~' W  L& E上面这两个模型,模型(1)中,当模型中只有一个作为我研究目标的自变量X1时(省略号中的变量为控制变量),X1的系数估计值用a1表示;当我在模型(1)的基础上再额外添加一个自变量X2(即最后一个控制变量)形成模型(2)时,X1的系数估计值用b1表示。- s# O5 `: N& Z6 c( E$ r4 `
% t# E( Z3 g# L( J
问题:
  s$ H1 x; S, R) F我在SEM中估计两个模型,
0 q! k* B$ C7 J6 k! e& X2 m我该如何检验a1与b1之间无显著不同?(比如,a1=0.61,b1=0.60,我应该采用什么方法来检验这个0.61与0.60之间是没有显著不同的呢?)
作者: Kenneth    时间: 2012-4-14 16:53
zhouluyang 发表于 2012-4-14 10:51 ( K0 `+ s# w( B
Kenny,
& E6 Y, W3 I$ u$ N. X也许是我突发奇想的问题。
8 f0 h6 {& L% l4 `5 C- W我现在很想知道,我的三个控制变量,是否已经充分了。

1 s, E: r* w$ _1 g3 j" o+ H: K6 k我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:4 C2 K! w% C: j( W/ |8 q
1. 模型自由估计b1时,b1=0.60,模型卡方是 C1;& `8 c" h+ h; G0 y5 n0 O- i. Y
2. 你可以在同一个模型,把b1限制为 b1=.61 (由你设定,不是估计出来的),模型卡方是 C2;& g3 M& {1 C6 u6 U
这两个模型是嵌套的,可以用卡方差来验证。
作者: allevon    时间: 2012-4-14 20:49
我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计参数,变成不显著!所以,从这个角度看,控制变量并不是越多越好!当然,控制变量的选择,是一个理论问题。
作者: zhouluyang    时间: 2012-4-15 15:08
Kenneth 发表于 2012-4-14 16:53
7 \0 K; _  |2 m2 |; f6 j$ ]# T0 _我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:
% U! l8 c# T/ X4 F1 m1. 模型自由估计b1时,b1=0.60,模型卡方是  ...

5 F: p6 M* z" T- O谢谢KENNY,我试试。
作者: zhouluyang    时间: 2012-4-15 15:10
allevon 发表于 2012-4-14 20:49
# f1 T$ V3 A- S" C1 p* r* ~! c# o我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计 ...

$ ?0 [. o, {8 G8 @; w如KENNY上面所言,控制变量加到后面,其实对其它系数的估计已经没有什么影响了。我的研究也表明了这一点,加到第三个控制变量,系数的估计值完全不变化。所以,你所说的,“会导致很多原本显著的估计参数,变成不显著”,这个问题并不存在。  u* p- `* t2 |+ g* @
有一个问题,倒是确实存在:即控制变量多了goodness of fit会变得不太好。




欢迎光临 中人网 (http://bbs.chinahrd.net/) Powered by Discuz! X2.5