中人网

标题: 假设与模型如何给出? [打印本页]

作者: zhouluyang    时间: 2012-2-6 13:29
标题: 假设与模型如何给出?
本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑 6 K3 s+ p/ ]- B+ v0 `
4 v- B; S- `) Q- _7 o
          文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
$ \4 k% P/ }3 `6 p$ e' o' G# L$ L
          假设,存在这样一种研究目的与理论背景。
8 W* v% W" D' y4 G9 P/ {7 g, o9 h
          我想要研究X1X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。
. Z% i. x* C4 o* O
        通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现:
  `, h$ J" r8 F/ R0 _, Q, n
          (1X1X2Y之间可能存在某种显著的影响。

2 _# r" P6 [& ~* }+ X/ U/ z" ]
        (2X1X2之间也存在某此关联,包括,X1X2Y的关系可能存在调节效应,X1X2可能存在直接的效应。

" {! F$ m; T' P8 I) J2 [: a; u0 W
        (3M1可能对X1Y之间的直接效应存在调节效应。

6 Y5 e) |& u: {' ?1 z
        (4X2Y之间可能还存在中介变量M2,即XM2的直接效应可能显著,M2Y的直接效应也可能显著。
+ P, V& @' M) R2 a3 ?4 ]( _
        (5)除了上述X1X2M1M2以外,已有的研究表明,C1C2是对Y具有重要影响的两个变量;C3C4C5C6C7C8Y也有影响,但已有研究表明,其影响与C1C2相比显得不那么重要。

- ~3 W7 z( ?! l3 b: g
        (6)已有的研究提醒我们,P1X1有重要的影响,P2X2有重要的影响。

, I% }7 b2 S, Z. T' J3 j: F/ g3 g6 E
        下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1X2M1M2
1 x0 P( m( a& K" H" Z+ m
        我认为,图2是正确的,图1是错误的。理由如下。
6 _2 ]5 e7 q* L. S# y; H/ `
        一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1X2如何对Y产生影响,因此我们要考察的是从X1X2Y的影响路径,而不是从P1P2Y的路径。至于P1P2X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。

, @9 t+ C: N: \4 @' w" `0 i
        C1C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1X2Y的影响,因此,我们对C1C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1Y之间、C2Y之间画一个箭头纳入分析就好了,以至于C1C2Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。
0 X$ ?- n. F! Y3 L4 {  D& T5 S
         最后,在SEM分析中,只须纳入C1C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1X2这两个前因变量时,X1X2及其路径中出现的M1M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1X2M1M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。
6 J/ q# I# K0 ~: M
        这是我最近的一点心得。我的理解正确吗?
        望Kenny指正。

0 f2 c3 H5 b- p( v0 Y
[attach]290457[/attach]

作者: Kenneth    时间: 2012-2-13 19:35
我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?
5 I! v* u/ K" W! W! G" g后者包含了前者,有什么问题呢?当然,有没有这个必要是另外一个问题。但是,别人多做了一点分析难道是错吗?
4 R6 h: W! k8 @; s& l6 t+ i6 Z) A! l; W至于控制的问题,我同意当然是只要控制最重要的变量了。
作者: zhouluyang    时间: 2012-2-14 00:10
本帖最后由 zhouluyang 于 2012-2-14 00:11 编辑 # g8 Y2 k- h; m' \& x# J

1 `* Q) V& _( S1 G; ]+ o谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。! p/ K4 N0 A% H9 g
一、“至于控制的问题,我同意当然是只要控制最重要的变量了。”这句话,对我很重要。因为我正遇上这种问题。我想这应该是研究策略的问题吧。属于艺术范畴的东西吧。另外,能否谈谈你的理由?为什么只要控制最重要的就行了?听你的口气,好像是理所当然的问题,而我却是思考很长时间才这么想的。
. x4 M- |. Y+ ?3 z: Z. B: k, S) T, f二、“我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?”我同意,这里没有对错的问题。但是,从写作与文章的角度来说,如果研究目标在于考察B的影响,那么,再将A对B的影响也纳入文章中,除非很有必要加以补充说明,我认为,A也在行文中加入,可能就会使文章偏题了。这也就是你说的“是否必要”的问题了。
作者: Kenneth    时间: 2012-2-14 16:17
zhouluyang 发表于 2012-2-14 00:10
7 [' S3 }8 S+ }& Y- j# N谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。
* k  {- m8 `* `5 i! T4 ~# I一、“至于控制的问题,我同意当然是只要控制最重要 ...
  b! P9 c* D2 U: z/ V
1. 不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。/ W2 j5 W; Q- C4 @
2. 你这样讲是对的,但是假设是作者把两组的效应一视同仁,等同的来研究,同样的重视。
作者: zhouluyang    时间: 2012-2-15 12:50
本帖最后由 zhouluyang 于 2012-2-15 22:42 编辑
8 Y1 h" _* u- V1 P# |+ _9 F1 `) ]. {. x& u8 A1 w' U5 o, c
"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
- B1 F9 q6 G7 S/ q进一步地,我再询问一下:
/ ^: `: u. }' Z+ G以您的研究经验,纳入模型中的控制变量,通常是几个?1个,还是多个?
4 w( Z1 h) g8 V6 ^) Q+ T; k, _3 u4 B( J4 C% [, K( d" W
在我最近的研究中,简单起见,假如我的研究模型是X——>Y;依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?- ^) V% O1 R4 I9 U/ u; Z

作者: Kenneth    时间: 2012-2-16 09:28
zhouluyang 发表于 2012-2-15 12:50 - y# w- ]; V6 {1 x% ?
"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
. h. Z% z+ N7 S0 |  w7 a( f5 [进 ...

. v" G: j5 l* ?8 r3 `zhou,
9 c5 r# g/ t/ M8 q, W( x8 t/ l
3 z# W9 h- o& |5 ?2 I- X1. 通常是几个?1个,还是多个?
3 y4 w9 W6 ~9 c5 J( n* `9 I* q5 l* W8 t3 }0 X
很少是一个,通常是几个。
7 B! f4 [6 x  ]6 x9 R0 y. k2 \2 u9 L( s0 y' j, I( I, C2 S5 D
2. 依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?3 |6 z; X, T' v
) Y/ W8 x3 D) x  r
我会这样做。
作者: zhouluyang    时间: 2012-4-14 10:51
本帖最后由 zhouluyang 于 2012-4-14 10:54 编辑
, S' I* z  ?0 B* o2 ]
Kenneth 发表于 2012-2-16 09:28
+ [: L7 m% t* L5 ?- x  L# ~3 kzhou,
) ^. Q6 l4 P7 N+ H: b" S; ~& f$ e$ j) M( X
1. 通常是几个?1个,还是多个?
9 Q7 Y' o! C* O+ C0 y
Kenny,
& Z$ G. H, I& O$ d  s也许是我突发奇想的问题。
- L8 R+ {4 p  J8 A3 |, C  A: z我现在很想知道,我的三个控制变量,是否已经充分了。
) E# @; D% S; O/ j5 f: r& v我在SEM中,逐步累积地添加三个控制变量,当添加到最后一个控制变量时,模型的系数估计值已经变化很小了。但是,我如何证明,模型的这最后一个控制变量,对模型的系数估计值 已经没有显著影响了呢?
4 `! V3 q6 C' ?: ^7 Q8 A我不知道我的意思表达清楚没有,因此,我再换个方法说一下。
; U5 `% L6 t/ l( z6 ~! h, ~
/ s& k. x% @5 V* C6 J  F+ R(1)Y=a0+a1X1+........+e15 d# N* }7 G& P. ?/ T4 W
(2)Y=b0+b1X1+b2X2+........+e2
4 x! ]( S6 t6 j- P7 i2 ]上面这两个模型,模型(1)中,当模型中只有一个作为我研究目标的自变量X1时(省略号中的变量为控制变量),X1的系数估计值用a1表示;当我在模型(1)的基础上再额外添加一个自变量X2(即最后一个控制变量)形成模型(2)时,X1的系数估计值用b1表示。
8 X, I$ R% P! r: ?5 ~' O; f2 e! G! ~1 `( l
问题:
9 t" }( D2 b4 o8 E  J我在SEM中估计两个模型,
* V- o# v, }6 |) \- X我该如何检验a1与b1之间无显著不同?(比如,a1=0.61,b1=0.60,我应该采用什么方法来检验这个0.61与0.60之间是没有显著不同的呢?)
作者: Kenneth    时间: 2012-4-14 16:53
zhouluyang 发表于 2012-4-14 10:51 & L3 M  c8 M: k+ c- ?$ P
Kenny,
5 ?4 R$ Q8 s* ^5 B) `也许是我突发奇想的问题。' C) v6 Q1 P# j/ p5 d" i/ S4 e5 V
我现在很想知道,我的三个控制变量,是否已经充分了。
- E+ r0 z8 G, }; k* S3 m
我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:! H. v4 w' I, d. u* @' l$ R! j7 p
1. 模型自由估计b1时,b1=0.60,模型卡方是 C1;
" v' \2 o: F! u, q2 t) T& e# \2. 你可以在同一个模型,把b1限制为 b1=.61 (由你设定,不是估计出来的),模型卡方是 C2;
! A+ j5 c# x7 Y/ j/ }这两个模型是嵌套的,可以用卡方差来验证。
作者: allevon    时间: 2012-4-14 20:49
我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计参数,变成不显著!所以,从这个角度看,控制变量并不是越多越好!当然,控制变量的选择,是一个理论问题。
作者: zhouluyang    时间: 2012-4-15 15:08
Kenneth 发表于 2012-4-14 16:53 . l3 H) X* M9 X
我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:9 A* c1 Q  Y- j5 {1 Z
1. 模型自由估计b1时,b1=0.60,模型卡方是  ...
# p5 F0 Z' X1 X! W
谢谢KENNY,我试试。
作者: zhouluyang    时间: 2012-4-15 15:10
allevon 发表于 2012-4-14 20:49
+ u2 ?1 V( ^, u我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计 ...

0 Z* l7 U# X* K& M# Q8 V如KENNY上面所言,控制变量加到后面,其实对其它系数的估计已经没有什么影响了。我的研究也表明了这一点,加到第三个控制变量,系数的估计值完全不变化。所以,你所说的,“会导致很多原本显著的估计参数,变成不显著”,这个问题并不存在。3 n- K( W3 z) T; J9 M% n
有一个问题,倒是确实存在:即控制变量多了goodness of fit会变得不太好。




欢迎光临 中人网 (http://bbs.chinahrd.net/) Powered by Discuz! X2.5