设为首页 登录 注册
首页 中人社区 中人博客
查看: 2602|回复: 10
打印 上一主题 下一主题

假设与模型如何给出?

[复制链接]

11

主题

8

听众

3584

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3584
精华
0
主题
11
帖子
118
跳转到指定楼层
楼主
发表于 2012-2-6 13:29:10 |只看该作者 |倒序浏览
本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑 9 i. L; L: ~* x9 j5 g

# l( v, c! f# L4 W
          文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。
3 `: T) b- p1 ^9 a4 L
          假设,存在这样一种研究目的与理论背景。
- L4 {/ R7 o& f- z8 ~$ h
          我想要研究X1X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。
! B9 a% h4 D9 F; C, x$ j2 X
        通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现:
6 R5 p3 N& y* j9 d: |
          (1X1X2Y之间可能存在某种显著的影响。

- s6 M; y  J/ Z
        (2X1X2之间也存在某此关联,包括,X1X2Y的关系可能存在调节效应,X1X2可能存在直接的效应。

7 T% |. J* z. c: f* k
        (3M1可能对X1Y之间的直接效应存在调节效应。
, \' H& V  f3 r# u
        (4X2Y之间可能还存在中介变量M2,即XM2的直接效应可能显著,M2Y的直接效应也可能显著。
5 E. l* ]5 R( e; _  n0 E) s
        (5)除了上述X1X2M1M2以外,已有的研究表明,C1C2是对Y具有重要影响的两个变量;C3C4C5C6C7C8Y也有影响,但已有研究表明,其影响与C1C2相比显得不那么重要。
; c$ b6 g) O- C7 m# S
        (6)已有的研究提醒我们,P1X1有重要的影响,P2X2有重要的影响。
) N: g/ [4 q- F3 N' ]
        下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1X2M1M2

* n# ^  N: H6 {0 i& \' I
        我认为,图2是正确的,图1是错误的。理由如下。
) `% a% }8 s7 \4 l& k
        一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1X2如何对Y产生影响,因此我们要考察的是从X1X2Y的影响路径,而不是从P1P2Y的路径。至于P1P2X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。
, Z/ D$ {1 Y/ x  z' @7 ~  Q
        C1C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1X2Y的影响,因此,我们对C1C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1Y之间、C2Y之间画一个箭头纳入分析就好了,以至于C1C2Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。
5 @/ R8 G* _6 X, ?
         最后,在SEM分析中,只须纳入C1C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1X2这两个前因变量时,X1X2及其路径中出现的M1M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1X2M1M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。
& v' H5 p" N8 c+ X
        这是我最近的一点心得。我的理解正确吗?
        望Kenny指正。

8 [0 C7 {. o+ y1 I

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

沙发
发表于 2012-2-13 19:35:26 |只看该作者
我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?. x! b1 Y0 _& G/ G0 {
后者包含了前者,有什么问题呢?当然,有没有这个必要是另外一个问题。但是,别人多做了一点分析难道是错吗?
6 Y. C3 o6 b4 n9 w至于控制的问题,我同意当然是只要控制最重要的变量了。
回复

使用道具 举报

11

主题

8

听众

3584

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3584
精华
0
主题
11
帖子
118
板凳
发表于 2012-2-14 00:10:58 |只看该作者
本帖最后由 zhouluyang 于 2012-2-14 00:11 编辑
8 e5 `% `: p5 e
0 H+ @0 Y: @, t& A9 G) a6 C. Q谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。2 c( t3 h! X/ L6 t& z) X- `
一、“至于控制的问题,我同意当然是只要控制最重要的变量了。”这句话,对我很重要。因为我正遇上这种问题。我想这应该是研究策略的问题吧。属于艺术范畴的东西吧。另外,能否谈谈你的理由?为什么只要控制最重要的就行了?听你的口气,好像是理所当然的问题,而我却是思考很长时间才这么想的。% A, p; b0 w8 l4 D7 C+ i; H. I
二、“我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?”我同意,这里没有对错的问题。但是,从写作与文章的角度来说,如果研究目标在于考察B的影响,那么,再将A对B的影响也纳入文章中,除非很有必要加以补充说明,我认为,A也在行文中加入,可能就会使文章偏题了。这也就是你说的“是否必要”的问题了。
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

地板
发表于 2012-2-14 16:17:25 |只看该作者
zhouluyang 发表于 2012-2-14 00:10 8 U/ u; N  K6 u7 z
谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。
" {" S, ~0 B* @一、“至于控制的问题,我同意当然是只要控制最重要 ...
; D/ t3 l& {4 ~& Z; ]4 ]
1. 不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。
. w% \' ^6 h5 k& `2 z4 F  e2. 你这样讲是对的,但是假设是作者把两组的效应一视同仁,等同的来研究,同样的重视。
回复

使用道具 举报

11

主题

8

听众

3584

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3584
精华
0
主题
11
帖子
118
5
发表于 2012-2-15 12:50:45 |只看该作者
本帖最后由 zhouluyang 于 2012-2-15 22:42 编辑
; T5 A, B2 }: p! ^3 w: {+ k- _# x7 y% Z
"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。  Z: X# ^' {% {- y8 V( |
进一步地,我再询问一下:1 ^: o3 \6 }6 b  s
以您的研究经验,纳入模型中的控制变量,通常是几个?1个,还是多个?
3 }, d- P. L: T3 N1 E+ K) W2 {2 V5 H. N3 X, x9 ?& b
在我最近的研究中,简单起见,假如我的研究模型是X——>Y;依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?
( Z% ~! o- Y3 C  J# ?1 p
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

6
发表于 2012-2-16 09:28:56 |只看该作者
zhouluyang 发表于 2012-2-15 12:50 - o. m- d; g& q# E1 _
"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
# f' b" i, ?; P! i* n/ r进 ...

. \: G6 z8 Y3 Y5 j) x. Izhou,8 }/ r" ]5 _# l: f2 l

/ _3 [$ |  f& v7 c* u' b+ `$ y1. 通常是几个?1个,还是多个?
! @" V5 \: v3 U  v+ z0 u/ x' G( o! E$ N- H. y
很少是一个,通常是几个。6 Y+ w3 o( Z3 K

/ ]& c( h4 J  l9 w2. 依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?
8 F1 I+ }8 j1 Z4 X) t7 h" h3 _5 N2 \9 [& X  x/ f
我会这样做。
回复

使用道具 举报

11

主题

8

听众

3584

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3584
精华
0
主题
11
帖子
118
7
发表于 2012-4-14 10:51:18 |只看该作者
本帖最后由 zhouluyang 于 2012-4-14 10:54 编辑
: [) G6 F7 S3 f$ P) N5 q
Kenneth 发表于 2012-2-16 09:28
6 |8 s( i. X0 o. X) ]zhou,( A9 D6 O3 w4 B3 X1 U$ k* U$ x
3 Z( N8 J( M- I: X
1. 通常是几个?1个,还是多个?
# F1 n: O: r* ]; A. Y" S
Kenny,
2 d$ u, X# y1 c: |也许是我突发奇想的问题。4 B1 M6 D4 V' J0 V( R2 y5 z
我现在很想知道,我的三个控制变量,是否已经充分了。% z' S8 I) s& W3 `0 m/ I
我在SEM中,逐步累积地添加三个控制变量,当添加到最后一个控制变量时,模型的系数估计值已经变化很小了。但是,我如何证明,模型的这最后一个控制变量,对模型的系数估计值 已经没有显著影响了呢?. P9 h7 a% I6 d6 W% y$ t4 n+ h
我不知道我的意思表达清楚没有,因此,我再换个方法说一下。2 z% O& D1 s9 t( x6 D) b

/ e9 J% X6 m) o, S. L9 _(1)Y=a0+a1X1+........+e1
* x& g5 i. s5 C4 i2 D(2)Y=b0+b1X1+b2X2+........+e2: l3 j4 s5 H# }7 q7 b; D
上面这两个模型,模型(1)中,当模型中只有一个作为我研究目标的自变量X1时(省略号中的变量为控制变量),X1的系数估计值用a1表示;当我在模型(1)的基础上再额外添加一个自变量X2(即最后一个控制变量)形成模型(2)时,X1的系数估计值用b1表示。! M- T: e' |. S8 ~$ \' N

1 K  t( S: T% o# [% s问题:
/ o2 i6 `, h' o. o6 L我在SEM中估计两个模型,8 @" c2 ]- `' K0 b4 N
我该如何检验a1与b1之间无显著不同?(比如,a1=0.61,b1=0.60,我应该采用什么方法来检验这个0.61与0.60之间是没有显著不同的呢?)
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

8
发表于 2012-4-14 16:53:15 |只看该作者
zhouluyang 发表于 2012-4-14 10:51
# q1 f: c: f9 V5 d  x8 eKenny,7 d  v) ^$ j! [# b% m
也许是我突发奇想的问题。
+ R+ [4 |  C3 m" m( R, ]我现在很想知道,我的三个控制变量,是否已经充分了。

  P: Q# o1 p/ i" e) a. P我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:5 a, j" A1 X0 E/ s1 `: _9 d6 N$ W. e
1. 模型自由估计b1时,b1=0.60,模型卡方是 C1;7 g& T% B) Y" J- U) G- U# c
2. 你可以在同一个模型,把b1限制为 b1=.61 (由你设定,不是估计出来的),模型卡方是 C2;. l4 a' E+ g. h6 e) r; }. A2 H* y
这两个模型是嵌套的,可以用卡方差来验证。
回复

使用道具 举报

4

主题

6

听众

3056

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2010-11-28
最后登录
2022-1-10
积分
3056
精华
0
主题
4
帖子
288
9
发表于 2012-4-14 20:49:38 |只看该作者
我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计参数,变成不显著!所以,从这个角度看,控制变量并不是越多越好!当然,控制变量的选择,是一个理论问题。
回复

使用道具 举报

11

主题

8

听众

3584

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3584
精华
0
主题
11
帖子
118
10
发表于 2012-4-15 15:08:52 |只看该作者
Kenneth 发表于 2012-4-14 16:53 : [8 M; ^: n% h" _, ^
我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:
+ H" l) r+ a7 E1. 模型自由估计b1时,b1=0.60,模型卡方是  ...
; h# n0 l2 L& T! b3 a
谢谢KENNY,我试试。
回复

使用道具 举报