设为首页 登录 注册
首页 中人社区 中人博客
查看: 2681|回复: 10
打印 上一主题 下一主题

假设与模型如何给出?

[复制链接]

11

主题

8

听众

3604

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3604
精华
0
主题
11
帖子
118
跳转到指定楼层
楼主
发表于 2012-2-6 13:29:10 |只看该作者 |正序浏览
本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑
5 |' O8 [# j- @, O
6 [, S# j5 C, |1 A- ?8 q
          文献读多了,会被一个一个冒出来的变量搅得头昏脑胀。这时候,最头疼的事情,就是,哪些变量应该纳入到我的模型中?我谈一些体会,其中也有不少困惑,请Kenny指正解惑。

. V/ G7 T- Q3 A( s5 K
          假设,存在这样一种研究目的与理论背景。
2 K1 a/ E+ G. w4 q
          我想要研究X1X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究,原因有二:第一,这两个变量对Y的管理很重要,有现实的管理意义;第二,现有的研究中,对这两个变量的研究不多或不充分或有缺陷。

- L9 |5 g5 A; V2 c; X. m! p' S
        通过大量的文献阅读,从某些已有的研究结论(实证的结果或逻辑的推导)出发,得到以下发现:
/ B3 h  Q' @) W, j
          (1X1X2Y之间可能存在某种显著的影响。

# l  j9 G3 b  t0 @
        (2X1X2之间也存在某此关联,包括,X1X2Y的关系可能存在调节效应,X1X2可能存在直接的效应。

* f# R2 g4 j8 r2 B3 B
        (3M1可能对X1Y之间的直接效应存在调节效应。

9 f+ t" [* P  a4 Y
        (4X2Y之间可能还存在中介变量M2,即XM2的直接效应可能显著,M2Y的直接效应也可能显著。
5 I- B& b8 @' `
        (5)除了上述X1X2M1M2以外,已有的研究表明,C1C2是对Y具有重要影响的两个变量;C3C4C5C6C7C8Y也有影响,但已有研究表明,其影响与C1C2相比显得不那么重要。
  g, O% u9 X0 K+ ^5 `
        (6)已有的研究提醒我们,P1X1有重要的影响,P2X2有重要的影响。
, \. @& W5 k/ C: Q
        下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1X2M1M2
# H2 h* o2 D6 w
        我认为,图2是正确的,图1是错误的。理由如下。

+ W) h/ T& D+ |+ x# \4 l2 ?
        一项研究,一个Paper,其理论模型应该纳入哪些变量,由研究目的决定。由于本项研究的目的是考察X1X2如何对Y产生影响,因此我们要考察的是从X1X2Y的影响路径,而不是从P1P2Y的路径。至于P1P2X的影响,乃至到Y的影响,最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1P2也纳入模型中,按这样的逻辑,研究就没完没了了,因为,P1也有前因变量,P1的前因变量还有前因变量….就没法研究了。
1 M' a2 F/ t+ e& Z, u1 h' N
        C1C8属于控制变量,在理论模型中不应该纳入。控制变量是模型的外生变量,如果纳入理论模型中,就变成模型的内生变量了。尽管在已有的文献中,C1C2等变量与Y之间的关系可能显得很明确,但由于我们只考察X1X2Y的影响,因此,我们对C1C2等对Y的具体影响是什么可以“假装不知”,在SEM分析中,直接在C1Y之间、C2Y之间画一个箭头纳入分析就好了,以至于C1C2Y的影响到底是什么可能不是很重要了(当然可以在文章的最后适当的讨论一下,但不是文章的论述重点)。
7 H7 Z* _  h' [. ^
         最后,在SEM分析中,只须纳入C1C2这两个控制变量就足够了,即如图3。因为,一个变量Y的前因变量,可能有无数。当我们确定只研究X1X2这两个前因变量时,X1X2及其路径中出现的M1M2以外的变量,也无穷多。因此,我们挑选控制变量时候,只能将X1X2M1M2以外,对Y有“重要影响”的变量纳入为控制变量加以分析处理。
5 V+ ^9 T+ H# m2 m2 Q% W" r% C
        这是我最近的一点心得。我的理解正确吗?
        望Kenny指正。

+ l$ ]3 @* a$ i' Z% ?* v

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

11

主题

8

听众

3604

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3604
精华
0
主题
11
帖子
118
11
发表于 2012-4-15 15:10:59 |只看该作者
allevon 发表于 2012-4-14 20:49 ' A# g# G  I% {2 t' s" h
我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计 ...
* R* [% l+ {5 _, C/ p
如KENNY上面所言,控制变量加到后面,其实对其它系数的估计已经没有什么影响了。我的研究也表明了这一点,加到第三个控制变量,系数的估计值完全不变化。所以,你所说的,“会导致很多原本显著的估计参数,变成不显著”,这个问题并不存在。6 i) |& g, n& f; V7 A
有一个问题,倒是确实存在:即控制变量多了goodness of fit会变得不太好。
回复

使用道具 举报

11

主题

8

听众

3604

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3604
精华
0
主题
11
帖子
118
10
发表于 2012-4-15 15:08:52 |只看该作者
Kenneth 发表于 2012-4-14 16:53 ) H" H2 Q6 z; x( m
我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:
' G! _# Q4 n4 U8 k" N' `1. 模型自由估计b1时,b1=0.60,模型卡方是  ...
9 F$ `, u; B# F/ j
谢谢KENNY,我试试。
回复

使用道具 举报

4

主题

6

听众

3056

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2010-11-28
最后登录
2022-1-10
积分
3056
精华
0
主题
4
帖子
288
9
发表于 2012-4-14 20:49:38 |只看该作者
我还有一个想法,控制变量越多,会导致统计功效下降,并且在研究样本容量一定时,会导致很多原本显著的估计参数,变成不显著!所以,从这个角度看,控制变量并不是越多越好!当然,控制变量的选择,是一个理论问题。
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

8
发表于 2012-4-14 16:53:15 |只看该作者
zhouluyang 发表于 2012-4-14 10:51
# r! ?" a' X& v; q, t0 V6 r: IKenny,  \4 q/ q( X: @6 R7 A  |+ x: P0 V
也许是我突发奇想的问题。9 U, ?, |2 o) I
我现在很想知道,我的三个控制变量,是否已经充分了。
! L, |0 E; o% h
我虽然觉得这样做没有很大的意义,但是如果你要的话,可以:
# N6 k# B' n4 D% x1. 模型自由估计b1时,b1=0.60,模型卡方是 C1;
( \" c) H- z) W+ e+ W3 C* r2. 你可以在同一个模型,把b1限制为 b1=.61 (由你设定,不是估计出来的),模型卡方是 C2;; ?3 X- t' i9 }7 y% W! [, Y5 A% B
这两个模型是嵌套的,可以用卡方差来验证。
回复

使用道具 举报

11

主题

8

听众

3604

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3604
精华
0
主题
11
帖子
118
7
发表于 2012-4-14 10:51:18 |只看该作者
本帖最后由 zhouluyang 于 2012-4-14 10:54 编辑
3 O9 {+ _9 w7 _2 K- @2 Z
Kenneth 发表于 2012-2-16 09:28
' \# W& z' n  B, }$ f2 y8 Qzhou,9 L, x6 i4 |6 p5 X

* y; k1 w* [$ B1. 通常是几个?1个,还是多个?

/ V' r4 P' B# {  z% N- UKenny,5 z$ W% E7 {) |9 r* v; ?
也许是我突发奇想的问题。
! G4 Y- V  L" P% p# ]5 d( p我现在很想知道,我的三个控制变量,是否已经充分了。" ]7 \: |, x6 V7 g6 h- W8 m3 z4 I6 I0 H
我在SEM中,逐步累积地添加三个控制变量,当添加到最后一个控制变量时,模型的系数估计值已经变化很小了。但是,我如何证明,模型的这最后一个控制变量,对模型的系数估计值 已经没有显著影响了呢?. u6 G1 f2 {+ M2 q
我不知道我的意思表达清楚没有,因此,我再换个方法说一下。5 V4 e; s: T" ]

; l$ c; _( P7 h/ ?1 g/ j(1)Y=a0+a1X1+........+e18 h' G& T' U% W
(2)Y=b0+b1X1+b2X2+........+e2
# `2 a- m- h; y) h) y, K+ q上面这两个模型,模型(1)中,当模型中只有一个作为我研究目标的自变量X1时(省略号中的变量为控制变量),X1的系数估计值用a1表示;当我在模型(1)的基础上再额外添加一个自变量X2(即最后一个控制变量)形成模型(2)时,X1的系数估计值用b1表示。; m% N# e7 D6 H; i5 T: L0 B+ s
5 q) a* V# E- H8 n- L! d9 p3 g' I
问题:. F3 E" L9 F' q$ q* _# D
我在SEM中估计两个模型,
( P8 [$ i! W% a- V+ y我该如何检验a1与b1之间无显著不同?(比如,a1=0.61,b1=0.60,我应该采用什么方法来检验这个0.61与0.60之间是没有显著不同的呢?)
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

6
发表于 2012-2-16 09:28:56 |只看该作者
zhouluyang 发表于 2012-2-15 12:50
; g% Q5 x% q0 o, R"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
* T" M" J+ z! Q% I- B进 ...

6 P, B+ N4 v% o7 fzhou,8 d( P5 O' h: y) m
3 x! H( ~! n9 M
1. 通常是几个?1个,还是多个?
3 g6 P5 N' }7 r! A
- n8 K- a2 b" ?$ P很少是一个,通常是几个。
6 q2 o  ^! I) E: I, g: c0 s# P9 p3 O$ F7 o% V7 K
2. 依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?
# \. L- S* Q* D
3 s4 p+ `$ Y1 g8 a5 t5 ]我会这样做。
回复

使用道具 举报

11

主题

8

听众

3604

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3604
精华
0
主题
11
帖子
118
5
发表于 2012-2-15 12:50:45 |只看该作者
本帖最后由 zhouluyang 于 2012-2-15 22:42 编辑 0 {; v  n* Y( E8 o* [( e

2 X1 E- W* ?  j# v"不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。"这句话给了我很多的启发。非常感谢。
2 C7 v2 ?7 I8 T- N, ?3 s! V6 e$ q$ R进一步地,我再询问一下:
1 t! ~8 L4 u  E8 ?$ m% {  Z以您的研究经验,纳入模型中的控制变量,通常是几个?1个,还是多个?
6 [: q  W& L& K, h
+ b. P: Z. w" K. Z3 m0 E/ ?在我最近的研究中,简单起见,假如我的研究模型是X——>Y;依据已有的文献,在我所研究的变量X以外,有3个被认为是重要的或最重要的对Y有影响的前因变量,因此我将这3变量均作为控制变量。不知妥否?
3 ~3 {* }  [5 l5 r0 ^
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

地板
发表于 2012-2-14 16:17:25 |只看该作者
zhouluyang 发表于 2012-2-14 00:10
4 f9 B- y0 Z- d  f2 ~! P谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。
2 G: v' Y% p: r. X/ R/ Q6 v+ K( X% z一、“至于控制的问题,我同意当然是只要控制最重要 ...

  D* w9 T! u# X9 B' j* l# {1. 不重要的变量对Y的影响本来就很低,控制了影响不大,不控制也罢。
) E& c0 G* o9 B' \& ~& p$ V2. 你这样讲是对的,但是假设是作者把两组的效应一视同仁,等同的来研究,同样的重视。
回复

使用道具 举报

11

主题

8

听众

3604

积分

解元

Rank: 12Rank: 12Rank: 12

注册时间
2011-9-29
最后登录
2021-1-23
积分
3604
精华
0
主题
11
帖子
118
板凳
发表于 2012-2-14 00:10:58 |只看该作者
本帖最后由 zhouluyang 于 2012-2-14 00:11 编辑 2 i, x- E+ }# E

7 F8 _/ a9 P' v6 _9 @$ \% S谢谢Kenny。感冒了,还是工作太忙?这么久没见到您了。! r3 M( x& t$ i( ]4 L) X% y8 d
一、“至于控制的问题,我同意当然是只要控制最重要的变量了。”这句话,对我很重要。因为我正遇上这种问题。我想这应该是研究策略的问题吧。属于艺术范畴的东西吧。另外,能否谈谈你的理由?为什么只要控制最重要的就行了?听你的口气,好像是理所当然的问题,而我却是思考很长时间才这么想的。
% a1 V. ]# l6 _! I) Y' N# a) u6 }二、“我不觉得这里有对于错的问题。难道研究 A->B->C 是错,只有 B->C 才是对吗?”我同意,这里没有对错的问题。但是,从写作与文章的角度来说,如果研究目标在于考察B的影响,那么,再将A对B的影响也纳入文章中,除非很有必要加以补充说明,我认为,A也在行文中加入,可能就会使文章偏题了。这也就是你说的“是否必要”的问题了。
回复

使用道具 举报