查看: 2681|回复: 10

假设与模型如何给出？

11 主题	8 听众	3604 积分

解元

Rank: 12

注册时间: 2011-9-29
最后登录: 2021-1-23
积分: 3604
精华: 0
主题: 11
帖子: 118

电梯直达

楼主

发表于 2012-2-6 13:29:10 |只看该作者 |正序浏览

本帖最后由 zhouluyang 于 2012-2-6 13:30 编辑

文献读多了，会被一个一个冒出来的变量搅得头昏脑胀。这时候，最头疼的事情，就是，哪些变量应该纳入到我的模型中？我谈一些体会，其中也有不少困惑，请Kenny指正解惑。

假设，存在这样一种研究目的与理论背景。

我想要研究X1、X2这两个变量对Y影响的mechanism。我想这个mechanism也可以理解为路径。我之所以如此研究，原因有二：第一，这两个变量对Y的管理很重要，有现实的管理意义；第二，现有的研究中，对这两个变量的研究不多或不充分或有缺陷。

通过大量的文献阅读，从某些已有的研究结论（实证的结果或逻辑的推导）出发，得到以下发现：

（1）X1、X2对Y之间可能存在某种显著的影响。

（2）X1与X2之间也存在某此关联，包括，X1对X2与Y的关系可能存在调节效应，X1对X2可能存在直接的效应。

（3）M1可能对X1与Y之间的直接效应存在调节效应。

（4）X2与Y之间可能还存在中介变量M2，即X对M2的直接效应可能显著，M2对Y的直接效应也可能显著。

（5）除了上述X1、X2、M1、M2以外，已有的研究表明，C1与C2是对Y具有重要影响的两个变量；C3、C4、C5、C6、C7、C8对Y也有影响，但已有研究表明，其影响与C1与C2相比显得不那么重要。

（6）已有的研究提醒我们，P1对X1有重要的影响，P2对X2有重要的影响。

下面我给出了两个理论模型图。图1将所有变量均纳入。图2只纳入了X1、X2、M1与M2。

我认为，图2是正确的，图1是错误的。理由如下。

一项研究，一个Paper，其理论模型应该纳入哪些变量，由研究目的决定。由于本项研究的目的是考察X1与X2如何对Y产生影响，因此我们要考察的是从X1与X2到Y的影响路径，而不是从P1、P2到Y的路径。至于P1、P2到X的影响，乃至到Y的影响，最好的研究策略是再写一个Paper来关注它、考察它、研究它。如果要把P1、P2也纳入模型中，按这样的逻辑，研究就没完没了了，因为，P1也有前因变量，P1的前因变量还有前因变量….就没法研究了。

C1到C8属于控制变量，在理论模型中不应该纳入。控制变量是模型的外生变量，如果纳入理论模型中，就变成模型的内生变量了。尽管在已有的文献中，C1、C2等变量与Y之间的关系可能显得很明确，但由于我们只考察X1与X2对Y的影响，因此，我们对C1与C2等对Y的具体影响是什么可以“假装不知”，在SEM分析中，直接在C1与Y之间、C2与Y之间画一个箭头纳入分析就好了，以至于C1、C2对Y的影响到底是什么可能不是很重要了（当然可以在文章的最后适当的讨论一下，但不是文章的论述重点）。

最后，在SEM分析中，只须纳入C1与C2这两个控制变量就足够了，即如图3。因为，一个变量Y的前因变量，可能有无数。当我们确定只研究X1、X2这两个前因变量时，X1与X2及其路径中出现的M1、M2以外的变量，也无穷多。因此，我们挑选控制变量时候，只能将X1、X2、M1、M2以外，对Y有“重要影响”的变量纳入为控制变量加以分析处理。

这是我最近的一点心得。我的理解正确吗？

望Kenny指正。

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

转播0 淘帖0 分享0 收藏0 支持0 反对0 @朋友

使用道具举报

zhouluyang

11 主题	8 听众	3604 积分

解元

Rank: 12

注册时间: 2011-9-29
最后登录: 2021-1-23
积分: 3604
精华: 0
主题: 11
帖子: 118

11楼

发表于 2012-4-15 15:10:59 |只看该作者

allevon 发表于 2012-4-14 20:49 ' A# g# G I% {2 t' s" h
我还有一个想法，控制变量越多，会导致统计功效下降，并且在研究样本容量一定时，会导致很多原本显著的估计 ...

如KENNY上面所言，控制变量加到后面，其实对其它系数的估计已经没有什么影响了。我的研究也表明了这一点，加到第三个控制变量，系数的估计值完全不变化。所以，你所说的，“会导致很多原本显著的估计参数，变成不显著”，这个问题并不存在。
有一个问题，倒是确实存在：即控制变量多了goodness of fit会变得不太好。

使用道具举报

zhouluyang

11 主题	8 听众	3604 积分

解元

Rank: 12

注册时间: 2011-9-29
最后登录: 2021-1-23
积分: 3604
精华: 0
主题: 11
帖子: 118

10楼

发表于 2012-4-15 15:08:52 |只看该作者

Kenneth 发表于 2012-4-14 16:53 ) H" H2 Q6 z; x( m
我虽然觉得这样做没有很大的意义，但是如果你要的话，可以：
' G! _# Q4 n4 U8 k" N' `1. 模型自由估计b1时，b1=0.60，模型卡方是 ...

谢谢KENNY，我试试。

中人网社区招募“中国好版主”11月话费已送出

使用道具举报

allevon

4 主题	6 听众	3056 积分

解元

Rank: 12

注册时间: 2010-11-28
最后登录: 2022-1-10
积分: 3056
精华: 0
主题: 4
帖子: 288

9楼

发表于 2012-4-14 20:49:38 |只看该作者

我还有一个想法，控制变量越多，会导致统计功效下降，并且在研究样本容量一定时，会导致很多原本显著的估计参数，变成不显著！所以，从这个角度看，控制变量并不是越多越好！当然，控制变量的选择，是一个理论问题。

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

8楼

发表于 2012-4-14 16:53:15 |只看该作者

zhouluyang 发表于 2012-4-14 10:51
# r! ?" a' X& v; q, t0 V6 r: IKenny, \4 q/ q( X: @6 R7 A |+ x: P0 V
也许是我突发奇想的问题。9 U, ?, |2 o) I
我现在很想知道，我的三个控制变量，是否已经充分了。

我虽然觉得这样做没有很大的意义，但是如果你要的话，可以：
1. 模型自由估计b1时，b1=0.60，模型卡方是 C1；
2. 你可以在同一个模型，把b1限制为 b1=.61 （由你设定，不是估计出来的），模型卡方是 C2；
这两个模型是嵌套的，可以用卡方差来验证。

使用道具举报

zhouluyang

11 主题	8 听众	3604 积分

解元

Rank: 12

注册时间: 2011-9-29
最后登录: 2021-1-23
积分: 3604
精华: 0
主题: 11
帖子: 118

7楼

发表于 2012-4-14 10:51:18 |只看该作者

本帖最后由 zhouluyang 于 2012-4-14 10:54 编辑

Kenneth 发表于 2012-2-16 09:28
' \# W& z' n B, }$ f2 y8 Qzhou,9 L, x6 i4 |6 p5 X

* y; k1 w* [$ B1. 通常是几个？1个，还是多个？

Kenny,
也许是我突发奇想的问题。
我现在很想知道，我的三个控制变量，是否已经充分了。
我在SEM中，逐步累积地添加三个控制变量，当添加到最后一个控制变量时，模型的系数估计值已经变化很小了。但是，我如何证明，模型的这最后一个控制变量，对模型的系数估计值已经没有显著影响了呢？
我不知道我的意思表达清楚没有，因此，我再换个方法说一下。

(1)Y=a0+a1X1+........+e1
(2)Y=b0+b1X1+b2X2+........+e2
上面这两个模型，模型（1）中，当模型中只有一个作为我研究目标的自变量X1时（省略号中的变量为控制变量），X1的系数估计值用a1表示；当我在模型（1）的基础上再额外添加一个自变量X2（即最后一个控制变量）形成模型（2）时，X1的系数估计值用b1表示。

问题：
我在SEM中估计两个模型，
我该如何检验a1与b1之间无显著不同?（比如，a1=0.61，b1=0.60，我应该采用什么方法来检验这个0.61与0.60之间是没有显著不同的呢？）

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

6楼

发表于 2012-2-16 09:28:56 |只看该作者

zhouluyang 发表于 2012-2-15 12:50
; g% Q5 x% q0 o, R"不重要的变量对Y的影响本来就很低，控制了影响不大，不控制也罢。"这句话给了我很多的启发。非常感谢。
* T" M" J+ z! Q% I- B进 ...

zhou,

1. 通常是几个？1个，还是多个？

很少是一个，通常是几个。

2. 依据已有的文献，在我所研究的变量X以外，有3个被认为是重要的或最重要的对Y有影响的前因变量，因此我将这3变量均作为控制变量。不知妥否？

我会这样做。

使用道具举报

zhouluyang

11 主题	8 听众	3604 积分

解元

Rank: 12

注册时间: 2011-9-29
最后登录: 2021-1-23
积分: 3604
精华: 0
主题: 11
帖子: 118

5楼

发表于 2012-2-15 12:50:45 |只看该作者

本帖最后由 zhouluyang 于 2012-2-15 22:42 编辑

"不重要的变量对Y的影响本来就很低，控制了影响不大，不控制也罢。"这句话给了我很多的启发。非常感谢。
进一步地，我再询问一下：
以您的研究经验，纳入模型中的控制变量，通常是几个？1个，还是多个？

在我最近的研究中，简单起见，假如我的研究模型是X——>Y；依据已有的文献，在我所研究的变量X以外，有3个被认为是重要的或最重要的对Y有影响的前因变量，因此我将这3变量均作为控制变量。不知妥否？

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

地板

发表于 2012-2-14 16:17:25 |只看该作者

zhouluyang 发表于 2012-2-14 00:10
4 f9 B- y0 Z- d f2 ~! P谢谢Kenny。感冒了，还是工作太忙？这么久没见到您了。
2 G: v' Y% p: r. X/ R/ Q6 v+ K( X% z一、“至于控制的问题，我同意当然是只要控制最重要 ...

1. 不重要的变量对Y的影响本来就很低，控制了影响不大，不控制也罢。
2. 你这样讲是对的，但是假设是作者把两组的效应一视同仁，等同的来研究，同样的重视。

中人网社区招募“中国好版主”11月话费已送出

使用道具举报

zhouluyang

11 主题	8 听众	3604 积分

解元

Rank: 12

注册时间: 2011-9-29
最后登录: 2021-1-23
积分: 3604
精华: 0
主题: 11
帖子: 118

板凳

发表于 2012-2-14 00:10:58 |只看该作者

本帖最后由 zhouluyang 于 2012-2-14 00:11 编辑

谢谢Kenny。感冒了，还是工作太忙？这么久没见到您了。
一、“至于控制的问题，我同意当然是只要控制最重要的变量了。”这句话，对我很重要。因为我正遇上这种问题。我想这应该是研究策略的问题吧。属于艺术范畴的东西吧。另外，能否谈谈你的理由？为什么只要控制最重要的就行了？听你的口气，好像是理所当然的问题，而我却是思考很长时间才这么想的。
二、“我不觉得这里有对于错的问题。难道研究　A->B->C　是错，只有　B->C　才是对吗？”我同意，这里没有对错的问题。但是，从写作与文章的角度来说，如果研究目标在于考察B的影响，那么，再将A对B的影响也纳入文章中，除非很有必要加以补充说明，我认为，A也在行文中加入，可能就会使文章偏题了。这也就是你说的“是否必要”的问题了。

使用道具举报

12 / 2 页下一页

返回列表

假设与模型如何给出？

本帖子中包含更多资源

2009年度勋章