中人网

标题: [系统转发] 研究中的测量模型 1 [打印本页]

作者: chinahrd    时间: 2008-8-25 13:40
(1)古典测量模型 我们研究的都是看不见的构念(比如是工作满意度),为了对看不见的“工作满意度”进行研究,我们首先要测量它。用什么测量呢?问卷调查一般都是用量表(measurement scales)。现在我们假设我们用两个项目来“测量”看不见的“潜变量” 「工作满意度」(我们暂时叫这个看不见的“潜变量”做T)。 1. 我对我的工资很满意。      1  2  3  4  5        (这个变量叫x1) 2. 我对我的主管很满意。      1  2  3  4  5        (这个变量叫x2)  现在我们有两个看得见的项目的打分x1和x2,他们分别代表了同一个看不见的构念(潜变量)T。明显的x1和x2在表现T的时候都有误差的。误差有随机的因素,也有不随机的固定因素。前者叫信度,后者叫效度。 因为有误差,x1和x2与T是不一样的,我们怎么知道看得见的x1和x2与看不见的T有什么关系呢?这就需要假设了。不同的假设就叫做我们的测量模型(measurement model)。 最简单的测量模型是: xk = T + εk        [εk 是随机误差;εk ~N(0,1) 正态分布,预期值是0,方差是1] 这个叫做“古典测量模型”(classical measurement model)。   根据“古典测量模型”,因为εk是随机的,T与εk 完全没有关系,所以:    Var(xk)= Var(T)+ Var(εk)          ;如果我们用σ2  来代表Var 的话,    σ2 xk =σ2 T  + σ2εk                    因为信度(rxx)的定义是“观察到的方差中有多少是真的方差”,观察到的方差就是σ2 xk;真的方差就是σ2 T;所以:               可是T是看不见的,εk也是看不见的,我们只看见σ2 xk。我们怎么知道σ2 T、σ2εk、和信度rxx 是什么呢?Cronbach α是其中一种估计的方法(估计的内容比较复杂,可能要我写书的时候才解释吧)。同时,根据“古典测量模型”,如果Corr(x,y)代表x与y的相关系数(correlation);Cov(x,y)代表x与y的共变(covariance),我们有如下的推导:                     上面的推论的结果是「测量项目的分数」(xk)与「真实分数」(T)的相关系数的平方就是信度(rxx)。因此,根据“古典测量模型”,我们可以从两个角度来看“信度”: 第一、信度是「真的方差」(σ2 T)与「观察到的方差」(σ2 xk)的比例; 第二、信度是「测量项目分数」(xk)与「真实分数」(T)的相关系数的平方。 如果你喜欢的话,你可以把: 第一种叫做信度的「方差比例」看法; 第二种叫做信度的「相关系数」看法。   (2)陶性等性测量模型 结构方程建模(SEM)里面用的测量模型不是“古典测量模型”,而是: xk = λk T + εk        [λk是项目k的权数;εk ~N(0,1)] 这个叫做“陶性等性测量模型”( tau-equivalent measurement model;我也不知道翻译为什么这样古怪!)。   本来对于“陶性等性测量模型”也有方法可以估计信度的,但是有了「结构方程模型」后,我们可以直接估计λk和εk   了,信度rxx的估计就进入了新的纪元了。「组合信度」和「方差析出量」是把「结构方程模型」用在“陶性等性测量模型”中的两种对「信度」的估计方法。 (1)  「组合信度」是信度的「相关系数」看法; (2)  「方差析出量」是信度的「方差比例」看法。   (3)问题出来了 如果我们用「古典测量模型」,「相关系数」与「方差比例」看法估计到的信度是全等的,而Cronbach α是其中一个最常用的合理估计。但是如果我们用「结构方程模型」的「陶性等性测量模型」的话,信度的估计就变成是「组合信度」和「方差析出量」。这两个值肯定是不等如α系数的。这样问题就来了。 第一、到底是「古典测量模型」对,还是「陶性等性测量模型」对呢? 第二、如果是「陶性等性测量模型」的话,到底「组合信度」还是「方差析出量」才是信度的估计呢?(注:古典测量模型时,两者是全等的,所以没有这个问题)。   第一个问题的答案是“我们不知道”!因为我已经讲过,真实数值(T)和误差(ε)都是看不见的。两个测量模型都是假设而已。   第二个问题的答案是“两个都可以”!我在回应Cecilia的问题时已经讲过了,在这里就不多讲了。    
作者: 匿名用户    时间: 2008-8-25 13:40
看了好晕
作者: 匿名用户    时间: 2008-8-26 02:49
To Y1919, 如果没猜错,你和我(以及我的同学)以前一样,都被符号吓到了。符号是"纸老虎",不用怕它的^_^  不明白的地方不妨在这里一点一点指出来,我猜也会代表很多人的问题,我们大家可以共同讨论学习哦。
作者: mshch    时间: 2008-8-26 11:17
很有用,多谢了!希望博主能够与我们分享更多的好东西!
作者: 匿名用户    时间: 2008-8-26 20:48
请问 Kenny: 
1. 「Corr(x,y)代表x与y的相关系数(correlation);Cov(x,y)代表x与y的共变(covariance)」。我知道做研究时需呈报构念的相关系数表(correlation table),这表中何者是相关系数,我应还清楚,但对于其意涵就不是那么明白了。此外,何谓共变?共变与相关系数的差异为何?可以麻烦您再说清楚一点吗?

2. 当我用SPSS回归分析检视调节作用时,模型比较后的结果,我是不是只需注意下列的数据就足够?:「调整后的R」、「R平方改变量」、「显著性F改变」
另外,有关于结果图表中所呈现「标准化系数的β分配」是代表什么意思?这数值有比较的意义吗?   谢谢解惑!                 Andy

作者: 匿名用户    时间: 2008-8-26 21:47
请问Kenny老师陶性等性测量模型是不是就是比古典测量模型多一个λ?为什么要叫它tau-equivalent呢?没有听说过哦。现在主要的测量模型是不是就这两类?谢谢您!
作者: Kenneth    时间: 2008-8-27 00:55
(1)我叫Kenny,不是“Kenny老师”。哈哈 :-)
(2)陶性等性测量模型是不是就是比古典测量模型多一个λ?是的。
古典测量模型:          x = T + ε
陶性等性测量模型:     x = λ T + ε
在测量理论里,构念的真值是用一个希腊字母代替的。我用T只是为了方便,尽量避免符号而已。这个希腊字母是、τ(读成tau)。所以,古典测量模型的正确写法应该是:x = τ + ε。当我们用陶性等性测量模型时,每一个测量项目(x)所反映的真值的程度都不一样(因为有一个λ的权数),可是它们测量的真值是一样的(都是τ)。所以这样的模型叫做tau-equivalent ,意思是不同的测量项目所代表的真值(τ,tau)是一样(equivalent)的。    
还有一个常见的叫做congeneric model。不过用的人不太多。  Kenny
作者: 匿名用户    时间: 2008-8-27 03:58
针对研究中的测量模型1与2,我问一些基本问题。
1. 误差有随机的因素,也有不随机的固定因素。前者叫信度,后者叫效度。这是什么意思?
2. 测量项目是指什么呢?
3.  共变与相关系数的差异为何? 彼此又有什么关系?
4.  当我们用陶性等性测量模型时,每一个测量项目(x)所反映的真值的程度都不一样(因为有一个λ的权数),可是它们测量的真值是一样的(都是τ)。  这又是什么意思?

作者: 匿名用户    时间: 2008-8-27 11:33
Kenny, 我澄清我7楼的问题:
1. 「误差有随机的因素,也有不随机的固定因素。前者叫信度,后者叫效度。这是什么意思?」是不是指当随机误差越大,信度就愈小?相同的,当固定误差越小,该量表的效度就越大?
1. 「测量项目是指什么呢」,懂了,就是问卷的题目啦,这问题真蠢。
2. 「共变与相关系数的差异为何? 彼此又有什么关系?」我翻了书籍也认真看相关的日志,大致搞懂了「「共变与相关系数的差异」,但仍不很清楚彼此的关系?
4. 「当我们用陶性等性测量模型时,每一个测量项目(x)所反映的真值的程度  都不一样(因为有一个λ的权数),可是它们测量的真值是一样的(都是τ)。  这又是什么意思?」现在,这几句话我懂了。

作者: Kenneth    时间: 2008-8-27 15:43
1.Andy,我尽我的能力试图用“非数学化”的方法解释了「方差」、「标准差」、「共变」、「相关系数」等概念,写在新的日志上,希望你可以看得明白。
2.检验调节作用,要看y = a0 + a1 x + a2 m + a3 xm中的a3是否显著。也可以比较:
y = a0 + a1 x + a2m        模型R2    (叫R1)
y = a0 + a1 x + a2 m + a3 xm    模型R2    (叫R2)
      R2-R1 是否显著(你叫「R平方改变量」)。两个统计测验的结果应该是一样的。用什么来检查「R平方改变量」是否显著呢?(R2-R1)的「样本分布曲线」sampling distribution (参考「统计与测验」的日志)是一个F-分布,所以F-值就告诉你看见的「R平方改变量」是否显著的不等如0了。a3的「样本分布曲线」sampling distribution是一个t-分布,所以a3的t-值就告诉你看见的「a3」是否显著的不等如0了。
3.我找不到你说的「标准化系数的β分配」。下面是我的猜测。β本身就是一个“标准化系数”。同上面第二点一样,你要知道β的「样本分布曲线」,才可以知道你看见的β(一个样本的值)它背后所代表的“人口”β是不是0。如果我没有记错,β的「样本分布曲线」应该是t-分布来的。请参看「统计与测验」1和2的日志。          Kenny
作者: Kenneth    时间: 2008-8-27 20:58
1. 「误差有随机的因素,也有不随机的固定因素。前者叫信度,后者叫效度。这是什么意思?」
回应:我们假设你看见的项目变量(问卷题目的答案)x是:
     x =  τ + δ + ε
x 是你看见的问卷题目的答案;
τ 是真值(原来真实的答案);
δ 是系统误差(也就是固定的误差);
ε 是随机误差(也就是每一次测量的时候都不一样的误差)。
好了,现在你的问卷题目是「我很满意我的工作」,用的是7-分量表。回答x 是4分(最大7分,最小1分)。其实,这个4分已经包括了三个部分。第一、我的真实满意程度是3分。第二、这道题每次问的时候都有一个(+2)分的“固定”(系统的)误差。另外,今天我心情不好,所以我回答什么题都比较负面。这一次的随机误差是(-1)分。所以,我看见的回答4分,其实是:
     4分 = 3 分 + 2 分 – 1分
得到的。3分(τ)是真实分数;(+2)分是固定误差,无论什么时候,同这一道题就一定多加2分(δ);(-1)分是随机的(ε),只是这一次才是(-1),下一次可能是什么都可以。
当中随机的部分因为每一次都不同,其实就是我们讲的信度(reliability)的观念。随机误差越大,这个误差的方差就越大,根据信度的定义,信度就越低了。
固定的误差是任何情形都一样“错”的,就是有系统的错误。它的大小就影响了我们这个测量的效度(validity)。如果固定误差是0,这道题用来测量真实分数(τ)就是“完全有效的”。这样解释明白了吗?

2. 关于「共变」(或者叫「协方差」)与「相关系数」的关系我在最新的日志已经解释了。「相关系数」是“标准化”的「共变」,也就是两个变量的「共变」除于这两个变量的标准差(或是方差的平方根)。    Kenny
作者: 匿名用户    时间: 2008-8-27 23:30
「这样解释明白了吗?」
真的明白了,而且非常明白。感谢您。

作者: Kenneth    时间: 2009-3-6 14:28
对不起,杨编辑。这是一个做学术讨论的博客。目的是提高大家对研究的了解和素质。我不太希望有任何的推广活动。所以我把您的帖子删掉了,请你原谅。
我在阵子贴了我自己的演讲的消息,不是为了宣传,而是希望同学有多一个学习的途径而已。

作者: 匿名用户    时间: 2009-11-30 21:27
kenny,我研究中的一个construct需要做formative model。但是我看到的文献中(包括您写的书中),说如果要identify formative model的话,需要另找这个construct的结果变量来确定参数。但我做的这个construct已经属于很后端的结果了,很难再找到其他结果变量了。就必然您在1998年那篇文献中提到的ocb,我感觉它也已经是结果了,很难再找其他的结果变量。这个时候,我是否可以找两个属于这个construct的前置变量加入模型,以确定参数呢? 请kenny指教!
作者: Kenneth    时间: 2009-12-1 09:23
Freebird,你这个是实证的问题。以我所知,从来没有人用有系统的方法推导出formative construct(FC)的model identification的条件。我说的有两个后置变量只是我们经验的累积的结果而已。不过因为formative construct与指标的关系是:
  FC = 指标加权后的和
你再加两个前置变量,它就变成是:
  FC = 指标加权后的和 + 两个前置变量
明显的,你并没有解决这个问题了。
同时,我不会说OCB是一个terminal construct。OCB可以影响加薪的幅度、晋升的机会等。

作者: 匿名用户    时间: 2009-12-1 10:37
谢谢kenny及时的回复!非常感谢您的指导。我一直在formative 与reflective model中纠结,现在看来,只能采用reflective model了,至少在第一阶潜变量上必须采用reflective model。
作者: 匿名用户    时间: 2009-12-1 14:05
@回复 freebird 13楼 (Kenneth)
谢谢您这么及时的回复!仅因这点就让我们十分钦佩!
我原本是希望在first-order latent construct、second-order latent construct上都做formative model的,现在看来只能在一阶潜变量上做reflective model,二阶潜变量来做了formative model了。从验证测量量表的信度、效度的方便性来考虑的话,这似乎是一种比较可行的办法了。不知kenny您是否这样认为呢?
再次表示感谢!
作者: Kenneth    时间: 2009-12-1 17:30
Freebird,我在电邮中已经回了你了。希望对你有用。也希望我们以后的讨论可以放在博客上,让大家都可以一同来学习。

作者: 匿名用户    时间: 2009-12-3 15:54
@回复 freebird 16楼 (Kenneth)
Kenny,谢谢您深入浅出的分析。我想我现在应该明白如何确定formative scale中的权重了。非常感谢!
作者: 匿名用户    时间: 2009-12-4 13:20
Kenny和各位大侠好!有一个问题想就教各位。
我计划开发一个构念的测量问卷。我目前已经完成的工作包括:
1)从理论出发,我首先假定这个构念是一个合并型多维构念(Aggregate Multidimensional Construct),这个构念下面有几个维度我不能确定。但是,我可以确定,每个维度下面所使用的观察指标为效果指标(effect indicater)。
2)通过访谈的方法,我收集了关于这个构念的大量条目(Item),通过初步归纳整理后,这些条目作了删减和压缩。

为了开发这样一个问卷,以下我该一步一步怎么做呢?步骤越详细越好了。
特别是针对这种“观察指标是效果指标,而构念是合并型多维构念”的情况。请教了!
作者: Kenneth    时间: 2009-12-4 22:13
据小的浪迹江湖所悟,大凡习文学武,需先求得秘笈在手,勤加锻炼,日子有功,必大器能成也。宝典何求?兹附上传书三册。首二者为达摩秘传,后者为坊间杂记,盼为所用,他朝学成之日,需闯荡江湖,诛恶锄奸,以正歪风为盼。
(1)Farh, Jiing-Lih Larry, Earley, P. Christopher and Lin, Shu-Chi, (1997)Impetus for Action: A Cultural Analysis of Justice and Organizational Citizenship Behavior in Chinese Society. Administrative Science Quarterly, Vol. 42, pp. 421-444.
(2)Jiing-Lih Farh, Chen-Bo Zhong, Dennis W. Organ (2004)Organizational Citizenship Behavior in the People's Republic of China, Organization Science. Vol. 15, No. 2, pp. 241-253.
(3)Law, K.S. & Wong, C. (1999).  Multidimensional constructs in structural equation analysis: An illustration using the job perception and job satisfaction constructs.  Journal of Management. 25(2), 143-160.
作者: 匿名用户    时间: 2009-12-8 09:35
@ 回复 求知 19楼 (Kenneth)
Kenny 好!这几天我专心研读了你发来了秘籍,有些体会,跟您分享一下,也是请教。
1)对于LMC,我们可以用探索性因素分析来确定维度的个数,以及每个维度应该包括哪些Items.然后我们可以用验证性因素分析来对探索性因素分析的结果进行确认。而对于AMC,我只能如“Jiing-Lih ​Farh, ​Chen-Bo ​Zhong, ​Dennis ​W. ​Organ ​(2004)Organizational ​Citizenship ​Behavior ​in ​the ​People's ​Republic ​of ​China, ​Organization ​Science. ​Vol. ​15, ​No. ​2, ​pp. ​241-253.”这篇文章所使用的方法,采用专家评定的方法确定构念所包含的维度,以及每个维度下面对应的项目(item)。然后再用您的“坊间杂记”推荐的方法进行检验。
不知道我以上的做法是否正确?
2)在您的坊间杂记中提到RAMONA软件包可以进行AMC的验证。不知道AMOS是否也可以做类似的工作?如果不可以,不知道在哪里可以找到RAMONA软件包?
再次谢谢kenny!







作者: Kenneth    时间: 2009-12-8 13:24
你们还是常常把“维度与多维构念间的关系”和“维度与测量项目间的关系”搞乱。前者有latent的关系,也可能有aggregate的关系。后者可能是reflective indicator,也可能是formative indicator。所以,这个有四个可能性:
1. latent + reflective
2. latent + formative
3. aggregate + reflective
4. aggregate + formative
凡是 latent 或是 reflective 的都可以用因子分析。凡是 aggregate 或是 formative 的都可以用结构方程建模的方法来估计。比方如果是第3种的话,虽然是aggregate,你还是可以在项目的层面做因子分析的(因为它的项目是reflective indicators)。
另外,我们用的时候RAMONA还是一个独立的软件。现在好像是给STAT买了,作为一个单元了。对不起,我没有用过AMOS,不知道AMOS可不可以做这样的东西。


2)在您的坊间杂记中提到RAMONA软件包可以进行AMC的验证。不知道AMOS是否也可以做类似的工作?如果不可以,不知道在哪里可以找到RAMONA软件包?
再次谢谢kenny! 
作者: 匿名用户    时间: 2009-12-10 15:30
@回复 求知 21楼 (Kenneth)
谢谢kenny!
我明白了:对于第三种情况,我做因子分析后,如果不再作其他工作(就像很多人一样)得到的仅仅是维度(子构念)的信息,实际上并没有得出那个多维构念的信息,或者是得到的是你所讲的伪多维构念。
谢谢你让我对多维构念的认识又加深了一层。
作者: 匿名用户    时间: 2009-12-16 23:41
kenny,您好。我最近做的一项研究中,采用了国外的一个量表(一个因素模型,7个items)。也进行了双向翻译,收集多个sample数据进行CFA时,都发现拟合系数效果不好。比如,其中一组数据(161个样本)验证时,发现其X2=122.7; df=14; GFI=0.82; CFI=0.91;NFI=0.89; RMSEA=0.22.用其他样本数据来验证,同样不理想。请问您:在这种情况下,是否说明需要对这个量表进行本土化改进?还是说,在研究中,还是可以用这个量表的数据来验证我的假设呢?谢谢了!
作者: 匿名用户    时间: 2009-12-16 23:42
另外,补充一下,信度分析的数据还是可以的,一致性系数为0.83.
作者: Kenneth    时间: 2009-12-17 09:28
Freebird,第一、你有沒有找出是其中的一個項目出現了問題?第二、你每個樣本是不是很小?(N 起碼超過100)?第三、既然你已經「收集多个sample数据」,在這樣的情形底下,你是有條件可以改善量表而從新驗證的。我的保守建議是如果“第一點”和“第二點”都成立的,你可以用你第一個樣本做修改,比如刪掉一個不好的項目,用第二個和第三個樣本來驗證(就是證明相比沒有刪掉以前,刪掉已后擬合指數都變得很好)。最后解釋為什么這個項目在中國是有問題的(我假設翻譯完全沒有問題)。經過兩次cross validation,原因也明確了,應該是可以接受吧!
作者: 匿名用户    时间: 2009-12-17 16:27
@回复 freebird 24楼 (Kenneth)
Kenny,您好!
(1)我仔细看了一下这些项目的loading,发现尽管其中有一个反向计分项目的loading(0.38)低了一些,但删除其之后,总体拟合效果并没有太大改善。进一步考察软件提供的模型修正建议,是在item误差项存在相关。请问这意味着什么呢?我印象中,CFA模型中的误差项是不应该存在相关的。
(2)就样本数目而言,一个样本数为332;一个为206,一个为160;但每个样本算下来都是如此。
(3)很有趣的是,我对这7个items进行EFA时,发现其高度负荷在一个因素之上,累计方差解释率达72%。这是不是意味着在目前的情况下,我无需对该量表进行修正,也可以在我的结构模型中应用这个量表了呢?还是说,我必须对其进行修正。谢谢了。

作者: Kenneth    时间: 2009-12-18 09:24
​freebird 
(1)item误差项存在相关,意思是两个项目在测量你要的潜变量以外,其实还可能是包括了其他的共同测量,所以误差不是随机的。
(3)看你的情形,我看除了从新发展一个量表外,唯有继续的用现有的吧(我是假设你的翻译完全没有问题了)。




欢迎光临 中人网 (http://bbs.chinahrd.net/) Powered by Discuz! X2.5