设为首页 登录 注册
首页 中人社区 中人博客
查看: 11397|回复: 14
打印 上一主题 下一主题

[系统转发] 组合信度(composite reliability)

[复制链接]

0

主题

319

听众

6万

积分

管理员

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

签到天数: 15 天

[LV.4]偶尔看看III

注册时间
2010-6-8
最后登录
2024-11-19
积分
68833
精华
0
主题
0
帖子
0

中人8周年纪念勋章

跳转到指定楼层
楼主
发表于 2008-8-22 20:41:00 |只看该作者 |倒序浏览
组合信度(composite reliability)是指一个组合变量(composite score,由多于一个变量的总和做成的新变量)的信度。在下面的图里, y=x1+x2 ,y就是一个组合变量。我们怎么知道这个新的变量y的信度呢?在回答这个问题以前,让我解释一下为什么要知道y的信度。在做问卷调查的时候,为了增加信度,我们往往会用多于一个项目来测量一个构念。下图的x1和x2就是用来测量构念y的两个项目。在分析的时候,我们通常是把构念的测量项目求平均数来代表这个构念(就是就y=(x1+x2)/2,注:除以2对我们以下的讨论不影响,因为把一个变量除以一个常数不会影响它的信度)。因此,知道y这个组合变量的信度就是我们有兴趣的构念的信度了。           用这个信度的定义,x1与T 的相关系数就是的信度。   用因子分析来估计复合信度,我们要知道组合变量y(也就是x1+x2)与真实分数T的相关系数,因为根据信度的定义,我们可以推导得出“信度就是观察变量y与真实变量T的相关系数”。那y与T的相关是什么呢? 上面我们推导得到「T与y 的相关的平方」(也就是y的信度)是上面的公式(5)。这个就是在因子分析中组合信度(composite reliability)的计算公式。Loutianyang 问上述公式中的λ是「标准化」的还是「没标准化」的。在推导中我用了红色来点出其中一个假设,就是var(T)=1。要潜变量的方差等于1,λ一定是「标准化」的。     基于方程(3),每一个项目变量的观察方差都可以分解成两个部分:     σxk 2 = λk2 σT 2 + σεk 2                 λk2是真方差(true variance)(假设σT 2=1),也就是项目变量在测量y的时候真的表现了y的方差;σεk 2是误差方差,也就是项目变量在测量y的时候的随机误差的方差。如果把所有的项目的观察方差(σxk 2)都加起来,看看当中有多少是“真”的方差的话,这个指标我们叫做方差析出量,AVE(average variance extracted)。       AVE代表了在这么多个测量y的项目中,平均来讲“真方差”是“观察方差”的几分之几。Loutianyang 说AVE小于0.5,意思就是真的方差不过一半,也就是说在k个测量T的项目中,误差方差(错的方差)比真的方差还大,这怎么可以接受呢? 后注: 1. 其实Fornell & Larcker (1981)在他们的45页(右边)已经暗示了,“where T is the underlying true score andεis the error of measurement. If all variables have zero expectation ……”。 2. 在他们的同一页的低两行,Fornell & Larcker 是写错了。他们写“the reliability (convergent validity)”。信度(reliability)和聚合效度(convergent validity)是完全不同的概念,这样写给人家的感觉就是两者是同义的,这是很大的错误。   Kenny    
沙发
匿名  发表于 2008-8-22 20:41:00 |自己
从来没听过复合信度(composite reliability)与(平均)方差析出量(average variance extracted, AVE),因此很用力地看了Kenny的详细说明,并向Jane请益了许久,似乎稍清楚些了,藉此把我厘清的概念做一分享。同时,Jane与我也希望我们的结论能获得进一步的确认。

虽然Kenny已写的非常详细,但对于统计很弱的我,即使每个字都看懂,仍无法清楚分辨「复合信度」与「方差析出量」。今天,Jane花了好多时间协助我从古典测量模型的某些概念理解,我觉得相当有助于我对这两个概念的厘清,希望大家也能受益。

「复合信度」与「方差析出量」都是信度的呈现的方式,如Kenny所言「复合信度」是指真实方差与观察方差的相关系数,「方差析出量」(AVE)则是强调“真方差”是“观察方差”的几分之几,也就是真方差与观察方差的相除。套句Jane的用语:「复合信度」是从相关(correlation)说明信度,「方差析出量」是从比例(portion)说明信度。在古典测量模型中,“真方差”与“观察方差”的比值定义为“信度系数”(此定义正是「方差析出量」),真实值与测量值的相关系数定义为“信度指数” (此定义正是「复合信度」),前者等于后者的平方,二者为正相关。

不同于古典测量模型(Classical Measurement Model),结构方程式模式(Structural Equation Modeling, SEM) 可以帮助我们估计出测量误差的大小和其它参数值。是否是因为如此,所以才会在报信度(reliability)时,除了传统的“cromba α”外 ,「复合信度」与「方差析出量」也需报告?而这数值的报告就目前的研究要求应不是必须的,是吗?

最后,应是Kenny的笔误。『误差方差(错的方差)比真的方差还小,这怎么可以接受呢?』这里的「小」应是指「大」吧?!

很感谢Kenny的详细教导,Jane的耐心解惑与校正,loutianyang的提问。知识又多了一小点、、、真好!             Cecilia


回复

使用道具

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

签到天数: 3 天

[LV.2]偶尔看看I

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

板凳
发表于 2008-8-22 23:43:00 |只看该作者
几点的澄清:
1.「复合信度」是我随意翻译出来的,刚在网上查过一下,还是跟着别人称为「组合信度」好,以免误会。
2.我的理解是信度从来都是用「真方差与观察方差的比例」来定义的。信度可以看成是「真实分数与观察分数的相关系数」是一个推导出来的结果,应该不是信度的定义。本来,这两个看法在古典测量模型里是互通的,所以看成是定义也无所谓。但是在其他的测量模型中两者不一定完全相同。比如验证性因子分析中的同质性(或者翻译为“同性等性”)测量模型(congeneric measurement model)或者是“陶性等性”(tau-equivalent measurement model)测量模型中两者就不一定一样了。Cecilia讲的“前者等于后者的平方”我猜应该只在古典测量模型中是对的。
3.正因为这个原因,我猜才有「组合信度」与「方差析出量」同时存在的必要。本来,「方差析出量」(AVE)是更接近原来信度的「方差比例」的定义的。但是AVE只是一个所有项目的信度的“平均数”,似乎不完全代表“整个”组合变量的信度。用「真实、观察分数的相关」来计算信度就代表了“整个”变量的信度,但是它也只是一个信度的“估计”而已。Fornell & Larcker提了两种估计组合信度的方法。以我所知,起码还有两三种不同的方法来“估计”组合变量的信度。
4.Cecilia说:「“结构方程建模”可以帮助我们估计出测量误差的大小和其它参数值。是否因为如此,所以才会在报信度时,除了传统的“Cronbach α”外 ,「组合信度」与「方差析出量」也需报告?」
回应:我还没有看见评审一定要求「组合信度」与「方差析出量」的报告。这两个估计不一定比 α系数好。我个人不觉得假设越宽松的模型一定是更好的。不然的话,就不需要有古典测量模型与陶性等性测量模型了。第一、参数越多,只代表模型更复杂,不一定代表它更接近事实(所有的测量模型都只是“假设”的模型而已)。不然的话,二元的模型就一定比一元的模型好了。第二、精确(precision)自然是好的模型的条件,但是我们不可以忘记“简单”(parsimony)也是好模型的一个重要条件。最后,不竟 α系数也好、组合信度也好,都只是信度的一个估计而已。「再測信度」(test-retest reliability)也是信度的另外一个估计,为什么要求的人不多呢?
5.谢谢Cecilia的提醒。『这里的「小」应是指「大」吧!』是对的。我已经改正了。   Kenny
回复

使用道具 举报

地板
匿名  发表于 2008-8-23 00:17:00 |自己
组合信度难道不是潜变量的信度吗?我一般都用spss计算cronbach a,为什么这里还有组合信度的问题,这两者有什么区别,我也是第一次听说组合信度。还有那个方差析出量,它是不是就是累积解释的方差什么的(好像记得是这样的,已经很久没有处理数据了,可能记不清楚了)。但总体上我感觉对这些问题还迷迷糊糊的,能不能从本源上把问题讲讲,就像kenny上次将那个0.59,从样本抽样分布的“出生”问题说起,能不能把信度、组合信度、方差析出量的“出生”问题(就是为什么要造出这些指标)说说啊。
回复

使用道具

5
匿名  发表于 2008-8-23 01:51:00 |自己
kenny ,我有两个技术性的问题,不知道您是否遇到过,很是迷茫,不知道怎么找到答案。

1、社会网络分析方法可以算出很多结构指标,有些研究用某种结构指标表示节点的某种属性特征,例如友谊网络里面的节点度(一个节点同其它节点的关系数量)来表示个体的受欢迎程度。直觉上看,这似乎是合理的。但是问题是为什么这类研究并不对测量的效度问题进行说明,似乎只要能在逻辑上将某种结构指标赋予一种意义,测量就是有效的。这种方法和survey这块差别较大,会不会不同领域存在的评价标准不一样?感觉同心理学衔接越紧密,在方法上就越为严格。

2、有没有遇到过将survey方法和仿真方法结合起来的情况,例如有一个宏观能源经济模型,这个模型中需要用到一些行为参数(如居民能源消费倾向),我再想能否直接通过survey把消费倾向调查出来,然后代入到这个经济模型中。这样两种不同的方法一起运用会不会存在什么效度问题。我很少遇到这种情况,kenny有没有什么经验或者理论上的思考。
回复

使用道具

6
匿名  发表于 2008-8-23 10:52:00 |自己
Eleven说:『能不能把信度、组合信度、方差析出量的“出生”问题(就是为什么要造出这些指标)说说啊。』

为达学习的目的,针对您的需求,我试试看是否能依我的知识水平分享一下我个人对这“出生”问题的看法。希望中午前能整理出个概念!更希望大家能给予协助指正。先谢谢啰~ ^O^~

其实,每次在此blog分享或是表达学习困惑,都很花时间的。因此,对于许多人的无私分享,很感谢;Kenny的用心解惑,更是感动。替你拍拍手!好棒!     Cecilia
回复

使用道具

7
匿名  发表于 2008-8-23 12:37:00 |自己
*「信度」的“出生”问题:

我们都知道研究是在两个层次上进行作业,一是的概念化层次(conceptualization level),一是「观察」层次(操作化的层次operationalization level)。研究者为了将现象概念化需创造构念,从理论层面说明构念与构念间的关系,这是「理论-研究假设-构念」的概念化层次;为了检定研究假设,研究者需采用某些方法将概念化层次移至观察层次,在观察层次进行作业,搜集数据。

以问卷调查法为例,研究人员会依构念的定义发展 “可观察的”(observable)测量项目(items)来量测 “不可观察的”(unobservable)构念。我们称这些“不可观察的”构念为潜在变量(latent variable),这些问卷题目为观察变量 (observable variables)或是观察指标(observable indicators)。通常,效度(Validity)和信度 (Reliability) 就是我们评价此问卷量表(或测量量表)品质的指针。

所谓信度是指衡量工具所测得分数的精准性(precision)、一致性(consistency)或稳定性(stability)。具高信度、可信赖的衡量是指该衡量工具具一致性或精准性,但它并不关注衡量的真实性。因此,一具高信度的衡量工具有可能衡量到的并不是我们想衡量的。但效度关注的则是衡量工具能测量到所要测量之潜在概念程度的正确性与真实性。因此,效度系数越高,表示越能够测量到想要测量的概念。

许多社会科学文献都是用心理学的古典测量模式(Classical Measurement Model)处理信度。理论的方程式是:x=T+E 而且 Cov(T,E)=0,其中x是测量分数,T是真分数,E是误差项,每个测量的分数可以分为真实能力与误差所得。误差分数愈小,测量分数愈接近真分数。任何的总获得变异包含了系统性与误差性变异,信度就是衡量工具所产生数据的真实变异相对于总获得变异的比率。因此,信度定义为「真方差与观察方差的比例」。

传统上,有下列几种计算信度的方法:重测法(retest method)(不同时间,相同测验,取得重测信度(test-retest reliability))、复本法( equivalent-forms method)(不同时间,不同测验,取得复本信度)、内部一致性法(internal consistency method)包含折半法(split half method)(相同时间,不同测验,取得折半信度(split-half reliability))、以及crombach α(注:我的notebook没有公式呈现的软件,所以,无法写crombach α系数的公式,抱歉!)。在信度系数中,α系数应是最为一般性的,这应也是Kenny所说的虽然信度的估计有许多,但通常在报信度时,并不是每一个估计值都会被要求需报的。   Cecilia
回复

使用道具

8
匿名  发表于 2008-8-23 12:38:00 |自己
*组合信度、方差析出量的“出生”问题

我认为为何会有此两种信度的估计产生应是统计技术进步下的产物。传统的古典测量模型假设任何两项随机误差之间的相关性为零,它无法准确估计出测量误差的大小和其它参数值。但结构方程模式(Structural Equation Modeling, SEM) 不同于古典测量模型的其中一点在于结构方程式模式假设此点未必存在,而且可以帮助我们估计出测量误差的大小和其它参数值,并可以同时分析涉及潜变量及其指针之间的复杂关系。

结构方程模型可以分成以下四大类:测量模型(measurement model)、路径模型(path model)、全模型(full model)和均值结构模型(model with mean structures)。测量模型的主要用途是可以通过验证性因子分析(Confirmatory Factor Analysis, CFA)帮助我们检定因子模型是否与数据吻合,是否为一个好的模型,并同时可对各因子间参数做出合理估计。所以,Fornell & Larcker (1981) 用验证性的因子分析得到了因子载荷(λ1 、λ2  、、、λn)以及误差值 (ε1 、ε2、、、εn ),将值分别带入公式,计算后自可得到「组合信度」与「方差析出量」,这对于传统的古典测量模型是无法做到的。

至于何谓「组合信度」、「方差析出量」以及为何「组合信度」与「方差析出量」需同时存在的必要,Kenny在前面的回复已详细说明,不再赘述。

野人献曝,抛砖引玉,如分享中有错误的知识,感谢大家的纠正。  Cecilia

回复

使用道具

9
匿名  发表于 2008-8-24 00:39:00 |自己
感谢Cecilia的详细总结和Kenny的耐心点拨,又厘清了好多概念。Eleven,tianyang等朋友的问题也总是引人思考。谢谢你们!

Cecilia关于信度的总结已经写的很详细了,Eleven一定已经看明白啦,再补充一点点,不对的地方请大家指正:

1.信度有一个统一的概念,Cecilia已经帮我们总结了。而一个工具不稳定有多种原因,最大的原因是时间的因素和内容的因素,所以才有了各种不同的信度表示方式,如复测信度(考虑时间因素)和分半信度(考虑内部项目是否一致)等。而我们最常用的Cronbach α是属于后一种的,所以也叫内部一致性信度,它主要看一个测量工具内部的所有项目测的是不是一个东东。因为计算分半信度时,每次分半的方式不一样,结果就不一样,所以Cronbach就提出不如把所有可能的分半信度取一个均值用来表示内部一致性,于是Cronbach α就诞生了,后来成为研究者最喜欢的一个信度表示方式。

2.上面所说的信度都是在古典测量模型下讨论的,古典测量模型与同属测量模型(congeneric measurement model)最大的区别是研究者对测量项目的假设不同。前者假设每个测量项目都同等程度的测量出构念,误差完全来源于随机误差;而后者假设每个项目不同程度地测量出构念,所以我们才需要在做CFA时估计每个项目的λ。而前者可以看作是后者的特殊情况(所有的λ都为1时)。于是研究者才认为,针对不同的假设,我们应该用不同的方法计算信度。并且如Cecilia所说,SEM使其在方法上也可以实现了,因为可以把λ和误差都估计出来。
[不过这里还是Cecilia提到的混合信度是否必要的问题,假如一个研究中用了CFA,就代表研究者取了后一种假设,那么如果我们再用Cronbach α不是代表换了一个假设吗?这样是没有问题的吗?]
回复

使用道具

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

签到天数: 3 天

[LV.2]偶尔看看I

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

10
发表于 2008-8-24 01:41:00 |只看该作者
Eleven 问:「Cronbachα与组合信度有什么分别?」
回应:两者的分别是在于测量模型的假设不一样。请看我最新的日志「研究中的测量模型」,希望你看了会明白一点。
Eleven 问:「方差析出量是不是累积解释的方差?」
回应:以我认识的应该没有「累积解释的方差」这样东西的。你是在哪里看到的。我猜(瞎猜的)你是不是混乱了探索性因子分析里的“cumulative variance accounted for”? 如果是的话,两者是完全没有关系的。这里讲的是测量模型,与探索性因子分析没有关系。  Kenny
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册