中人网
标题:
構念的測量疑問
[打印本页]
作者:
jkliang
时间:
2011-5-21 09:36
标题:
構念的測量疑問
Kenny與大家好,我想請教大家對這種構念定義的看法,而不是去探討作者是否正確的問題
4 C! p5 A" ^7 G* G7 i
最近我看了一個理論─計畫行為理論(Theory of Planned Behavior),該理論的發明者是Ajen,有一個TPB的專門網頁http://www-unix.oit.umass.edu/~aizen/tpb.diag.html#null-link,按每個latent會有詳細的解說。
" c; ~6 F- n( H1 x
$ v% m7 @' Z/ X; B) d2 ?- K. [
這個理論中的latent測量很有趣,例如attitude toward the behavior =
Σbiei
,意指把所有的behavior belief乘上權重加起來,這樣attitude toward the behavior是一個單維度構念,而且是formative model,可是在作者在他的網站內FAQ中針對某人的提問,
How do I estimate the reliability and validity of my direct TPB measues?
作者回答
"
The direct items designed to assess a given TPB construct (attitude, subjective norms, perceived behavioral control, intention, or behavior) are then submitted to an internal consistency analysis to establish reliability.
"
9 ?' t: ]$ h" m; w ~0 K
* I# o: I' D" w5 Y; e& J
我的問題為這樣的構念定義表示該構念是formative model嗎?如果是formative model,信度的探討用內部一致性指標恐不合適吧?我看其他引用TPB的研究(直接引用定義無修改),是使用reflective model的,這是否也表示,儘管一個構念被定義為formative model,但是也可以設計成reflective model來測量嗎? 我的理解,單維構念的定義與測量應該要一致,多維構念定義可以是latent model或aggregate model,但是可以在測量時用reflective的方式直接測量該多維構念,正確嗎?
/ v U8 l ]5 e5 P; C; q
7 @6 G, n( q0 n M! E+ y1 \
謝謝大家!
2 |, w+ r- H) n$ }% F j5 S
; L5 H2 K% j9 E/ d1 @5 E. a1 r3 Q# J
本帖最后由 jkliang 于 2011-5-21 09:41 编辑
! a7 {/ E' _* N% W
$ A0 D7 B1 f7 P% w3 H
作者:
hongyan911
时间:
2011-5-21 13:26
“儘管一個構念被定義為formative model,但是也可以設計成reflective model來測量嗎?”回答:可以。而且,能够用Reflective model来测就尽量用Reflective model,formative model 相对复杂,尽量少用。
作者:
Kenneth
时间:
2011-5-21 16:59
回复
2楼
hongyan911
的帖子
) c/ @' E2 v1 L: [+ j7 [2 N. c
6 a3 N; }, x% i+ T# {+ N6 r
百分百统一 hongyan 讲的话。
- j6 J2 N8 q$ x1 O W; m; \9 h4 a
+ ?1 j ?6 D& {( U1 P3 _
作者:
xinting.J
时间:
2011-5-21 20:05
JKliang, 我同意你的质疑。我的看法是,一个构念的定义和测量应该统一。要改变测量方法,应该是有相应的定义与之匹配。被定义为formative model,却用reflective model来测量是不对的。按你说的,作者将attitude toward the behavior 定义为 Σbiei,却又用内部一致性来衡量测量的信度是不太合理的。
8 }& ?3 x5 q/ A! @& Z
' A$ D6 }' Y5 _3 _% B4 `3 w
2 |! I1 w1 B/ D& a. B% O
作者:
zhmseven
时间:
2011-5-22 12:25
TRA和TPB模型确实存在这方面的疑问,我下载了Ajen网站上的一个问卷sample,[attach]281442[/attach],里面有的问卷题项(如Behavior beliefs)可以认为是reflective model,有的(如Control beliefs)可以认为是formative model。
" U0 D1 @: \# \7 |; z
关于一致性的信度检验方法,我不知道大家有没有碰到过这种情况:使用SPSS做信度检验,得到的结论是内部一致性很好(Cronbach alpha系数>0.85);再做多重共线性检验,其结果表明共线性程度较低(容差均小于0.5,VIF在2-2.5之间,共线性诊断表格中没有哪个特征值在两个或多个测量项的方差中所占的比例大于0.5)?
3 b: \3 ]) c! Z4 e& |, q
我曾经得到的问卷结果就是这样的,我设计的构念是formative的,共线性检验表明共线性程度较低,还挺高兴的。随后我突然想看看,如果做内部一致性检验会是什么样。结果让我很是郁闷,问卷信度的内部一致性也很强。我不知道为什么会出现这种情况,抛开问卷自身的质量不谈,难道同一份的问卷数据,既有可能表现出强的内部一致性,又有可能表现出低的内部相关性?
" }& S( M/ O1 S3 w
如果各位以前没有这样处理过,可以做个试验,看看是否同样存在这些问题。
作者:
Kenneth
时间:
2011-5-22 22:02
回复
5楼
zhmseven
的帖子
, \( o6 f4 p( _/ p6 g
大家看看我这个例子是否合适?
$ B" U7 K( B+ z+ M3 t
根据Lawler提出job satisfaction (JS)这个构念时说,JS 是一个多维构念,由五个不同的满意度组成:主管满意度、同事满意度、工资满意度 ...... 等。Lawler 更明显的表示 工作满足感是这五个组成的满足感的和(就是加总)。但是当我们测 JS 的时候,我们却可以写几个 reflective indicators 来测工作满意度。其实我的了解从来没有人用 formative model 来测 JS 的。这样可以吗?
- X" W/ Q$ G# e, P7 X- M& _
! Y( ^ C7 q, `$ t* u" p0 M" m
另外,我想到一个内部一致性可以高,但是项目相关不一定高的情形。就是每两个项目的相关都是0.3左右(很低),但是只要项目的数很多(比如二十道题),那么 Cronbach Alpha 还是可能蛮高的。因为根据定义,Cronbach Alpha 是所有的 split half reliability 的平均,但是要用 KR-20 修正(也就是说项目越多,Cronbach Alpha 就越大)。
& P" b9 ]/ D/ r' m/ L+ `
& |% s) ~, j: L, `' s5 E
作者:
xinting.J
时间:
2011-5-22 22:11
回复
6楼
Kenneth
的帖子
' h1 D) }' K9 x7 D6 f+ \
Kenny, Lawler提的多维度满意度模型是否应该是aggregative model(因为各维度间可以相互替代)?只是当时他们没有这样的概念来描述这个构念的类型。如果这样的话,严格来说,在用这个model估计Job satisfaction时还是需要其它两个outcome variable的吧?
9 }8 l1 J6 ~/ X9 H
0 l1 p, W5 E5 p
我觉得后来人们一直把它的子维度省去,直接用reflective item的方式测量JS,是因为这样比较省事,但其实概念已经有细微变化了,但没有人去讨论它。这样估计的假设是,员工对各方面满意的那个common factor才被定义为满意度了。不知道对不对~
! o7 W8 E w! {* ~
6 r; N5 Y/ p) p9 q0 r( c
. o' ~' l" |! r2 r$ {' O, W* M; G9 N
本帖最后由 xinting.J 于 2011-5-22 22:17 编辑
4 D8 ^1 y9 I+ B% @+ K; G
5 v4 l; a2 ?$ b7 X
作者:
jkliang
时间:
2011-5-22 22:42
我覺得Kenny所舉job satisfaction的例子是可接受的,多維構念的定義可以用reflective indicator直接衡量。但是我的疑問是如果是一個單維構念呢?如果單維構念已被定義為formative的形式(如attitude toward the behavior),在測量時可以用reflective indicator嗎?如果一個構念被定義成formative或aggregate model時,在測量時若要使用reflective indicator,此時在文章中需要交代嗎?該怎麼做交代呢?(至少目前我還沒有看到有人做這種交代)
' ^/ f9 [1 h! x2 y$ X/ q
2 v7 Q2 T* i- p7 _$ r& W
另外xinting.J提到,「直接用reflective item的方式測量JS,是因為這樣比較省事,但其實概念已經有細微變化了,但沒有人去討論它」,我認為這是否要在理論的層次討論了呢?因為是理論視角的不同,構念的定義才會發生變化,而不是因為測量方式的不同,而使構念產生變化。但我仍然贊同您所言「一個構念的定義和測量應該統一」,但是應限於單維構念,但是如果文章中作者交代了定義和測量model為什麼不同的原因,那麼應該是可以被接受的做法;多維構念因為研究者可能關心的只是這個多維構念和其他構念的關係,所以儘管定義是aggregate model,還是可以使用reflective indicator去把這個多維構念「猜」出來。
# J& ^! C- t- o: O7 p
請大家指教!
本帖最后由 jkliang 于 2011-5-22 23:35 编辑
. e& j {2 d7 V, K) j
$ |5 `( u. i) W
作者:
Kenneth
时间:
2011-5-22 22:51
回复
7楼
xinting.J
的帖子
, G( i" ]- n$ O* N
xinting,你讲得对,我这个例子用得不好。JS 是个多维构念。那下面这个如何?
/ ^" b) O+ i; Q; ~; ^
socio-economic status = parent's income + one's income + total asset。这是一个 "formative" 的构念。但是我可不可以用:
; ~8 K" T7 M/ w2 b- f
1. 别人都觉得我的社会地位很高。
0 s- L& c4 n3 `+ Q
2. 我是一个社会地位很高的人。
( S* r% O: k" w k. Q
3. 我更像一个上流社会的人。
" Y/ Z( w1 w; Y
来测这个构念?
7 n) N% S& s3 Z8 A# t
Jeff Edwards 最近在 psychological bulletin 的文章就一反他过去对 formative indicators 的拥戴,而改口说大部分的 formative constructs 都可以用 reflective indicators 来测量的。我不喜欢他的话,不过我同意他这一点。绝大部分的构念(不论是构思上是反映的或是构成的)都可以用reflective 的方式来测量的。既然reflective indicators比formative indicators的好处多很多,我们就尽量不要用formative indicators了。
M; [: s2 O1 D2 b" a6 L) P
/ ^9 r. O4 \$ \" z* {, ?. _
作者:
xinting.J
时间:
2011-5-23 07:40
回复
9楼
Kenneth
的帖子
# ^( ^, o: I" {
Kenny,你举的SES的例子我非常同意了,也赞成Jeff Edwards最近提到的观点。如果一个构念的确可以较好地描述一类现象,那我们就即可以从它的原因上测(formative),也可以从表现上测了(reflective),不过用的item应该是不同的两组。这样,考虑两类item的优缺点,我们就宁愿多用refective indicators啦。
本帖最后由 xinting.J 于 2011-5-23 07:42 编辑
9 Q2 M7 N6 O' f- w3 Z; _, _; N
# X& ]6 ~( q8 o3 O/ B
作者:
jkliang
时间:
2011-5-23 10:39
請問Kenny,您提到Jeff Edwards在psychological bulletin的文章,文章的topic是?或是出版年份?我在psychological bulletin最新出版的一期內找不到這篇,請您幫忙!
作者:
xinting.J
时间:
2011-5-23 11:23
回复
11楼
jkliang
的帖子
( y* u' s3 |- S/ j" _! H" \
jkliang, Kenny说的可能是这篇文章:
6 M% b- {! K* C/ b3 i; R6 ~
Edwards, J.R. (2010). The Fallacy of Formative Measurement. Organizational Research Methods, 14:2, 370-388.
1 {# V3 |2 ~% V& B& M o- C$ |
# R, `4 o/ ]! r6 {- s) a
作者:
jkliang
时间:
2011-5-23 11:34
xinting.J謝謝!
作者:
zhmseven
时间:
2011-5-23 21:15
回复
9楼
Kenneth
的帖子
1 m, I5 N# R( V% H
. Q' x! l6 p. @; h6 @- E1 O# h: c
Kenneth,你举的例子将社会身份修改为reflective类型的,我同意。之前我也这么考虑过,不过关于很多文献上多维构念的设计,我始终有一些不认同。
7 e! b3 f( C' [& r9 }+ y
5 g/ U+ I1 N, L$ w/ d9 ?# p
Lawler将Job satisfaction分解为5个维度,每个维度都可以用reflective model来测量,这一点没有疑问。但是Job satisfaction和5个维度之间应该采用reflective还是formative类型的呢?我认为应该是formative的,即一级潜变量采用reflective model,二级潜变量采用formative model。
( S( v3 i7 w+ [; z) R7 Y$ ^' D
* h1 J& d' @8 g
昨天晚上学习了一点你在同济大学的讲座,提到台湾企业的“家长式管理”分解为两个维度,一个维度是“爱护下属”,另一个维度是“权威式领导”。这两个维度和“家长式管理”这个构念之间采用reflective的模型。我想借用这个构念设计,与job satisfaction的构念设计作比较,讨论formative model和reflective model之间的区别。
' V! ^) t1 D- r' k% j; A
; q# n5 | e" R R
我比较了“家长式管理”这个构念和“Job satisfaction“构念之间的区别。
4 c& t3 M; O" u/ T- U4 }
从“家长式管理”这个构念来看,“爱护下属”和“权威式领导”两个维度是不相关的。按照一般的观点,“家长式管理”构念和“爱护下属”、“权威式领导”两个维度之间应该是formative型的。但是,普遍研究采用的是reflective的。我的理解,必须两个维度的测量分值都很高,才意味着“家长式管理”的分值很高。或者更准确地说,如果我们认同一个企业采取的是“家长式管理”,那么必然有“爱护下属”和“权威式领导”。也就是说,虽然“爱护下属”和“权威式领导”两者之间没有必然的相关性,但如果“家长式管理”构念的分值高,“爱护下属”和“权威式领导”的分值必然高。只有一个维度的分值高,这个企业的管理不能称之为“家长式管理”。因而,家长式管理”构念和“爱护下属”、“权威式领导”两个维度之间采用reflectivee型是合理的。
2 S: i7 N. t9 w0 x2 @+ ?9 `
“Job satisfaction”与“家长式管理”这个构念有一个类似的地方,就是其5个维度同样是不相关的。但不同之处在于,我们不能认为“Job satisfaction”的分值高,就一定有5个维度的分值也一定高。一个人对工作感到满意,可能只是因为他对工资很满意,不代表其对主管一定感到很满意。这是“Job satisfaction”构念的维度与“家长式管理”构念的维度的一个显著区别,或者说是两个构念的定义的显著区别。采用不恰当的数学作比喻,前者是5个维度的“或”的关系,后者是两个维度的“与”的关系。因此,即便作为多维构念,Job satisfaction与5个维度之间也应该采用formative方式,而不应该采用reflective方式。但是其5个维度各自的指标可以使reflective的。
( W1 w) f6 v5 K' |
* d" w+ J u. q6 ]! d
这个问题的讨论就涉及到应该如何评判一个构念采用formative还是reflective的准则了。按照Jarvis等的观点,当各个测量指标之间不具有替代性或者说相关性的时候,就应该采用formative model。我的观点,重要的不是考察各个测量指标之间是否共变相关,而应该考察构念和测量指标之间是否具有共变关系。如果说构念分值变化,必然有所有的测量指标都发生变化,就应该采用reflective model,但这是各个indicator之间不一定具有共变关系,例如“爱护下属”和“权威式领导”两个子维度。
2 A; D$ Z2 P8 U5 M$ e3 H q0 R
作者:
zhmseven
时间:
2011-5-23 21:23
回复
6楼
Kenneth
的帖子
6 P. P U( {# J/ z! b8 o5 @7 h) S
. T6 c7 H1 e' ~% Y! J7 a7 \
Kenneth,
3 p- V/ ^, G7 n. N
& {, o$ p$ S o/ w2 c2 r
另外,我想到一个内部一致性可以高,但是项目相关不一定高的情形。就是每两个项目的相关都是0.3左右(很低),但是只要项目的数很多(比如二十道题),那么 Cronbach Alpha 还是可能蛮高的。因为根据定义,Cronbach Alpha 是所有的 split half reliability 的平均,但是要用 KR-20 修正(也就是说项目越多,Cronbach Alpha 就越大)。
. K3 S2 J3 F/ Z) K# I0 \" p4 B
, v5 g7 U$ v4 \3 |& j& h- B8 d
在我的测量数据中,测量项并不多。总共只有5个测量项,其中4个测量项我设计为formative indicator,1个设计为reflective indicator。构念是perceived benefit,4个formative indicator分别是有用性收益(反映消费带来的效率提升等)、享受性收益(反映消费带来的享受)、社会收益(反映带来的社会身份认同感)和情感收益(反映对个性、情绪的一种展示),1个reflective indicator反映总的感知收益。这里的感知收益有点类似于感知价值,只是没有考虑各方面的成本付出等。
& v/ F' P) c( @
所以,这个现象应该不是由问题项很多导致的。
9 C3 b# z3 c1 f& F0 Q
* o: w' [- |1 U, z
我在想,这个问题会不会和数学的假设有关系?信度检验和共线性诊断的方法和判断值,有没有基于什么样的分布函数的假设,比如说联合正态分布?之前没有研究过这个问题,这段时间论文的压力比较大,也没心思考虑这个问题。
- P! p n" A, r9 K+ D( Z& Z
本帖最后由 zhmseven 于 2011-5-23 22:24 编辑
% F! K6 o. d% c/ U* B x
1 V4 v/ |6 c. {- k h c9 I$ H+ P
作者:
Kenneth
时间:
2011-5-24 14:53
回复
15楼
zhmseven
的帖子
% s m2 e4 b6 H
zhmseven,
- Y1 n3 T7 W. T! j
怪不得你有这么多古怪的结果,原来你不是依据正规的途径自己发展出来的量表。
% i3 @9 ~0 [3 |( n, w9 T
1. 一个構念,不可以“同时”用reflective与formative indicators 来测的。
* Q; m1 S3 C* ~9 ]
2. Formative indicators 不可以讲 内部一致性,Coefficient Alpha 是不适用的。
. I3 ]( h7 a! m% }! r
所以你说的item correlation 与 internal consistency的问题根本不存在。关于formative indicator,请看帖子上面的讨论。
: m& @2 e% r" p
作者:
zhmseven
时间:
2011-5-25 00:45
1. 一个構念,不可以“同时”用reflective与formative indicators 来测的。
/ r: w: ~) f# |$ }( U2 V
2. Formative indicators 不可以讲 内部一致性,Coefficient Alpha 是不适用的。
5 u; w0 R: V# f0 b5 ?( K- q
& e7 c* l9 c5 B3 j8 l
所以你说的item correlation 与 internal consistency的问题根本不存在。关于formative indicator,请看帖子上面的讨论。
: P) H3 B5 ]2 K+ t7 {
Kenneth,我想主要的问题不在于构念的测量采用的是reflective还是formative indicators。应该说,同时做两种类型的测量是可以的,MIMIC方法就是同时做两种类型的测量。关键的要求是,不能把两种类型的测量指标混淆了。事实上,我并没有将reflective与formative混合起来做内部一致性分析和共线性诊断,更没有将两种指标混用做SEM分析。
0 q3 K/ m$ L' S0 o* S
在做内部一致性分析和共线性诊断的时候,我用的是benefit1-benefit4四个formative indicators。我知道formative indicators是不可以讲内部一致性的,我之前做的就是共线性诊断,只是一时兴起做了个内部一致性分析,看看formative indicators做共线性分析的结果会是什么样子。
% I$ K7 L% Z) O7 Y
我之前的概念是,不管是什么样的数据,哪怕是我随手自己编的一些数据,在问题项比较少的条件下,如果说内部一致性强的话,那么共线性就应该弱;共线性弱的话,内部一致性就应该比较强。这个和采用formative indicators还是reflective indicators没有关系,是由待分析数据的数学特征决定的。因为内部一致性强,表明问题项之间的相关性强,那么共线性必然会弱,反之亦然。内部一致性和共线性之间有一个反向的关系。
/ o6 B* W& o4 H) j. ~8 I
但我一时兴起所作的分析让我很是吃惊,同样的数据,做内部一致性分析表明相关性强,做共线性分析表明相关性弱。这是什么原因呢,是我对内部一致性分析和共线性诊断的理解完全错误?内部一致性强和共线性程度之间并没有反向关系?抑或是其他可能的原因?
# @+ c" t1 j3 G: q7 {' T
本帖最后由 zhmseven 于 2011-5-25 00:46 编辑
+ m% {/ c) Z2 g3 H9 K8 d- f
3 h7 c3 q8 A+ w, F
作者:
rwxld
时间:
2011-5-25 09:30
1、内部一致性强,共线性也应该严重啊。
( v+ }# d) v$ R
% B& i* j& m* B& o
2、另外,对几个项目做内部一致性分析可以理解,但同时又如何对它们进行共线性诊断呢,是将这些项目作为自变量回归吗?根据经典测量模型,这些项目是结果变量呀,应该不能做共线性诊断啊。除非把他们当自变量,但这样一来就成了formative indicator了,就不能做内部一致性分析了。那么,根据上述理解,要么做内部一致性分析,当成reflective indicator;要么做共线性诊断,当成formative indicator,不能两者同时做。这意味着既把它们当成reflective indicator,又把它们当成formative indicator。
( M4 l: \6 e3 N" |
+ g* }5 j) }% c" R5 k1 z
我是初学者,说的可能不对,请zhmseven朋友指点。
1 d* F7 u0 Z. z- j
7 O: i @( g' u, }: Y# R, V
本帖最后由 rwxld 于 2011-5-25 09:33 编辑
0 ^5 t( I7 W+ }% k1 z
: u5 `' |9 t6 ]
作者:
Kenneth
时间:
2011-5-25 14:01
回复
18楼
rwxld
的帖子
9 C' ]% m8 Y, q4 N6 s
rwxld,你没有说错。我的疑惑也是一样。Alpha (一致性)是长度修正后平均项目间的相关,一致性高,项目相关就高,共线性也强。
% |5 ]' ^/ v0 p- `# k
另外,我不知道“共线性”在这里到底扮演什么角色。理论上来说,项目相关应该越高越好(当然不可以等于1.0)。在量表的发展中,一致性是信度的重要标准。共线性是回归分析的问题,在测量模型根本没有地位,为什么会在这个考虑呢?除非你讲的是formative indicators。但是你又说两个分析是独立的,那我就完全迷失了。
& T0 e% c$ q% K/ k( r1 J
最后,就算你要分开来分析,同一个構念也不准同时有reflective,也有formative indicators的。起码我没有见过这样的东西。
1 k$ C4 H+ O5 ?: r* Y
7 w, E7 e3 H1 M' l
作者:
zhmseven
时间:
2011-5-25 22:41
呵呵,看来大家都迷惑了。但有一点共识,那就是内部一致性强,则共线性也应该强。不知道这一点有没有形成共识,那就是共线性弱,则内部一致性也应该弱(似乎是逆否命题,答应应该同意)。
, v+ j w1 v9 i
5 L3 _4 p: W4 _' S- ]6 s3 p
重申一下,我同意在reflective model中应该做内部一致性分析,共线性诊断是回归分析中的内容。
9 S- [$ k! E7 @& B/ X
我只是随意测试了一下,发现我所说的奇怪问题:同样的数据,做共线性分析的时候发现共线性较弱,但做内部一致性分析的时候发现内部一致性很强。这个和是否“应该”做共线性诊断或者内部一致性分析无关,而是违反了我们达成的共识:内部一致性强,则共线性也应该强。
- a& i$ k2 J) X2 l" C& G( r
. x$ L! B( i6 q. q
我昨晚上后来回顾了一下所看过的文献,怀疑这个问题可能不只是我碰到了(当然仅仅只是猜测,没有证据)。在Javis et al.(2003)的论文中讲到,在四大市场营销类期刊上,有相当多的论文在应该采用formative model时错误的使用了reflective model,在应该使用reflective model时又错误地使用了formative model,前者更甚(P206, table 2)。既然模型错误,那么所采用的数据分析方法(也就是说,应该采用共线性诊断还是内部一致性分析)也错了。这里问题就来了:使用了错误的数据分析方法,为什么还能够通过数据分析检验呢?我猜测(仅限猜测),对这些作者来说,其收集到的数据有可能存在和我收集到的数据同样的现象,只是没有人像我这样“一时兴起”。
3 B, {( q. d4 c( C
我再举一篇文章说明,谢赞和赵刚(2005)认为应该将用户满意度的测量模型由reflective model修改为formative model。在此之前,多属的paper在研究这个问题时采用的都是reflective model,他们能够发表出来,说明在其论文中数据的内部一致性还是很强的。谢赞和赵刚(2005)基于他们自己收集的数据,采用formative model,所做的共线性诊断结果表明共线性程度很低(p6 column 2, line 1)。遗憾的是,作者没有提供内部一致性的分析结果。这里的问题也同样存在:为什么同样的问卷调查表,所收集到的数据既可以完美通过内部一致性分析,又可以完美通过共线性诊断呢?
9 F/ y- D5 d' \' p8 j+ Z" q, i
我将论文附上供参考[attach]281641[/attach][attach]281642[/attach][attach]281643[/attach]。
$ p5 i, I9 q# q( C
B0 Z4 Q$ \, L
要是哪位恰好手上保存有收集的历史数据,或者是刚好收集完数据,建议可以试试并把结果公布一下。近些天我看看能否从数学上做一次推导,找找原因在哪儿。
; o# c' X0 E9 M4 \- X. ~6 w4 B% I/ r
作者:
Kenneth
时间:
2011-5-26 18:11
回复
20楼
zhmseven
的帖子
) n. ^9 ?" o9 x& B& t. M
Zhmseven,
3 E; \; d W7 H' ]0 v8 B; O& w
1. 既然你同意“在reflective model中应该做内部一致性分析,共线性诊断是回归分析中的内容”,我没法明白为什么还要在这个问题上纠缠呢?他们是否同时变动,或是相反方向变动又如何呢?既然你这么有兴趣,我最后多讲一次。Coefficient alpha的其中一个定义(Lord 已经提供了数学的推导证明)是“average inter-item correlation after correction for scale length by KR-20”。意思是只有两个因素影响alpha。第一是average inter-item correlation(我猜就是你讲的共线性)。第二是有多少道题。在项目数目不变的情形下,average inter-item correlation越高,alpha就越高。反过来说也对的。我不知道你的数据出了什么问题,但是无论如何,除非Lord 的推导是错的,我觉得不然不可能有你讲的现象。
6 F5 D4 s6 O( ^1 {% G( b
2. 我个人没有办法同意这个说法。我已经举过例子了,绝大部分的“所谓formative的”構念,都可以用reflective indicators来测量的。绝少的情形(我到现在还没有想到这样的例子)会有一个構念“应该要”用formative indicator,但却“错误地”用了reflective indicators的。就算是一个formative construct,我也可以用reflective indicators来测量它的。当然用的indicators 在两个情形就不一样了。
7 @& M6 h9 R, Y- d
' K. ~- S% F, S+ ?1 o% E
作者:
zhmseven
时间:
2011-5-26 20:32
ok,看来这个问题很难继续讨论下去,我们在讨论的“问题是什么”上没有达成一致。
$ y+ i% _1 \0 L8 N) n( i) }. M/ L
我最后一次把我所想要提的问题彻底地清楚地描述一次,有兴趣的朋友可以继续研究。即便我提出的问题是错误的,对于大家理解formative indicators、reflective indicators以及coefficient alpha、共线性诊断也会是有好处的。
3 n, N; p1 B$ a. Q0 A* O
1、第一个问题,coefficient alpha在信度检验中应该如何看待?在相当多的文献里面,其构念的测量项采用的是formative indicators,但是在实际分析过程中将这些formative indicators当作reflective indicators来使用了,这是Javis批评这些papers错误地使用了“reflective model”的原因。但是,令人惊奇的是,这些采用formative indicators收集到的数据,却可以很好地通过信度检验(Javis批评的现象,以及谢赞和赵刚提出的问题,都属于这一类问题。Kenneth,你没有看我传上去的论文,以为我说的是构念必须使用formative indicators)。如果说是用formative indicators收集到的数据也能够通过信度检验,那么,信度检验有什么意义呢?理论上讲,formative indicators收集到的数据应该是不能够通过信度检验的。如果说是用formative indicators收集到的数据也能够通过信度检验,我实在想不出来信度检验在这里到底有什么作用。相反,很多研究者将会使用信度系数作为评价其formative indicators应该看作为reflective indicators的证据,而读者没有很好的证据去批驳他,只会使所要研究的问题更加混乱。
# A8 ?1 A8 h9 O8 J# f
2.为什么会出现“信度系数高,共线性程度低”?在我们承认信度检验的有效性的前提下,我们就需要思考,为什么会出现formative indicators收集到的数据能够通过信度检验。是由于我们忽略了信度检验所要求的某些数学条件,或者说是信度检验判定的门限值仍然不够严格,再或者是问卷设计没有很好地体现构念的formative类型?不管是什么原因,如果我们仔细思考以后能够得出一个结论,对于大家更好地认识SEM是有益处的。
2 x: \1 [ Z$ i/ K$ G3 [ ~
3.如果发生“信度系数高,共线性程度低”,应该怎么办?如果我们承认,信度系数高意味着indicators之间的相关性高,也就是共线性程度高。那么,当发生数据存在这样的现象“信度系数高,同时共线性程度低”,我们就需要高度警惕了。当然,我对这个问题没有更深的认识,建议只能到这里。
作者:
Kenneth
时间:
2011-5-27 13:33
回复
22楼
zhmseven
的帖子
: @9 U: T0 y3 _
zhmseven,对不起,我是下载了你的东西的,只是没有时间详细的看而已。我再提两点作为我的总结(纵然我所学的某些东西的定义可能跟你的不同)。
7 W5 U3 r! B; F% U4 |
1. formative indicators 之间的关系是没有限制的;reflective indicators 之间最好要高相关。如果我们假设量表的项目不变,一个formative construct的indicators可以从没有相关,到很大的相关都可以(没有人说formative indicators 不可以高相关的)。高的项目相关就代表一致性高的话(我看不出为什么不是),那么reflective constructs的项目一定要有高的一致性。但是这不代表formative constructs就不可以有高的一致性。因为formative indicators 之间的关系是没有限制的,可以高相关,也可以低相关。
4 O1 J7 z: M" u$ j
2. 基于上面的原因,如果是formative constructs,根本不可以用一致性(coefficient alpha)来确定信度。其实,更精确的讲,到目前为止,formative indicators 的信度是没有方法估计的。
5 Z' O: I! j, ]+ w
余下的,就请其他的高人解决了。
0 P; w1 Y% j% {4 N6 z# w
作者:
zhmseven
时间:
2011-5-28 11:19
Kenneth,谢谢你不厌其烦的解答。
, `+ P) d: L( g$ p! }9 Z/ Z( v8 A
我完全同意你第2点,formative indicators信度没有办法估计。
' w+ B$ N! X0 S2 W( Q; D
只是formative indicators之间的关系,很多paper确实argue说共线性程度应该低才行,也就是说低相关。不过我猜formative indicators现在还没有研究太明白,很多东西还比较模糊,套用一句话耳熟能详的话,“要在发展中解决问题”。
) ]& H0 M5 k+ W+ S# c3 S
formative indicators之间可能存在高相关性,确实导致了一些严重的问题:作者定义的construct和indicators之间的关系明明是formative类型的,但由于指标之间的高相关性,信度检测能够通过,作者往往还是把indicators当做reflective来处理。
+ s1 d# m' p' E4 I, \
所以,Kenneth说的一点,尽量采用reflective indicators,这个我同意。只是,怎么样判断一个construct和indicators之间是reflective类型的,就只能由作者去理解、各说各话了,没有了一个判断准则。如果说formative indicators之间的共线性程度必然很低,不能通过信度检测,我们很容易说construct和indicators之间的关系是formative类型的。如果formative indicators之间的共线性程度可能很高,我们确实没有准则判断很多papers貌似formative indicators的指标当作为reflective indicators来处理是对还是错了,只能根据每个人自己心中的信念来判断。
# U3 Y ?7 F* D7 C% d3 S
这些疑问,留待发展中解决。。。
作者:
rwxld
时间:
2011-5-28 13:07
回复
24楼
zhmseven
的帖子
( }: B/ m! p4 I6 c$ k1 `! P
我的理解,一个测量modle是formative还是reflective,这是一个理论问题,是由作者定义的,它和数据结果是否相关没有必然联系。因此,并非formative modle的indicators之间就一定是低相关。
5 f3 i! ]- U+ ? H/ L/ d
不知道这样理解对不对?
: v8 F- Q/ W, ^) ~) X) S+ E
作者:
Kenneth
时间:
2011-5-28 13:17
zhmseven
* {# i1 I V& U) x
" _! j. N0 _& E0 [! B0 P. z
虽然我不太赞成很多人乱用formative construct 这个概念,但是 internal consistency 不是信度的唯一标准。所以我上次讲的那句话(就是「到目前为止,formative indicators 的信度是没有方法估计的」这句话),其实不完全精确。对于稳定的构念,我们还可以用test-retest来估计信度。对于不稳定的构念,我们还可以用parallel form来估计信度。
- {8 N9 R% p! @& z) o6 J
: ~' x8 O" Z: }1 q9 @
你最后讲的一个“理想”的情形,formative 不可以一致、reflective 要一致,其实就算是对的话,也不是好事。不然、我做一次因子分析,结果只有一个因子的话,我就叫这个测量为reflective,如果相关不高的话,我就说它们是formative。那岂不是更坏吗?
% i, N$ X7 f2 D
9 f: p% L7 A; ~( b6 v1 X* {* t
其实,我就不明白为什么这么多人喜欢用formative indicators,formative construct 是很难估计的,要求也很高;估计信度也极为困难;还有sample-specific loading的问题等。如果可以用reflective measures,为什么不用呢?
作者:
jkliang
时间:
2011-5-29 00:17
首先,我要說謝謝Kenny與各位,這個過程中我看到了精采的對話,也學到了很多。
1 z$ @( n( z. Y) q1 w4 H! M
這個問題回到我最初所提出的疑問,如果研究者在研究之初利用了理論或觀點,定義了一個構念應該是用refelctive or formative indicator,此時在作校估的時候,研究者「很有可能」把原本已經定義的測量型態變成了另外一種,最近我回顧台灣運輸心理學相關研究之後,的確發現了這一個問題,尤其是研究者已經定義構念是formative,但是在校估時卻使用reflective的檢驗方法,而且indicator還是當初定義為formative時所敘述到的現象(而不是Kenny說的formative和reflective的問項應該不同,因為因果關係方向不同),然後更進一步用SEM進行構念間的關係檢驗,而我想有可能就如zhmseven所說,因為研究者不知道(或根本無知覺)該怎麼處理formative,所以用reflective試試看,結果通過了檢驗,所以竟然出現了定義是formative,但是在校估時是使用reflective,而且統計數據都還不錯,於是研究者就進行研究的解釋,說自己的構念有信、效度,更進一步擴大解釋到不同構念間的關係,我們不由得該問問,這樣是正確的嗎?
1 P- Q1 N" j1 @ ?4 M( {! ^- h
為了不落入zhmseven所說「只能根據每個人自己心中的信念來判斷」,我們是否應該對於構念的定義與測量模式校估必須一致進行要求,不然就必須要求作者應該說明,一個已經定義為formative的構念,在測量的時候為什麼要換成reflective(我很贊成Kenny說大部分的構念可以想辦法用reflective),因為當初作者一定是利用理論認為構念是指標的效果,所以才定義是formative,現在要用reflective來量,在概念上已轉變為指標是構念的效果,此時當初所使用的理論觀點仍然適合嗎?很有可能作者已經換了一個理論觀點來進行測量模式的轉換,那是不是應該說清楚呢?當然,作者可以只用後面的觀點,直接用reflective來量囉!但是如果是我一開始提到的情形,我就認為這個研究的結果,在解讀時應該持很大的保留態度才是。
0 E$ H' Q6 x6 Y+ ]% D
作者:
Kenneth
时间:
2011-5-30 09:30
回复
27楼
jkliang
的帖子
/ t1 ^5 | F8 T7 Y: @4 M- ^
jkliang,你们还是在抓着同一点在发挥。
- X, G; m8 q! n3 }6 T1 C2 _
1. 定义为 y = f(x1 ,x2 ,x3), 当x1,x2,x3 是指标而不是前因的话,y就叫formative constructs; x1,x2,x3 叫formative indicators.在这个情形下,你那x1,x2,x3做因子分析,发觉只有一个因子,这不叫convergent validity。你发觉x1,x2,x3的alpha值很高,这不叫reliability。
做的人根本不知道自己在做什么
。这叫知其然不知其所以然,所以用的时候就乱用了。
) z/ H& ]3 H( a( O N" V
2. 就算y = w1*x1 + w2*x2 + w3*x3, 我们还是可以另外发展四个reflective indicators(i1,i2,i3,i4)来测y的。那么i1=a1*y+e1; i2=a2*y+e3; i3=a3*y+e3; i4=a4*y+e4。如果i1,i2,i3,i4是reflective indicators,那计算他们的alpha值,用以决定信度就绝对可以。我们不可以因为有人乱用(上面的用法),就不容许别人做正确的事情(这里的做法)的。问题是什么呢?我觉得问题是上面的所谓formative indicators既然不是用在测量構念y,那么提出来就没有很大的意思了。可能只是丰富我们对構念的理解吧。
; e0 \" \6 q+ X ]& j
8 K+ J' K/ v" ]3 f
作者:
zhmseven
时间:
2011-5-30 19:39
嗯,其实大家的基本看法是一致的。看法不同之处只是说,如何看待在formative model的概念下使用了internal consistency的问题。
; i; o( v+ F. W6 f
事实上,我和jkliang的看法是,大家要小心引用很多papers上的indicators。虽然这些indicators的alpha系数很高,其处理方法可能是错误的。
. k6 e8 W$ v8 v" n& Y$ O
至于应该如何评价internal consistency和共线性检测的作用,恐怕需要做一番研究了。有空的时候,我希望自己能够从数学上推导一下。
作者:
reddyrunny
时间:
2011-6-17 09:12
谢谢各位同仁,我从你们的帖子中学习了很多,懂了很多。非常感谢!
作者:
chienhsin
时间:
2011-6-22 20:56
之前沒加入討論,分享一些看法:
0 R" k* m) h- t7 G5 M9 y: {7 z
6 P* i7 S; `7 A3 A; Z+ b" r
Jarvis et al paper裡面說的是:某些indicator被錯誤定義的現象,他是Jarvis事後整理出來的,但Jarvis回顧的那些文章當時的作者忽略了construct定義為formative or reflective的問題,所以才會出現Jarvis認為應該是reflective,但作者卻用formative的方法來估計 or vice versa.
$ \% K* A6 }1 y0 f2 ^6 u8 A
(不是衡量,因為該作者當初已經衡量了,只是沒有定義,Jarvis是評論看起來應該是formative,作者怎麼用reflective方法估計,結論當然不可信)。
$ d! c+ A6 C. l$ v0 U
4 Y; N8 V/ a( O( n' D( B7 ?( X+ j
Jarvis不是在說,作者定義為formative,卻用reflective量;Jarvis是在說大家不明就裡糊塗量了,也隨便估計了。
& v' o9 U9 S3 x& E; |1 R! X3 C
如果那些被Jarvis評論到的那些文章作者,在當年早就知道精確定義construct,他們也能準確設計題目,用正確方法估計,應該不會出現,我定義為formative,卻用reflective估計(or vice versa)的情況。
# x) R$ g$ {8 C3 q/ r5 h# [% D
. J7 f8 W. g8 _- I- Z$ I/ A
不知道這樣有沒有對大家的爭論取得一個平衡。
1 R. n. l$ m% ~: p
+ ^' P0 m. D6 m' B! U3 `
0 Q/ h, f" u F; L5 H
欢迎光临 中人网 (http://bbs.chinahrd.net/)
Powered by Discuz! X2.5