- 最后登录
- 2016-11-27
- 注册时间
- 2003-1-21
- 威望
- 250
- 金钱
- 16832
- 贡献
- 11934
- 阅读权限
- 255
- 积分
- 29016
- 日志
- 4
- 记录
- 0
- 帖子
- 1438
- 主题
- 69
- 精华
- 0
- 好友
- 380
    
- 注册时间
- 2003-1-21
- 最后登录
- 2016-11-27
- 积分
- 29016
- 精华
- 0
- 主题
- 69
- 帖子
- 1438
|
本帖最后由 Kenneth 于 2011-10-18 11:28 编辑 * h- U6 P2 r( x. e& d
wfldragon 发表于 2011-10-17 14:07 ' [2 U8 N- ~! k8 V: V7 D
多谢Kenny百忙中的回复!& {7 f( r2 @4 c! P: D/ W
那我直接问您我的两点疑问吧:
! m' c% i5 g/ q9 V# W) \" B9 ^8 B(1)虽然效度用来衡量item与construct之间的关系 ... / S) p" Q2 `5 T7 w `0 {: y
Wfldragon,我的回应在下面:+ H* g9 l- A, i- R5 f. R p
(1)虽然效度用来衡量item与construct之间的关系,而信度用来衡量item在测量中的准确程度,但是,由于无论真值还是construct 都是未知的,那么如何在实际操作中区分信度与效度?在数学表达上应该都是相关性的测量,那么协方差和信度之间的区别很大吗?
3 {7 s( t7 Y; ]" b& E. A/ _/ d! |: f9 Q0 b; g
信度(reliability)是随机测量误差;效度(validity)是固定的测量偏差。一支坏了的温度计可以对沸水测出的温度每一次都是摄氏104度,效度很低,但是信度等于1。协方差(我猜你是讲相关系数)是效度(不是信度)的一种方法而已。 Content validity 不是用相关的。Discriminant validity 区分效度 和 convergent validity 聚敛效度是特别的相关,是跟已知的测量的相关。
: m$ B* d% U$ p. l3 R9 Q
/ q7 s; J' `3 G3 L/ R3 l' w+ j6 F& ]+ h(2)进一步的问题是,如果考虑极端情况,凭什么说两个construct之间的关系不是一个construct的两个item之间的关系?比如以下情形(A、B为construct,xi、yi是item,Q为效度,E为信度):
1 Z6 Y) U4 a5 IA=X1+X2+Oa+Ea4 w3 V& S* d) i/ P! a! Y
B=Y1+Y2+Y3+Ob+Eb % w0 v9 b. ^' |
我们的目标是分析A和B的关系,但是实际中往往要转化成X与Y的关系,那么如果X1与Y1高度相关的话凭什么判断它们之间的这种关系是A与B的关系,而不 是同一个construct(比如是C)里面的两个item之间的关系。简言之,我们凭什么对两个未知的construct之间的区别那么肯定?
8 G3 F- ?& P7 ]$ A& g$ i& v% y& _+ f8 l1 V9 k# V6 ~' b5 b/ y9 q$ ]( n
凡是用第三个構念(或是它的测量)来决定一个测量的有效性的(比如是 criterion validity),都要有强而明显的理论作为根据的。如果(从理论的角度)根本不清楚B是什么,又没有好的测量B的工具(比如是Y),你怎么会用X(你说是测量構念A的工具)跟Y相关呢?我们讲这一套测量的东西,都有一个假设,就是文献已经有一些作为我们参考的测量工具。那它们是如何来的呢?我相信是很多年的、各方面的研究都支持这些测量的工具的有效性。如果一个测量是有问题的,慢慢我们从研究的数据中就会发现问题,比如应该相关的不相关,跟其他構念的测量相关太大等。
7 |8 M$ P- {5 S+ q; V( @: k注:你的写法是错的。只有X=f(A),概念上没有A=f(X)的(自然数学上是可以)。因为X是看得见的,A是看不见的。所以永远是 X = A + 偏差(invalidity) + 误差(unreliability)。一个看得见的X由三个看不见的部分组成。
" y/ a" r* E3 @" r
1 _5 Y# U2 H. M' M0 |% b这是否意味着我们可能不应该期待X与Y之间高度相关,否则它们可能是同一个construct的measurement?但实际上可能存在高度相关却又不 同construct的例子,如对加速度的测量和对力的测量是高度相关的,但是这是两个construct。如何解决这种情况? g* P* t& m; |) _- G; E6 [: E1 J
$ z4 \& f; E3 J我们很少从一个研究来「肯定」一个测量工具的有效性(上面讲了)。通常是刚刚相反,我们会从一个研究来「怀疑」一个测量工具的有效性。如果你说X与Y分别是测量A与B,但是X与Y的相关是0.9,我会「怀疑」其中一个(通常是后来发展的、证据没有这么多的一个)有问题。那是不是就一定已经判了死刑呢?自然不是!作为一个研究者,如果你有本事可以提出证据来,我会接受的。什么证据呢?比如,A与B是不用的構念,理论上肯定有一些A的前因或后果是与B完全不同的。比如A影响C,但是B不会。那你就可以用X与Y跟那些構念测量来相关,我会发现r(A,B) 很高,r(A,C)明显大于0, r(B,C)接近或等于0。看见这个与理论符合的观察,我就开始考虑A与B虽然相关很大,但是可能是在测两个構念。当然,一个研究算不了什么,多看几次类似的结果(尤其是不同的C),那我就信服了。不过,我还是要补一句。现实归现实。除了是测量同一个構念的两个测量外,在社会科学中「绝少」看见有不同的構念的相关到0.8的。8 i/ L# o# h( S2 e
|
|