- 最后登录
- 2016-11-27
- 注册时间
- 2003-1-21
- 威望
- 250
- 金钱
- 16832
- 贡献
- 11934
- 阅读权限
- 255
- 积分
- 29016
- 日志
- 4
- 记录
- 0
- 帖子
- 1438
- 主题
- 69
- 精华
- 0
- 好友
- 380
    
- 注册时间
- 2003-1-21
- 最后登录
- 2016-11-27
- 积分
- 29016
- 精华
- 0
- 主题
- 69
- 帖子
- 1438
|
本帖最后由 Kenneth 于 2011-10-18 11:28 编辑
5 `, J- v O. X, i# nwfldragon 发表于 2011-10-17 14:07 ![]()
% \. W& {5 v q0 ~ E多谢Kenny百忙中的回复!4 S7 Z. c) J/ J ~
那我直接问您我的两点疑问吧:
9 M& S# }9 g" k; F, ]) P% c(1)虽然效度用来衡量item与construct之间的关系 ...
: a) C7 U+ [$ y8 w& @% L6 oWfldragon,我的回应在下面:. ?6 W# }( ^) x: _; H1 O: Y' n+ `6 K
(1)虽然效度用来衡量item与construct之间的关系,而信度用来衡量item在测量中的准确程度,但是,由于无论真值还是construct 都是未知的,那么如何在实际操作中区分信度与效度?在数学表达上应该都是相关性的测量,那么协方差和信度之间的区别很大吗?: k5 L9 D0 n5 _
5 L7 P8 I& L3 ^
信度(reliability)是随机测量误差;效度(validity)是固定的测量偏差。一支坏了的温度计可以对沸水测出的温度每一次都是摄氏104度,效度很低,但是信度等于1。协方差(我猜你是讲相关系数)是效度(不是信度)的一种方法而已。 Content validity 不是用相关的。Discriminant validity 区分效度 和 convergent validity 聚敛效度是特别的相关,是跟已知的测量的相关。
2 X& g( p* i' q2 p5 A, G$ s) y
" `1 S) u* t" Y3 J; M(2)进一步的问题是,如果考虑极端情况,凭什么说两个construct之间的关系不是一个construct的两个item之间的关系?比如以下情形(A、B为construct,xi、yi是item,Q为效度,E为信度):
8 r+ r1 V: _7 Y$ yA=X1+X2+Oa+Ea
6 U3 s& q7 b* h2 e3 n/ VB=Y1+Y2+Y3+Ob+Eb 6 |- m! a7 e3 r' q' ~1 I
我们的目标是分析A和B的关系,但是实际中往往要转化成X与Y的关系,那么如果X1与Y1高度相关的话凭什么判断它们之间的这种关系是A与B的关系,而不 是同一个construct(比如是C)里面的两个item之间的关系。简言之,我们凭什么对两个未知的construct之间的区别那么肯定?& N6 z1 x( x/ s$ D {) L
; S% X9 M3 D3 S7 U* G) ]+ x( c
凡是用第三个構念(或是它的测量)来决定一个测量的有效性的(比如是 criterion validity),都要有强而明显的理论作为根据的。如果(从理论的角度)根本不清楚B是什么,又没有好的测量B的工具(比如是Y),你怎么会用X(你说是测量構念A的工具)跟Y相关呢?我们讲这一套测量的东西,都有一个假设,就是文献已经有一些作为我们参考的测量工具。那它们是如何来的呢?我相信是很多年的、各方面的研究都支持这些测量的工具的有效性。如果一个测量是有问题的,慢慢我们从研究的数据中就会发现问题,比如应该相关的不相关,跟其他構念的测量相关太大等。5 v- ?% i& G1 V2 a/ D( V
注:你的写法是错的。只有X=f(A),概念上没有A=f(X)的(自然数学上是可以)。因为X是看得见的,A是看不见的。所以永远是 X = A + 偏差(invalidity) + 误差(unreliability)。一个看得见的X由三个看不见的部分组成。
5 U; Y2 h$ B$ r: Y
' _3 A3 h$ `6 j1 d, [0 H+ G这是否意味着我们可能不应该期待X与Y之间高度相关,否则它们可能是同一个construct的measurement?但实际上可能存在高度相关却又不 同construct的例子,如对加速度的测量和对力的测量是高度相关的,但是这是两个construct。如何解决这种情况?
$ z3 B7 L' A7 F, I4 h# F
8 i- D6 E& J( j我们很少从一个研究来「肯定」一个测量工具的有效性(上面讲了)。通常是刚刚相反,我们会从一个研究来「怀疑」一个测量工具的有效性。如果你说X与Y分别是测量A与B,但是X与Y的相关是0.9,我会「怀疑」其中一个(通常是后来发展的、证据没有这么多的一个)有问题。那是不是就一定已经判了死刑呢?自然不是!作为一个研究者,如果你有本事可以提出证据来,我会接受的。什么证据呢?比如,A与B是不用的構念,理论上肯定有一些A的前因或后果是与B完全不同的。比如A影响C,但是B不会。那你就可以用X与Y跟那些構念测量来相关,我会发现r(A,B) 很高,r(A,C)明显大于0, r(B,C)接近或等于0。看见这个与理论符合的观察,我就开始考虑A与B虽然相关很大,但是可能是在测两个構念。当然,一个研究算不了什么,多看几次类似的结果(尤其是不同的C),那我就信服了。不过,我还是要补一句。现实归现实。除了是测量同一个構念的两个测量外,在社会科学中「绝少」看见有不同的構念的相关到0.8的。
: c- g0 p# o6 w# }0 z3 t8 D3 y |
|