- 最后登录
- 2016-11-27
- 注册时间
- 2003-1-21
- 威望
- 250
- 金钱
- 16832
- 贡献
- 11934
- 阅读权限
- 255
- 积分
- 29016
- 日志
- 4
- 记录
- 0
- 帖子
- 1438
- 主题
- 69
- 精华
- 0
- 好友
- 380
    
- 注册时间
- 2003-1-21
- 最后登录
- 2016-11-27
- 积分
- 29016
- 精华
- 0
- 主题
- 69
- 帖子
- 1438
|
本帖最后由 Kenneth 于 2011-10-18 11:28 编辑
: c, q. q$ a1 A1 n) y. O* Hwfldragon 发表于 2011-10-17 14:07 ![]()
2 b" c) X& v9 j, a: k! P( X多谢Kenny百忙中的回复!
" B/ h/ _. ^4 h: z- a, k+ D& X: O/ K那我直接问您我的两点疑问吧:
" ]6 b* m: p- E, N(1)虽然效度用来衡量item与construct之间的关系 ... 3 C8 x& X8 ~+ W1 T( R6 A t% `" A
Wfldragon,我的回应在下面:
0 n$ A* {8 `' w, L& ?( _ g7 _(1)虽然效度用来衡量item与construct之间的关系,而信度用来衡量item在测量中的准确程度,但是,由于无论真值还是construct 都是未知的,那么如何在实际操作中区分信度与效度?在数学表达上应该都是相关性的测量,那么协方差和信度之间的区别很大吗?9 \$ ]' }. O6 x
# G1 R9 w$ o {1 t; G: [' y
信度(reliability)是随机测量误差;效度(validity)是固定的测量偏差。一支坏了的温度计可以对沸水测出的温度每一次都是摄氏104度,效度很低,但是信度等于1。协方差(我猜你是讲相关系数)是效度(不是信度)的一种方法而已。 Content validity 不是用相关的。Discriminant validity 区分效度 和 convergent validity 聚敛效度是特别的相关,是跟已知的测量的相关。) ~( t9 p/ f- p* a# f
% ^9 i1 b; X8 A0 G- s(2)进一步的问题是,如果考虑极端情况,凭什么说两个construct之间的关系不是一个construct的两个item之间的关系?比如以下情形(A、B为construct,xi、yi是item,Q为效度,E为信度): 1 G+ @3 Z i$ s$ g
A=X1+X2+Oa+Ea
( D( @# H' S7 o0 r& M5 k% |) U) sB=Y1+Y2+Y3+Ob+Eb , F5 c! E' l, I1 }% N% R2 I2 d
我们的目标是分析A和B的关系,但是实际中往往要转化成X与Y的关系,那么如果X1与Y1高度相关的话凭什么判断它们之间的这种关系是A与B的关系,而不 是同一个construct(比如是C)里面的两个item之间的关系。简言之,我们凭什么对两个未知的construct之间的区别那么肯定?. s0 J8 k' c9 t3 Z2 R3 a' r/ N
5 H0 B# p; [, `
凡是用第三个構念(或是它的测量)来决定一个测量的有效性的(比如是 criterion validity),都要有强而明显的理论作为根据的。如果(从理论的角度)根本不清楚B是什么,又没有好的测量B的工具(比如是Y),你怎么会用X(你说是测量構念A的工具)跟Y相关呢?我们讲这一套测量的东西,都有一个假设,就是文献已经有一些作为我们参考的测量工具。那它们是如何来的呢?我相信是很多年的、各方面的研究都支持这些测量的工具的有效性。如果一个测量是有问题的,慢慢我们从研究的数据中就会发现问题,比如应该相关的不相关,跟其他構念的测量相关太大等。
1 O: w) ~* B* m注:你的写法是错的。只有X=f(A),概念上没有A=f(X)的(自然数学上是可以)。因为X是看得见的,A是看不见的。所以永远是 X = A + 偏差(invalidity) + 误差(unreliability)。一个看得见的X由三个看不见的部分组成。
& y! U4 H- N: J, e
2 H# J2 V! e8 g- ]% M* F这是否意味着我们可能不应该期待X与Y之间高度相关,否则它们可能是同一个construct的measurement?但实际上可能存在高度相关却又不 同construct的例子,如对加速度的测量和对力的测量是高度相关的,但是这是两个construct。如何解决这种情况?5 D- \) F' V3 v
1 ?, J6 h: p. P, V我们很少从一个研究来「肯定」一个测量工具的有效性(上面讲了)。通常是刚刚相反,我们会从一个研究来「怀疑」一个测量工具的有效性。如果你说X与Y分别是测量A与B,但是X与Y的相关是0.9,我会「怀疑」其中一个(通常是后来发展的、证据没有这么多的一个)有问题。那是不是就一定已经判了死刑呢?自然不是!作为一个研究者,如果你有本事可以提出证据来,我会接受的。什么证据呢?比如,A与B是不用的構念,理论上肯定有一些A的前因或后果是与B完全不同的。比如A影响C,但是B不会。那你就可以用X与Y跟那些構念测量来相关,我会发现r(A,B) 很高,r(A,C)明显大于0, r(B,C)接近或等于0。看见这个与理论符合的观察,我就开始考虑A与B虽然相关很大,但是可能是在测两个構念。当然,一个研究算不了什么,多看几次类似的结果(尤其是不同的C),那我就信服了。不过,我还是要补一句。现实归现实。除了是测量同一个構念的两个测量外,在社会科学中「绝少」看见有不同的構念的相关到0.8的。
# M K4 A7 E) ^" Y |
|