设为首页 登录 注册
首页 中人社区 中人博客
查看: 6627|回复: 23
打印 上一主题 下一主题

求教讨论:有关问卷设计质量的问题

  [复制链接]

1

主题

6

听众

88

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2011-5-13
最后登录
2011-6-6
积分
88
精华
0
主题
1
帖子
18
跳转到指定楼层
楼主
发表于 2011-5-13 23:37:47 |只看该作者 |倒序浏览
Hi all," M6 s# U# \+ W* c

, ]  _1 F& x7 o! L# p    近期在学习SEM的有关内容,找到了这个圈子,拜读了不少帖子,受益良多。
5 g$ T4 v2 l3 M3 f# r! q    我也发现一个现象,大家更多的是关注SEM模型的操作问题,而较少讨论问卷设计质量的问题。在我学习SEM的过程中,有两个关于问卷设计质量的问题,感到比较困惑。在这里提出来,寻求帮助和讨论。  b# V: l; ~- u  J' S
7 B/ i! z0 D9 d. S5 j( c
1.关于李克特量表的使用& L" c9 M+ ^; T' F; W$ ^, A- T
    在社会科学研究中,广泛使用了李克特量表开展问卷调查。李克特量表是一种模糊表达的量表,可以认为是定性的,而不是定量的。比如说:从非常不喜欢到非常喜欢、从非常少到非常频繁或非常多、很不满意到非常满意等等。有的时候也使用了定量的问卷,比如说被访问对象的行为频次,可能按照0-2、3-10、10-20等等划分为几个等级,这类定量的问卷不存在模糊性。' J5 |7 Y# _$ ]9 s' r2 a+ O
    同一个被访问对象,对于一份问卷中不同的模糊表达,其评判感受的准则可能不一样。例如,被访问对象可能在稍微有一点点麻烦就感到非常不满意,而做了3-5件好事就觉得自己做了非常多的好事。同样,不同的被访问对象,对同一个问题项的评价也是不同的,有的认为几十的区间范围内就算很多,有的认为需要到几万才算很多。: |0 x2 R9 a8 Q, ]
   上面所说的现象,是我在最近的访谈中遇到的真实的事情。我请被访问对象就北京有多少家SP做一个估计评价,大多数人对SP的数量并没有准确的认识,在定性模糊表达的时候给予的反馈都是“很多”,在我进一步要求其对“很多”做一个数量级的估计的时候,有的人说怎么也得几十家,也有的人说得有上万家。可见他们对定性的问卷的评价标准极不相同。" h7 b( G! ~% V1 Z
    个体对不同问卷题项的评价标准的差异,以及不同个体对相同问卷题项评价标准的差异,在SEM分析中带来一个问题,这个问题我感觉比较严重。SEM自身基于协方差做分析,也可以说是基于个体对问题项的感受的分布来开展分析的。这里,我的看法,隐含了一个基本假设是,各个个体对同一问题项的评价标准是一致的。比如说,大家都认为SP的数量到了2000家以上以后才能称之为很多,而几十家SP应该是很少。如果个体对同样的问题项的评价标准不一致,就产生了所谓的“评分者信度”的问题,问卷题项的分布或者说协方差相应发生了变化,SEM输出的路径系数的有效性必然受到影响。而在一般的问卷调查中,恰恰都没有考虑“评分者信度”问题,现有的效度和信度分析是无法考察“评分者信度”的。- c, [+ Z# R3 p/ _! A, q! u
    为了说的更明白一些,我举一个例子。假设有两个被调查对象,甲和乙。我需要考察被调查对象对商场的服务的满意度和其消费行为之间的关系。采用李克特量表做定性的模糊问卷:甲对服务的要求比较高,稍有不合意之处就很不满意,其一周到商场购物的次数在2-3次,但甲认为其2-3次的购物次数已经很高了,他一周内很少到其他的同一商场2-3次;乙到服务的要求比较低,其一周到商场6-7次,但他认为6-7次的购物次数并不是很高。于是,甲对问卷的回答是“很不满意”和“频繁”,乙对问卷的回答是“满意”和“不是很频繁”。很明显,根据这个问卷调查结果作出的判断,会对研究者产生误导。+ H. A: U3 |4 d5 d% z
    这个例子有点极端,有的朋友会说可以把问卷中行为次数题项修改为对实际次数的度量。这里我不想去讨论这个问题,毕竟很多问卷有的时候是难以采用定量的方式的,而且采用定量问卷需要被访问对象仔细统计其实际行为,会导致其抵触心理。这个例子只是举例说明这个问题,想请熟悉的朋友指导一下,或者推荐一些在这方面分析讨论的文献。1 {# D7 m& N8 K1 L2 ]6 G
    最终希望搞清楚的问题是:
5 m1 ~3 }0 p4 ?, ]    a.这里的“评分者信度”问题,有没有合适的方法尽量克服?如果有,代价多大?4 @: x9 K8 [8 ~1 ^
    b.评分者信度,对于路径系数到底有多大的影响?# @& r& k# F; o+ p3 H+ w

, o, ?7 B  p1 `$ p( l+ t2.关于效度的讨论
* \6 p3 f" n0 f/ ?1 J    信度和效度,往往作为问卷质量评价的标准。但对于效度,我存在一个疑惑,那就是对问卷结果的效度评价,到底是以全部问题项来开展分析,还是以某一个或几个潜变量的问题项来开展分析。- F3 O4 k, |9 f
    在大多数介绍问卷调查的书中,都是以一个或几个潜变量的问题项来开展分析的,这些潜变量的问题项都是为了说明一个相同的潜变量的。简言之,对多个潜变量的情形,多个潜变量往往是一级潜变量,本身作为同一个二级潜变量的结果来看待。比如,影响消费者购买行为的属性,可能有商品的有用性、娱乐性、社会身份地位或者个性情感的展示等等。如果我们从理论上建构,划分出这4个方面,并且问卷设计也是围绕这四个方面,那么在做效度分析的时候,如果分析得到的4个因子和理论上划分的4个维度是吻合的,就认为问卷结果是有效度的。
0 A/ b8 ~; b8 N# o    但是,在很多文献中,其问卷的效度分析是以全部的问卷题项为基础的,而这些问卷题项所表达的潜变量之间又可能有很强的因果关系,产生效度分析的结果和路径系数分析的结果相违背的问题。举个例子,假设用户消费者感受到的有用性和购买的量之间有很强的因果关系,假设标准化的路径系数达到0.8-0.9,但有用性和购买的量明显不存在共同的二级潜变量。如果将有用性和购买的量两个潜变量的观测项放到一起来做效度分析,我想由于其因果的相关性过强,效度估计的结果应该不会很好。但很多文献给出来的则恰恰相反,在做效度分析的时候,全部观测变量可以由两个因子来表示,其中一个因子代表有用性,另一个因子代表购买的量。有用性因子对有用性的观测项的贡献很大,对购买的量的观测项贡献很小;同样,购买的量因子对购买的量的观测项的贡献很大,对有用性的观测项的贡献很小。因而,文献认为,问卷结果的效度很强。我的看法,这表明两个潜变量的相关性很小。而在最后的路径分析结果中,有用性潜变量对于购买的量潜变量的路径系数非常大,也就是两个潜变量的相关性很大。
' m1 @% S' p" F1 m  x' X, g    这让我很是困惑,这些分析结果是否符合逻辑,抑或者是我的理解错误?# J% V6 `1 q" Z- j" m, `

- _0 ^$ C0 f3 c. ~两个问题,请大家指点迷津,或者能够引出其他的一些问题来,谢谢!
5 `9 ~7 H* U4 G+ P- {

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

沙发
发表于 2011-5-16 23:04:30 |只看该作者
回复 1楼 zhmseven 的帖子
# H7 B% P; w$ I% Uzhmseven,) Z% `- B/ E, M- B
1. 你是一个很有心思的人,很好。
4 D. n' h2 E( ]李克特量表是一种模糊表达的量表,可以认为是定性的,而不是定量的。
6 [! O& f; [% b" B李克特量表明明是用一个等差量表,我们却把它当成是等比量表来用。这是对的。但是这是量化研究的限制,没什么可以做。
1 F6 j6 l% B  f有的时候也使用了定量的问卷,比如说被访问对象的行为频次,可能按照0-2、3-10、10-20等等划分为几个等级,这类定量的问卷不存在模糊性。* k2 g. T9 w, w3 l' v6 x" \
这一句却不对,我不会容许学生这样做的。有去浙大听我课的同学就知道了。
$ b+ {6 c9 F4 U& B, _4 m% k同一个被访问对象,对于一份问卷中不同的模糊表达,其评判感受的准则可能不一样。
6 ~) S1 D# S: A: |! K' B这一点我们可以做统计控制,比如用affectivity或是impression management作为控制变量。6 }7 o) [6 Z( l  q4 A
在我进一步要求其对“很多”做一个数量级的估计的时候,有的人说怎么也得几十家,也有的人说得有上万家。' S) N6 b7 E+ U% ?9 g! Z4 }2 T
这一点倒不是致命的问题。因为我们做的社会学研究一般关注的是方差与协方差。只要这个人在自变量与因变量同时用一样的标准,到底打1分=1,000或是打1分=200是没有分别的。  x# v6 W$ A  M; {8 }9 u0 C
举例来说明,比如X是收入,Y是消费,同时用5分量表,1很低,5很高。问题是你的收入(收费)有多高?' o# G1 f3 A3 E1 ]$ @+ g4 k
应答者A     收入打3分 (实际¥9000)  消费打1分 (实际¥3000);
) j' d. P: u  I  {应答者B     收入打5分 (实际¥100000)  消费打1分 (实际¥20000).9 W# z' }5 f1 @
3分在应答者A代表¥9000,5分在应答者B代表¥100000,原来是完全不成比例的,但是我们有兴趣的是相关(没有单位的统计量),你从上面的例子看到,问题应该不是很严重的。" G. v% t2 q* S- S0 j, y
如果个体对同样的问题项的评价标准不一致,就产生了所谓的“评分者信度”的问题
- F" B' z8 k* }$ k7 R+ E; K这是不对的,这里既没有信度的问题,也没有效度的问题。是测量单位的问题。我们用相关来分析时,已经把它尽量减轻了。3 `) o5 S. h2 `5 B
而这些问卷题项所表达的潜变量之间又可能有很强的因果关系,产生效度分析的结果和路径系数分析的结果相违背的问题。
/ _4 x5 ~! @; {9 c+ F& H我其实不太明白你这段话的意思。我的猜测是,你用了因子分析的结果作为一个构念的效度表征。如果这猜测是对的话,那是大大的错误。因子分析不可能告诉你一个构念的效度的。" b" z6 w5 l( N4 N( k& @
有用性因子对有用性的观测项的贡献很大,对购买的量的观测项贡献很小。。。。。。
7 y& Y' K8 U+ c这个我完全不明白、迷失了。什么叫「一个因子对自己的“观测项”贡献很大;对别的因子的“观测项”贡献很小」呢?如果“观测项”是indicator 的话,那么你是说一个因子(有用性)影响了另外一个因子(购买的量)的项目(indicator或是item)吗?这在SEM是禁止的。我有点惘然了。
: W. X% D8 L5 F" m1 i! D) O3 z              - N( M3 w$ {2 P( S5 D
回复

使用道具 举报

1

主题

6

听众

88

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2011-5-13
最后登录
2011-6-6
积分
88
精华
0
主题
1
帖子
18
板凳
发表于 2011-5-22 11:20:05 |只看该作者
Hi Kenneth,
( d4 l5 a+ u6 O" f! G5 F谢谢你的回答,您提到不允许对被访问对象采用定量数据的方式构成量表,我找找您在浙大的课件,学习学习。不过,在很多的paper中,采用的确实是定量数据方式的量表,不同的被访问对象回答同一个问题的时候,采用的评判标准基本是一致的。您提到采用控制变量做统计控制,确实提醒了我,我也发现一些paper采用了这类方法。谢谢!! v4 Q& E5 \0 S" B# x/ e
不过您提到:
# K4 l0 P* a! `$ {, Y因为我们做的社会学研究一般关注的是方差与协方差。只要这个人在自变量与因变量同时用一样的标准,到底打1分=1,000或是打1分=200是没有分别的。举例来说明,比如X是收入,Y是消费,同时用5分量表,1很低,5很高。问题是你的收入(收费)有多高?
4 Z# Y. n9 {; N9 x/ i6 ~; K' ^. z应答者A     收入打3分 (实际¥9000)  消费打1分 (实际¥3000)
" t; ^. r# P  \应答者B     收入打5分 (实际¥100000)  消费打1分 (实际¥20000).) 6 V5 J, Q# q" b5 v- X. Y
3分在应答者A代表¥9000,5分在应答者B代表¥100000,原来是完全不成比例的,但是我们有兴趣的是相关(没有单位的统计量),你从上面的例子看到,问题应该不是很严重的。
0 K' Z; F, y1 g  m0 u" `6 h( m9 H$ g" \
我有一些疑问:您举的例子中,收入和消费衡量的都是金额的多少,同一个被访者对于两类名义上不同的概念(收入和消费)、但实质上雷同(钱的金额的多少),其很可能采用同样的评价标准。但对于我在原帖中举的例子,比如说满意度(自变量)、购物次数(因变量),我们能够肯定同一被访问对象对这两者的评价标准是一样的吗?我觉得好像不能。
! J7 h, Z; i; f; B8 f, S: l我其实不太明白你这段话的意思。我的猜测是,你用了因子分析的结果作为一个构念的效度表征。如果这猜测是对的话,那是大大的错误。因子分析不可能告诉你一个构念的效度的。- o7 P  n3 |; h  ~  d
您的理解是对的,我表达的是这个意思。我在很多paper和书籍中,都发现采用因子分析的方法做效度分析的表述。我附上一篇采用这种方法的文献(实际上我发现很多文献采用这种方法,这里只是随附一篇),,P44左下角的结果分析文字。" o+ ]0 G  g! J2 d
这个我完全不明白、迷失了。什么叫「一个因子对自己的“观测项”贡献很大;对别的因子的“观测项”贡献很小」呢?如果“观测项”是indicator 的话,那么你是说一个因子(有用性)影响了另外一个因子(购买的量)的项目(indicator或是item)吗?这在SEM是禁止的。我有点惘然了。& ~; D# d" {) J/ D" [; |
这也正是我迷惑的地方,在我所附的论文中就有这方面的描述。您可以看看,并做一个评述。
/ h3 J3 W6 u  N8 x  h$ H/ P

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

回复

使用道具 举报

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

地板
发表于 2011-5-22 22:28:24 |只看该作者
回复 3楼 zhmseven 的帖子
  a1 ~& X/ _6 Y# T. _$ Bzhmseven,
$ N6 q- C& E/ t我有一些疑问:您举的例子中,收入和消费衡量的都是金额的多少,同一个被访者对于两类名义上不同的概念(收入和消费)、但实质上雷同(钱的金额的多少),其很可能采用同样的评价标准。但对于我在原帖中举的例子,比如说满意度(自变量)、购物次数(因变量),我们能够肯定同一被访问对象对这两者的评价标准是一样的吗?我觉得好像不能。+ [& O# `, s+ @/ W* I
相关分析的基础是协方差。协方差是当X变的时候,Y如何的随着X的改变而改变。当X是满意度,Y是购物次数时,协方差是当一个人的满意度离开所有人的满意度的平均是多少时,这个人的购物次数将会离开所有人的购物次数的平均多少。比如一个非常严谨的低估所有值的人,收入是¥9,000,而所有人的收入的平均是¥10,000(比如),这个严谨的人可能只打1分。一个同样的严谨的人当买10件时(相对于所有的人的总平均是12件),他不可能打4到5分的。正常的情形他应该打1到2分。把所有的人算进来,误差就是回归分析的残差了。所以整个分析还是合理的。! W4 O. H- ]3 D* M+ M
0 J1 m( R7 c0 S+ U
您的理解是对的,我表达的是这个意思。我在很多paper和书籍中,都发现采用因子分析的方法做效度分析的表述。3 Z& _# L9 K8 g4 F1 S
这个不叫convergent和discriminant validity。我在浙大才刚刚讲过。如果我有四个项目,前两个是测满意度的,后两个是测公平感的。项目是:" v8 l. @& u' N
1. 我是一只狗。+ W, L* V2 B, J! }
2. 我是一头猪。
+ D- o0 g* `# [, x" r7 k3. 我觉得我的企业还是公平的。
% e+ _5 N" s- N, e  R* S4. 我的主管公平待人。
( W- h( v7 p- r) }: S1 `2 A如果我做因子分析的话,我可以保证1和2会在一个因子;3和4会在另外一个因子。我证明了1和2是测满意度的吗?
" V  z& X1 L, u* y
7 |; ^$ O/ X) B2 E! ]$ a
这也正是我迷惑的地方,在我所附的论文中就有这方面的描述。您可以看看,并做一个评述。
$ z! |' _& q8 @' g' m& [. U我留着这篇文章,请告诉我你指的是哪一页的哪一行的分析。, ~4 N# ^' L/ x& ]8 g7 h
9 l9 v6 J8 x. f6 |0 Y) G) C2 Q0 k
   
回复

使用道具 举报

1

主题

6

听众

88

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2011-5-13
最后登录
2011-6-6
积分
88
精华
0
主题
1
帖子
18
5
发表于 2011-5-23 22:00:06 |只看该作者
我留着这篇文章,请告诉我你指的是哪一页的哪一行的分析。
) z5 V, e( Y# i/ op.44 column 1的倒数第三段和倒数第一段到clolumn 2的前几行。, m5 h! Q" T. A& m

+ s6 p3 {* z+ c' i/ x' p相关分析的基础是协方差。协方差是当X变的时候,Y如何的随着X的改变而改变。当X是满意度,Y是购物次数时,协方差是当一个人的满意度离开所有人的满意度的平均是多少时,这个人的购物次数将会离开所有人的购物次数的平均多少。比如一个非常严谨的低估所有值的人,收入是¥9,000,而所有人的收入的平均是¥10,000(比如),这个严谨的人可能只打1分。一个同样的严谨的人当买10件时(相对于所有的人的总平均是12件),他不可能打4到5分的。正常的情形他应该打1到2分。把所有的人算进来,误差就是回归分析的残差了。所以整个分析还是合理的。
! c; N: ^! h+ R# L+ M0 m3 n( A4 N$ B我注意到你这里使用的“严谨的人”这个词,我想这个词的含义是,个体对不同的问题项的评判准则是一致的,或者说近似一致。正如你说的,个体在多个问题项上的表现均低于平均值时,他对各个问题项的打分都应该比较低。这里就暗示了这样一个假设:个体对问题项的打分,其评判准则是其相对于群体的平均而言的。当相对于群体的平均偏离较远时,打分就必然很高或者很低。只有这样,我才能得到你上面所举的例子的结论。* U. ?  i  s6 w) s5 o7 M
我的疑问是,事实真的是那样的吗?正如我在一开始提到的,我在询问不同个体对SP数量多少的感知时,所有人的回答都是“很多”。但是,一旦量化到具体的数值上,各个个体的差别达到3个数量级(从几十到几万)。很显然,这里各个个体的评判标准差别非常大。我们还可以拿收入来举例,农民可能感觉月收入5000以上就非常高了,事实上在北京这样的城市也有很多人认为月收入5000以上是很高的。但是对于很多人来说,5000的月收入感觉就非常低了。也就是说,个体对问题项的打分并不一定遵循上面的假设。. z# F0 [/ ~; r! f: P# i) m% o
我认为,上述假设的一个基本前提是个体对于其他个体的打分的分布函数有清楚的了解,类似于经济学中的完全信息了。按照你所提到的,就是个体知道自己偏离群体的平均的状态,知道特定问题项上自己在群体中所处的位置。如果个体并不知道自己所处的位置呢?以收入为例,很多人关心的是相对于自己身边人的收入而言,自身的收入高低,而不是相对于社会平均收入而言的,他也很可能并不知道社会平均收入是多少。个体的评判标准是在自己圈子里面,自己收入所处的位置。但是,每一个人由于其自身的收入和社会地位的不同,他所处的圈子的收入也会存在一些比较明显的差别,这就导致不同社会身份的个体对收入的高低的评判准则存在比较大的差别。但对于另一些问题项,不同社会身份的人的评判准则又可能是比较接近的,因为各个圈子在某些问题项上的均值没有明显的差别。这个时候,采用李克特量表的问卷调查的方式,是否真的能够很好用于实证分析吗?
% g/ ]/ m8 P: F% O; b! h采用group的方式可能能够解决这个问题,但是很多时候我们没有足够的理由和判断准则,确定是否需要采用group的方法。比如说,我的例子中感知到的SP数量的多少,我们没有理由猜测哪些特征的人会认为几十家SP就比较多了,哪些特征的人认为几万家SP才算多。
# k1 d7 R/ d; o( y; M* Q3 U
回复

使用道具 举报

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

6
发表于 2011-5-24 13:58:57 |只看该作者
1. “p.44 left column at the end” 那里讲的是convergent 与 discriminant validity的问题,我已经回应了。我问在哪里的是:
( ^1 b# J$ K: E这个我完全不明白、迷失了。什么叫「一个因子对自己的“观测项”贡献很大;对别的因子的“观测项”贡献很小」呢?如果“观测项”是indicator 的话,那么你是说一个因子(有用性)影响了另外一个因子(购买的量)的项目(indicator或是item)吗?这在SEM是禁止的。我有点惘然了。这个问题。作者在那里提到这样的东西?2 X2 o; `, n! \/ S' c9 q
. n0 b2 l" F9 }. T+ [1 \: v5 f
2. 我猜你部分的问题是不明白(或是不同意?)相关分析的逻辑。相关分析有兴趣的是“标准化以后的”协方差。我们用什么单位不会影响结果的。比如我们研究身高与体重的相关。你可以用厘米来量身高,那么人与人的差可能是几十厘米。你用「米」来测的话,人与人的差就是0.0几米的分别。但是,相关是标准化的,所以用什么单位不会影响结果的。
  O7 A0 u/ X  {) O# u- S1 L, ]
* F. w6 w7 R! F, w; m3 ?3. 统计给我们的答案是或然性的。我们是容许误差的。就算一个人很有偏差,只要大部分的人的反应是“同方向”的(就是X大时,Y就大),我们就可以看见相关。# @5 O& b) f+ ^5 N* l. U0 p
# H- S! J$ J( l! @& [
4. 最后,如果你怀疑一个人对自己与平均的差有不同的看法,以至于有一些会有估计的误差的话,第一,这是一个假设,需要证据来证明。第二,如果你讲的是对的话,我们应该看不见任何相关才对,或者是用不同的测量的信度很低才对,有这样的证据吗? 本帖最后由 Kenneth 于 2011-5-24 14:38 编辑
1 c3 x5 d3 o. K! h5 N! q* [" i( b! r! ?2 [8 c' q8 P. D. F8 Q' z
回复

使用道具 举报

1

主题

6

听众

88

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2011-5-13
最后登录
2011-6-6
积分
88
精华
0
主题
1
帖子
18
7
发表于 2011-5-25 00:24:19 |只看该作者
1. “p.44 left column at the end” 那里讲的是convergent 与 discriminant validity的问题,我已经回应了。我问在哪里的是:
5 D' N$ H& J5 u. M; e! v这个我完全不明白、迷失了。什么叫「一个因子对自己的“观测项”贡献很大;对别的因子的“观测项”贡献很小」呢?如果“观测项”是indicator 的话,那么你是说一个因子(有用性)影响了另外一个因子(购买的量)的项目(indicator或是item)吗?这在SEM是禁止的。我有点惘然了。这个问题。作者在那里提到这样的东西?
/ d  J/ e/ L" `$ {7 R2 A8 k
[zhm]抱歉,这个地方是我的表述有误。准确的讲,我想要问的是:以因子负荷的方式,考察问卷的收敛效度和区别效度,是否适用于存在前后因果关系的不同构念?如果说对于同一个构念的不同维度,比如说工作满意度中的主管满意度、同事满意度等,采用因子分析方法来考察收敛效度和区别效度,这个很好理解。而像文献中意图和态度两个构念本身是存在因果关系的,采用因子分析的方法得到的结论是,某一个因子在意图的问题项上的负荷很大,但在态度的问题项上的负荷很小,反之亦然。如果作者采用的是正交化的因子的话,我不知道这个结论可不可以理解为,由于两个因子是正交的,态度和意图之间的相关性比较小?但从SEM分析的结果来看,意图和态度之间的相关性达到0.71,和因子分析的结果是不是存在矛盾?
  W) G4 D6 x1 ~1 K( \! i9 ~. L" g5 X. c& q' S
2. 我猜你部分的问题是不明白(或是不同意?)相关分析的逻辑。相关分析有兴趣的是“标准化以后的”协方差。我们用什么单位不会影响结果的。比如我们研究身高与体重的相关。你可以用厘米来量身高,那么人与人的差可能是几十厘米。你用「米」来测的话,人与人的差就是0.0几米的分别。但是,相关是标准化的,所以用什么单位不会影响结果的。# Q% ~0 S; w0 I7 s3 C& T2 q8 n3 L8 L- b9 J) U& p9 G- S  B' D
3. 统计给我们的答案是或然性的。我们是容许误差的。就算一个人很有偏差,只要大部分的人的反应是“同方向”的(就是X大时,Y就大),我们就可以看见相关。
0 T/ }: `! \' g% ?) f* @4. 最后,如果你怀疑一个人对自己与平均的差有不同的看法,以至于有一些会有估计的误差的话,第一,这是一个假设,需要证据来证明。第二,如果你讲的是对的话,我们应该看不见任何相关才对,或者是用不同的测量的信度很低才对,有这样的证据吗?
4 p# @- x( w4 A' q4 q5 J
对于第2个问题,我没有怀疑,我怀疑的是第3个问题。当然,正如你在第4点里所说的,这是一个假设,需要有证据来证明。我所想要了解的恰恰是:(1)之前有没有人研究过这个问题?(2)如果有研究,对这个问题的研究结论是什么,有没有研究(证据)支持你在第3点中的观点?如果可以支持,那么有没有研究分析这个影响到底有多大,或者说现有的SEM分析方法中就已经包含了相应的统计分析量?+ l3 {: i1 t- k7 o1 }
本帖最后由 zhmseven 于 2011-5-25 00:27 编辑 6 C& h# ~; H  K1 I0 t& s
+ y# _, l' e$ H) K- R" I
回复

使用道具 举报

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

8
发表于 2011-5-25 14:18:13 |只看该作者
回复 7楼 zhmseven 的帖子
( _: m' p7 P3 e+ ]( s( t6 Z0 x4 jzhmseven,- T- g# g1 [: _+ h. `
我想要问的是:以因子负荷的方式,考察问卷的收敛效度和区别效度,是否适用于存在前后因果关系的不同构念?2 S8 \; ?2 N  |
我已经讲过了,我们根本 “不可以” 用因子负荷的方式,考察问卷的收敛效度和区别效度。我不是举了一个「我是一只猫」「我是一头狗」的例子了吗?
) `6 Z# v: k1 Q
' @- k8 E, n: l0 z5 S: ^* b对于第2个问题,我没有怀疑,我怀疑的是第3个问题。当然,正如你在第4点里所说的,这是一个假设,需要有证据来证明。我所想要了解的恰恰是:(1)之前 有没有人研究过这个问题?(2)如果有研究,对这个问题的研究结论是什么,有没有研究(证据)支持你在第3点中的观点?如果可以支持,那么有没有研究分析 这个影响到底有多大,或者说现有的SEM分析方法中就已经包含了相应的统计分析量?" P- F; I1 i: I$ Y
是不是我的表达有问题呢?我觉得我已经讲得很清楚了,不知道还可以说什么?
1 \3 x. N# j' ^& ]) [. D1.        如果你讲的是对的话,我们应该看不见任何相关才对,或者是用不同的测量的信度很低才对。我们所有的研究都没有得到这样的结果。相反,只要理论合理,结果就是X与 y 有相关。
) I# J, g, j" J% J2.        如果你不喜欢这个证明的,一定要直接证明这个关系的研究的话,恐怕没有了,也不会有。因为 perception与 really 永远都是两个不同的構念。你要求的“研究”要把这两个东西等同,所有不一样都要是“误差”。我想大部分的学者都不会同意。麻烦的是这是一个「信念」,不可以证明的。. w$ F' @8 O( L3 L" W4 Y2 O" @, Z! ?
3. Likert scale  原来是一种 ordinal scale,我们是假设它是 interval scale 来用。你现在问的是它是不是ratio scale。我的回答自然「不是」,但是影响大吗?上面我已经讲了,无论看信度、效度,我们倒没有看见很大的问题。除非你说有一些特别的構念不可以这样的,那就要反过来,请你提证据证明你是对的了。
回复

使用道具 举报

1

主题

6

听众

88

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2011-5-13
最后登录
2011-6-6
积分
88
精华
0
主题
1
帖子
18
9
发表于 2011-5-25 23:08:17 |只看该作者
Kenneth,
, c# v, L3 [0 H我已经讲过了,我们根本 “不可以” 用因子负荷的方式,考察问卷的收敛效度和区别效度。我不是举了一个「我是一只猫」「我是一头狗」的例子了吗?
2 w  r6 `' g8 G' `/ O( X: U/ `, s: s+ }
我有点迷惑了,你在6楼讲论文中做的是convergent validity和discriminant validity,那我的理解是论文中采用的这种考察因子载荷的方法是没有问题的。为什么这里又说不可以呢?原文是这样的:“表3为旋转后的因子负荷矩阵,可以看出,交叉变量的因子负载没有超过0.5的,显示出良好的区分效度,并且各个项目在其相关联的变量上的因子负载值都大于0.5,具有良好的收敛效度”,很明显这里采用的就是因子分析的方法啊?  n2 v4 D  t2 I3 Y, \
@  E. Y) ?: W5 P" " A3 I: {+ |9 ?- T: N, V. w" e% E0 }: R. r0 ^! r: W6 l
1.        如果你讲的是对的话,我们应该看不见任何相关才对,或者是用不同的测量的信度很低才对。我们所有的研究都没有得到这样的结果。相反,只要理论合理,结果就是X与 y 有相关。7 J. c/ x# R0 t- S) B8 a
* N8 b$ \& G, k7 s# U  V- i2.        如果你不喜欢这个证明的,一定要直接证明这个关系的研究的话,恐怕没有了,也不会有。因为 perception与 really 永远都是两个不同的構念。你要求的“研究”要把这两个东西等同,所有不一样都要是“误差”。我想大部分的学者都不会同意。麻烦的是这是一个「信念」,不可以证明的。9
8 A+ g. _" ~6 l: h) L
第1点,我不太同意你的观点。原因有二:第一,我所讲的情况,对最终的分析结果的影响强弱我们并不能判断。有可能存在影响,但是影响并不是大到导致“看不见任何相关”,那么相关性应该还是存在的,只是相关性的大小发生了变化,采用量表形式得到的相关性和采用连续的数据得到的相关性是不同的。第二,我们不能以发表的paper中不存在这类问题来下结论,毕竟发表出来的paper最基本的要求是应该能够满足你所讲的信度、相关等要求。也许还有很多paper就此胎死腹中。当然,第二个原因本身没有太大意义,只是聊博一笑。( a0 X1 f! F4 `, G' n) X
第2点,我认同研究这个问题很难,至少是很麻烦。我这里谈一下我的思路,供批评:对有的构念,测量数据可以采用continuous data,比如说温度。如果说我们做这样一个实验:找到两个可以采用continuous data的构念,收集到其indicators的continuous data;然后再设计一个基于量表的调查问卷,收集到其indicators的interval data。利用这两份数据,分别估计其路径系数,应该就可以得到个案上的差异了。如果差异很大,比如由连续数据得到的路径系数根本就不在由量表数据得到的路径系数的置信区间内,我想就可以接受我提出的假设。
: i$ J; s( X9 V. F
回复

使用道具 举报

rwxld    

11

主题

4

听众

6296

积分

贡士

Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15Rank: 15

注册时间
2006-2-22
最后登录
2018-4-25
积分
6296
精华
0
主题
11
帖子
188
10
发表于 2011-5-25 23:33:38 |只看该作者
回复 9楼 zhmseven 的帖子, X6 I+ }  l/ q# m2 p
# ^# u% \4 T1 `5 D0 X
呵呵,第一个问题,我觉得现在主要成了一个观点问题。kenny认为因子分析不可以用来验证convergent validity 和discriminant validity,而你认为因子分析可以。我同意kenny。你同意那个文章的作者。3 O( ?4 u# }, W4 U# P9 O

! @  R: Q* \: o2 r5 x1 F+ q! w第二个问题,主要是数据刻度的问题。在一定程度上,刻度增加可能会有更多的变异,这是好消息。比如从2点量表(只有同意和不同意两个选项)变为6点量表,显然,后者的变异应该大一些。但如果由6点量表变为60点量表,数据的连续性为10倍,虽然变异也可能增大了一点,但增大的部分可能是误差的变异,而不是真正我们关注的变异(因为受试者很难分辨这么密集的数据差别,比如选35和选36的区别)。所以,我认为数据的连续性可能导致了一定的影响,但对相关关系影响甚小。
0 f' p, X0 `: B& m2 @9 a8 N* u) W1 v" f# k) {0 P) J, r6 a
菜鸟发言,欢迎指正。    本帖最后由 rwxld 于 2011-5-25 23:35 编辑
+ w1 m% k2 i0 z% p" a% R2 d8 ]
( D* S/ I1 p$ V$ b6 Q
回复

使用道具 举报