- 最后登录
- 2011-6-6
- 注册时间
- 2011-5-13
- 威望
- 0
- 金钱
- 54
- 贡献
- 34
- 阅读权限
- 20
- 积分
- 88
- 日志
- 0
- 记录
- 0
- 帖子
- 18
- 主题
- 1
- 精华
- 0
- 好友
- 0
- 注册时间
- 2011-5-13
- 最后登录
- 2011-6-6
- 积分
- 88
- 精华
- 0
- 主题
- 1
- 帖子
- 18
|
Hi all,$ C4 E( x. ~ n8 c$ V0 c
% ~2 g: E) g# X: X 近期在学习SEM的有关内容,找到了这个圈子,拜读了不少帖子,受益良多。* L4 h* N- H! P1 N# d+ V( p& ~. i& T
我也发现一个现象,大家更多的是关注SEM模型的操作问题,而较少讨论问卷设计质量的问题。在我学习SEM的过程中,有两个关于问卷设计质量的问题,感到比较困惑。在这里提出来,寻求帮助和讨论。, m$ u2 w( P% F2 ]6 Y+ @
7 W6 n, [. H( E2 J- g; [5 A
1.关于李克特量表的使用5 a# o4 m& E/ s
在社会科学研究中,广泛使用了李克特量表开展问卷调查。李克特量表是一种模糊表达的量表,可以认为是定性的,而不是定量的。比如说:从非常不喜欢到非常喜欢、从非常少到非常频繁或非常多、很不满意到非常满意等等。有的时候也使用了定量的问卷,比如说被访问对象的行为频次,可能按照0-2、3-10、10-20等等划分为几个等级,这类定量的问卷不存在模糊性。- d* g* A7 P6 G5 I3 d# i+ J
同一个被访问对象,对于一份问卷中不同的模糊表达,其评判感受的准则可能不一样。例如,被访问对象可能在稍微有一点点麻烦就感到非常不满意,而做了3-5件好事就觉得自己做了非常多的好事。同样,不同的被访问对象,对同一个问题项的评价也是不同的,有的认为几十的区间范围内就算很多,有的认为需要到几万才算很多。
( W2 b6 g: z$ b2 i 上面所说的现象,是我在最近的访谈中遇到的真实的事情。我请被访问对象就北京有多少家SP做一个估计评价,大多数人对SP的数量并没有准确的认识,在定性模糊表达的时候给予的反馈都是“很多”,在我进一步要求其对“很多”做一个数量级的估计的时候,有的人说怎么也得几十家,也有的人说得有上万家。可见他们对定性的问卷的评价标准极不相同。
- [; ~+ s) ^9 a, H' x4 T1 s( S 个体对不同问卷题项的评价标准的差异,以及不同个体对相同问卷题项评价标准的差异,在SEM分析中带来一个问题,这个问题我感觉比较严重。SEM自身基于协方差做分析,也可以说是基于个体对问题项的感受的分布来开展分析的。这里,我的看法,隐含了一个基本假设是,各个个体对同一问题项的评价标准是一致的。比如说,大家都认为SP的数量到了2000家以上以后才能称之为很多,而几十家SP应该是很少。如果个体对同样的问题项的评价标准不一致,就产生了所谓的“评分者信度”的问题,问卷题项的分布或者说协方差相应发生了变化,SEM输出的路径系数的有效性必然受到影响。而在一般的问卷调查中,恰恰都没有考虑“评分者信度”问题,现有的效度和信度分析是无法考察“评分者信度”的。3 r7 [/ e5 t# f4 ]
为了说的更明白一些,我举一个例子。假设有两个被调查对象,甲和乙。我需要考察被调查对象对商场的服务的满意度和其消费行为之间的关系。采用李克特量表做定性的模糊问卷:甲对服务的要求比较高,稍有不合意之处就很不满意,其一周到商场购物的次数在2-3次,但甲认为其2-3次的购物次数已经很高了,他一周内很少到其他的同一商场2-3次;乙到服务的要求比较低,其一周到商场6-7次,但他认为6-7次的购物次数并不是很高。于是,甲对问卷的回答是“很不满意”和“频繁”,乙对问卷的回答是“满意”和“不是很频繁”。很明显,根据这个问卷调查结果作出的判断,会对研究者产生误导。
. Y7 G) ^0 ]0 i& x6 T+ I/ K( a 这个例子有点极端,有的朋友会说可以把问卷中行为次数题项修改为对实际次数的度量。这里我不想去讨论这个问题,毕竟很多问卷有的时候是难以采用定量的方式的,而且采用定量问卷需要被访问对象仔细统计其实际行为,会导致其抵触心理。这个例子只是举例说明这个问题,想请熟悉的朋友指导一下,或者推荐一些在这方面分析讨论的文献。: ^ B; P9 c' j' w, _6 z3 S7 O
最终希望搞清楚的问题是:
- J) s+ m E$ j! x$ H( C a.这里的“评分者信度”问题,有没有合适的方法尽量克服?如果有,代价多大?9 K) Y7 \ u6 z1 |- {7 A8 c* H% L
b.评分者信度,对于路径系数到底有多大的影响?
5 t1 h! L9 o. {. V$ Q6 h2 c- K
! ]" U, O7 p) j# X2.关于效度的讨论
% S" R6 m f+ F8 y0 A$ a 信度和效度,往往作为问卷质量评价的标准。但对于效度,我存在一个疑惑,那就是对问卷结果的效度评价,到底是以全部问题项来开展分析,还是以某一个或几个潜变量的问题项来开展分析。
8 t3 |1 d% M! T8 P/ F% C: j 在大多数介绍问卷调查的书中,都是以一个或几个潜变量的问题项来开展分析的,这些潜变量的问题项都是为了说明一个相同的潜变量的。简言之,对多个潜变量的情形,多个潜变量往往是一级潜变量,本身作为同一个二级潜变量的结果来看待。比如,影响消费者购买行为的属性,可能有商品的有用性、娱乐性、社会身份地位或者个性情感的展示等等。如果我们从理论上建构,划分出这4个方面,并且问卷设计也是围绕这四个方面,那么在做效度分析的时候,如果分析得到的4个因子和理论上划分的4个维度是吻合的,就认为问卷结果是有效度的。# i- m k$ g) h. }
但是,在很多文献中,其问卷的效度分析是以全部的问卷题项为基础的,而这些问卷题项所表达的潜变量之间又可能有很强的因果关系,产生效度分析的结果和路径系数分析的结果相违背的问题。举个例子,假设用户消费者感受到的有用性和购买的量之间有很强的因果关系,假设标准化的路径系数达到0.8-0.9,但有用性和购买的量明显不存在共同的二级潜变量。如果将有用性和购买的量两个潜变量的观测项放到一起来做效度分析,我想由于其因果的相关性过强,效度估计的结果应该不会很好。但很多文献给出来的则恰恰相反,在做效度分析的时候,全部观测变量可以由两个因子来表示,其中一个因子代表有用性,另一个因子代表购买的量。有用性因子对有用性的观测项的贡献很大,对购买的量的观测项贡献很小;同样,购买的量因子对购买的量的观测项的贡献很大,对有用性的观测项的贡献很小。因而,文献认为,问卷结果的效度很强。我的看法,这表明两个潜变量的相关性很小。而在最后的路径分析结果中,有用性潜变量对于购买的量潜变量的路径系数非常大,也就是两个潜变量的相关性很大。# \6 A/ z. v$ B
这让我很是困惑,这些分析结果是否符合逻辑,抑或者是我的理解错误?
- v' D2 Z: @+ Q' x. [* d0 c1 @$ s6 ~( W" [; Y5 K/ G
两个问题,请大家指点迷津,或者能够引出其他的一些问题来,谢谢!
0 }, m7 Y1 A, K* P- o$ S6 D |
|