设为首页 登录 注册
首页 中人社区 中人博客
查看: 5682|回复: 14
打印 上一主题 下一主题

关于因子分析的问题

  [复制链接]

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
跳转到指定楼层
楼主
发表于 2010-12-5 21:28:08 |只看该作者 |倒序浏览
想请教两个问题:
  V1 y  `  ~3 u) x8 r, i  p第一,做因子分析时一般是保留loading高于0.45itemcross-loading高于0.3item吗?
$ t6 m/ c0 }5 J/ f" L' z+ ~$ F! ?, n第二,我查看您原来的博客关于探索性因子分析这部分的讨论,似乎讲到效度检验可能要用MTMM或效标效度,可是我好像记得文献中是用区别效度(discriminant validity)和聚合效度(convergent validity)。那么,一定要做效标关联效度的检验嘛?
% [4 N, K# q' s# ], ~5 E! C

3

主题

8

听众

382

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2010-7-10
最后登录
2018-2-10
积分
382
精华
0
主题
3
帖子
44
沙发
发表于 2010-12-6 09:07:09 |只看该作者
Hongyan,先试着回答一下你的问题:8 s$ Z/ L& y. a! r; M! v$ S$ j* x
+ i& d/ s$ U6 u4 w3 e
(1) 我猜你说的应该是探索性因素分析吧。不知道你为什么需要保留或删去item呢?是在开发量表的过程中吗? 我理解探索性因素分析的目的不是用来决定题目的去留的,而是研究者不清楚或不事先定义item与construct的结构,“让数据说话”来探索一组变量背后是否存在潜在的因子结构。放进来做探索性因素分析的每个题目都是有原因的(比如可能来源于定性研究筛选整理的资料),不可以随便删掉。研究者需要做决定的是几个因子最合适。如果存在载荷较小或有交叉载荷的题目,需要弄清楚原因在哪里,是不是内容表达有歧义?还是这个问题确实和两个维度所说的内容都有关?然后把改编后的题目再放回量表再做一次,检验结果如何。如果仅仅根据loading大小来删减题目,那最后剩下的这些题目代表什么呢?
2 \; M) @8 s5 t% \; j0 Q$ U9 G: J: h/ z% [- G# l
(2) 效度可以是一个测量方法的效度,也可以是一个研究的效度。你指的应该是前者吧?我的理解是,效度是一个统称,即“一个测量能够反映其想测量的构念的程度”。任何你可以提供的相关支持和证据都可以用来支持一个测量的效度。所以,虽然效标关联效度(用测量值与“效标”的关系来表示效度)是最常用的,但并不是必须的——如果你可以提供其它有说服力的证据。/ w) l3 D* A1 u4 i

# @8 i' _! |1 p  X$ a. }区别效度(discriminant validity)和聚合效度(convergent validity)本来只是MTMM里的专用术语,只是后来被误用了。MTMM也是用来检验新发展的量表效度如何的。在MTMM中,同一方法测不同的特质相关较小,说明区别效度较高,即可以区分出不同特质;不同方法测同一特质的结果若相关较高,即聚合效度较高。
: u1 ~/ ]. z4 M' a  n6 d4 G
1 T2 V. C: s, e9 D6 b- K8 } 本帖最后由 xinting.J 于 2010-12-6 09:14 编辑 / a8 Z) A% I4 R! u% z
* \/ c+ o5 n+ L! n4 V' F
寻找,就寻见。(太 7:7)
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
板凳
发表于 2010-12-6 11:10:04 |只看该作者
xinting,谢谢您的热心解答。
  E- F. V# i. H5 m1 d: T
) [: c* ^  E. T1 s首先,我的确是在做探索性因子分析(题目中没有说清楚,见谅)。我很同意你的说法,“探索性因素分析的目的不是用来决定题目的去留的,而是研究者不清楚或不事先定义item与construct的结构,“让数据说话”来探索一组变量背后是否存在潜在的因子结构。”目前我的状况是基本判断出两个因子比较合适,但是由于前期准备的[b]题库较大,所以在选择item生成最终的正是量表时必须要做出一个选择。我的问题就是这个选择的标准是不是“一般是保留loading高于0.45的item和cross-loading高于0.3的item”?
' b! r% E' D8 ~; f# U' F4 G' R7 ~  [6 K1 t5 r" d5 i0 i
第二,关于效度检验,我认同你说的“任何你可以提供的相关支持和证据都可以用来支持一个测量的效度。”研究是一个漫长而系统的工程,提供实证证据的形式丰富多样,在最终报告(或论文写作中)是不是要遵循一定的要求呢?换言之,哪些是研究人员关注的标准(或者说“八股文”中必须报告的)?还有一点点,区别效度(discriminant validity)和聚合效度(convergent validity)是检验同一个构念(construct)中的不同因子(factor)之间的关系还是检验这个构念与其他构念之间的关系?谢谢。
回复

使用道具 举报

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

地板
发表于 2010-12-6 11:48:35 |只看该作者
hongyan, : [8 K+ Z4 Z8 f' r
(1) 如果你真的选择items,一般的标准是loading 大于0.4,cross loading要 “小于” 0.4; 这在很多的文章都会用的,引用应该不难。
, W4 V3 I! I4 c) S! n% d- O7 y(2)区别效度(discriminant validity)和聚合效度(convergent validity)是检验这个构念与其他构念之间的关系的。一般提供的证据,多为criteiron validity, discriminant validity and convergent validity。但是我不会说这是像“八股文”中必须报告的。我们没有这样的标准和要求的(起码以我所知道的)。
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
5
发表于 2010-12-6 12:20:14 |只看该作者
什么是cross loading?难道不是某个item 在factor 1与factor 2上两个loading的差?
回复

使用道具 举报

3

主题

8

听众

382

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2010-7-10
最后登录
2018-2-10
积分
382
精华
0
主题
3
帖子
44
6
发表于 2010-12-6 13:05:00 |只看该作者
Hongyan, 我猜Kenny说的cross-loading是指:某个item在各个Factor上的loading, 如果只有一个大于0.4,可以认为它清楚地属于这个factor; 但是如果有两个大于0.4,就是有cross-loading了。但你说的计算两个loading的差的方法我好像没有听说过哦。
寻找,就寻见。(太 7:7)
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
7
发表于 2010-12-6 13:28:28 |只看该作者
谢咯,xinting.可我还是不太清楚呀。例如,item A在factor 1的loading 是0.49,在factor 2的loading 是0.44,那么按照“一般的标准是loading 大于0.4,cross loading要 “小于” 0.4”,这里的cross loading是多少呢?
回复

使用道具 举报

3

主题

8

听众

382

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2010-7-10
最后登录
2018-2-10
积分
382
精华
0
主题
3
帖子
44
8
发表于 2010-12-6 14:05:24 |只看该作者
Hongyan,不客气,本来就是大家一起学习的。 你的例子里,如果根据loading最高看,item A最能够代表factor 1,但同时它又与factor 2有很高相关,所以cross loading 是.44。“cross loading小于0.4” 的意思就是,一个item只能在一个factor上 loading是大于0.4的。这个item在其它每一个factor上都有一个loading的,但是这些值都不应该大于0.4。
寻找,就寻见。(太 7:7)
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
9
发表于 2010-12-6 16:10:40 |只看该作者
啊哈^_^ 再次感谢xinting,还有kenny!
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
10
发表于 2010-12-6 16:35:38 |只看该作者

: p. {( h7 z2 J$ V3 O/ Q* [补记:: ?% M* j( ]" m, N$ P
常有这样一种困惑,翻看各种统计属,查阅各种文献,关于数据分析的标准倒是得到一大堆(如上例,关于cross-loading 有的是以0.3为标准、有的是0.25、有的是0.4 ),但是在实际操作时还是会感到茫然、不知所措(比如什么是cross loading,什么是效度检验,……)。打个不恰当的比方,就好比菜谱里说“添加半汤匙或一汤匙盐”,可是这个“汤匙”到底是多大呢?这个“盐”用来干吗的?什么时候“添加”?……对于大厨这不是问题,对于常烧饭的人这个也可以做得八九不离十,可是对于烧饭愚钝者或甚少下厨者,这些问题真的很要命。统计书和文献在这类问题上似乎讲得都不够透彻。不知这种困惑是有一定特殊性的(如统计分析“先天不足”的人才有)还是具有普适性呢?
6 a6 }  U- H6 I  n7 {+ j9 }* u4 y& U" l& Q/ g/ U8 V7 q  W
欢迎大家给力跟帖!
回复

使用道具 举报