设为首页 登录 注册
首页 中人社区 中人博客
查看: 5678|回复: 14
打印 上一主题 下一主题

关于因子分析的问题

  [复制链接]

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
跳转到指定楼层
楼主
发表于 2010-12-5 21:28:08 |只看该作者 |倒序浏览
想请教两个问题:( \. Q% c  e! Y5 o
第一,做因子分析时一般是保留loading高于0.45itemcross-loading高于0.3item吗?7 P* g6 X2 {2 z! G* w# l' o
第二,我查看您原来的博客关于探索性因子分析这部分的讨论,似乎讲到效度检验可能要用MTMM或效标效度,可是我好像记得文献中是用区别效度(discriminant validity)和聚合效度(convergent validity)。那么,一定要做效标关联效度的检验嘛?- ]4 N( y, v) M& Y: p

3

主题

8

听众

382

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2010-7-10
最后登录
2018-2-10
积分
382
精华
0
主题
3
帖子
44
沙发
发表于 2010-12-6 09:07:09 |只看该作者
Hongyan,先试着回答一下你的问题:
2 U5 ^/ H3 W1 w8 n) v+ p% W) t+ O/ r" `0 a" ~4 u6 H( V4 L! z- b! J$ Y! z
(1) 我猜你说的应该是探索性因素分析吧。不知道你为什么需要保留或删去item呢?是在开发量表的过程中吗? 我理解探索性因素分析的目的不是用来决定题目的去留的,而是研究者不清楚或不事先定义item与construct的结构,“让数据说话”来探索一组变量背后是否存在潜在的因子结构。放进来做探索性因素分析的每个题目都是有原因的(比如可能来源于定性研究筛选整理的资料),不可以随便删掉。研究者需要做决定的是几个因子最合适。如果存在载荷较小或有交叉载荷的题目,需要弄清楚原因在哪里,是不是内容表达有歧义?还是这个问题确实和两个维度所说的内容都有关?然后把改编后的题目再放回量表再做一次,检验结果如何。如果仅仅根据loading大小来删减题目,那最后剩下的这些题目代表什么呢?
0 }( O6 F4 i# d( D
0 _: J/ w7 p7 G* C/ Y- m. U(2) 效度可以是一个测量方法的效度,也可以是一个研究的效度。你指的应该是前者吧?我的理解是,效度是一个统称,即“一个测量能够反映其想测量的构念的程度”。任何你可以提供的相关支持和证据都可以用来支持一个测量的效度。所以,虽然效标关联效度(用测量值与“效标”的关系来表示效度)是最常用的,但并不是必须的——如果你可以提供其它有说服力的证据。' Z$ Q- P' @) v+ _$ A- c- S* L; ?0 u" A
$ O6 r, q" U4 \, m  g
区别效度(discriminant validity)和聚合效度(convergent validity)本来只是MTMM里的专用术语,只是后来被误用了。MTMM也是用来检验新发展的量表效度如何的。在MTMM中,同一方法测不同的特质相关较小,说明区别效度较高,即可以区分出不同特质;不同方法测同一特质的结果若相关较高,即聚合效度较高。8 `/ G6 h+ J+ ]( r4 s1 R% |

; A! {$ F+ g3 v; i$ |  y4 W 本帖最后由 xinting.J 于 2010-12-6 09:14 编辑 & R0 B& m7 e# ~! j9 g) M, I  S8 i
7 [; e" R6 E  [" d
寻找,就寻见。(太 7:7)
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
板凳
发表于 2010-12-6 11:10:04 |只看该作者
xinting,谢谢您的热心解答。" U4 ~& m1 B( r% f& z

2 M- p" V# X% j7 c) Q9 m首先,我的确是在做探索性因子分析(题目中没有说清楚,见谅)。我很同意你的说法,“探索性因素分析的目的不是用来决定题目的去留的,而是研究者不清楚或不事先定义item与construct的结构,“让数据说话”来探索一组变量背后是否存在潜在的因子结构。”目前我的状况是基本判断出两个因子比较合适,但是由于前期准备的[b]题库较大,所以在选择item生成最终的正是量表时必须要做出一个选择。我的问题就是这个选择的标准是不是“一般是保留loading高于0.45的item和cross-loading高于0.3的item”?: A/ L, F$ e8 ^; h/ J: g
& m  B+ q% Z$ g. T& X; Z
第二,关于效度检验,我认同你说的“任何你可以提供的相关支持和证据都可以用来支持一个测量的效度。”研究是一个漫长而系统的工程,提供实证证据的形式丰富多样,在最终报告(或论文写作中)是不是要遵循一定的要求呢?换言之,哪些是研究人员关注的标准(或者说“八股文”中必须报告的)?还有一点点,区别效度(discriminant validity)和聚合效度(convergent validity)是检验同一个构念(construct)中的不同因子(factor)之间的关系还是检验这个构念与其他构念之间的关系?谢谢。
回复

使用道具 举报

69

主题

219

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

地板
发表于 2010-12-6 11:48:35 |只看该作者
hongyan,
# A" o. x& H0 _3 A2 b(1) 如果你真的选择items,一般的标准是loading 大于0.4,cross loading要 “小于” 0.4; 这在很多的文章都会用的,引用应该不难。
& [, Y" O0 c* V  l* @) N5 f# ?(2)区别效度(discriminant validity)和聚合效度(convergent validity)是检验这个构念与其他构念之间的关系的。一般提供的证据,多为criteiron validity, discriminant validity and convergent validity。但是我不会说这是像“八股文”中必须报告的。我们没有这样的标准和要求的(起码以我所知道的)。
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
5
发表于 2010-12-6 12:20:14 |只看该作者
什么是cross loading?难道不是某个item 在factor 1与factor 2上两个loading的差?
回复

使用道具 举报

3

主题

8

听众

382

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2010-7-10
最后登录
2018-2-10
积分
382
精华
0
主题
3
帖子
44
6
发表于 2010-12-6 13:05:00 |只看该作者
Hongyan, 我猜Kenny说的cross-loading是指:某个item在各个Factor上的loading, 如果只有一个大于0.4,可以认为它清楚地属于这个factor; 但是如果有两个大于0.4,就是有cross-loading了。但你说的计算两个loading的差的方法我好像没有听说过哦。
寻找,就寻见。(太 7:7)
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
7
发表于 2010-12-6 13:28:28 |只看该作者
谢咯,xinting.可我还是不太清楚呀。例如,item A在factor 1的loading 是0.49,在factor 2的loading 是0.44,那么按照“一般的标准是loading 大于0.4,cross loading要 “小于” 0.4”,这里的cross loading是多少呢?
回复

使用道具 举报

3

主题

8

听众

382

积分

书生

Rank: 3Rank: 3Rank: 3

注册时间
2010-7-10
最后登录
2018-2-10
积分
382
精华
0
主题
3
帖子
44
8
发表于 2010-12-6 14:05:24 |只看该作者
Hongyan,不客气,本来就是大家一起学习的。 你的例子里,如果根据loading最高看,item A最能够代表factor 1,但同时它又与factor 2有很高相关,所以cross loading 是.44。“cross loading小于0.4” 的意思就是,一个item只能在一个factor上 loading是大于0.4的。这个item在其它每一个factor上都有一个loading的,但是这些值都不应该大于0.4。
寻找,就寻见。(太 7:7)
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
9
发表于 2010-12-6 16:10:40 |只看该作者
啊哈^_^ 再次感谢xinting,还有kenny!
回复

使用道具 举报

8

主题

5

听众

919

积分

秀才

Rank: 5Rank: 5

注册时间
2010-7-12
最后登录
2013-8-20
积分
919
精华
0
主题
8
帖子
118
10
发表于 2010-12-6 16:35:38 |只看该作者
1 h' ?8 ~( X9 U& t: H) P7 r
补记:
" _, c. X8 q6 ~4 P$ ?' P常有这样一种困惑,翻看各种统计属,查阅各种文献,关于数据分析的标准倒是得到一大堆(如上例,关于cross-loading 有的是以0.3为标准、有的是0.25、有的是0.4 ),但是在实际操作时还是会感到茫然、不知所措(比如什么是cross loading,什么是效度检验,……)。打个不恰当的比方,就好比菜谱里说“添加半汤匙或一汤匙盐”,可是这个“汤匙”到底是多大呢?这个“盐”用来干吗的?什么时候“添加”?……对于大厨这不是问题,对于常烧饭的人这个也可以做得八九不离十,可是对于烧饭愚钝者或甚少下厨者,这些问题真的很要命。统计书和文献在这类问题上似乎讲得都不够透彻。不知这种困惑是有一定特殊性的(如统计分析“先天不足”的人才有)还是具有普适性呢?
! a7 l) `; k% A$ O& a2 B' Y6 E+ V: f- W6 W4 ^; B
欢迎大家给力跟帖!
回复

使用道具 举报