设为首页 登录 注册
首页 中人社区 中人博客
查看: 35433|回复: 7
打印 上一主题 下一主题

分类变量如何进行因子分析与相关分析

[复制链接]

2

主题

6

听众

32

积分

书童

Rank: 1

注册时间
2011-7-13
最后登录
2012-7-29
积分
32
精华
0
主题
2
帖子
3
跳转到指定楼层
楼主
发表于 2012-7-17 20:33:04 |只看该作者 |倒序浏览
Kenny,! J% ?2 V! R) \' u: v5 Q
      你好,我目前在做一个研究,其中自变量(X)和因变量(Y)是连续型变量,而2个调节变量中有一个是连续型变量(M1),另一个是分类型变量(M2)。其中M2是采用李克特量表进行测量,在原构思中有3个维度,但是研究主要是将其变成虚拟变量(M'2),即将大于某一临界值的设定为1,低于临界值的设定为0,按照你的说法是属于“假”的分类变量。. }& O( m* L& x  y' C  X  K
      而目前的主要问题是:
" ^5 _  L+ }3 n- E0 j' B) |(1)对于M2的因子分析仍是如同连续型变量一样,还是采用不同的方法?3 a) A! l& u! q( q; E
(2)在进行相关分析中,自变量、因变量、2个调节变量间究竟该采用什么方法进行相关分析?我也看过相关书籍,有的说可以采用Pearson,还有的书籍说可以用Spearman。但是理由都较为模糊。
9 D' h8 e$ i% D4 q" p5 A(3)如果要进行如性别等人口统计变量对M2(事实上究竟应该用M2,还是M'2,我都感觉有点糊涂了)影响,是直接做回归还是做T检验?
6 F$ z; I1 X6 l8 }, n$ M(4)在圈里,你认可将调节变量一同放入回归模型来检验调节效应,那么不同类型的调节变量(如我的,一个是连续型变量,一个是分类型变量)也应该一同放入回归模型来检验调节效应吗?3 O) ~$ r/ e* ~% b* N1 P0 y
$ s1 A% T3 O' C  O$ _- D; o
thanks

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

沙发
发表于 2012-7-18 15:49:12 |只看该作者
zhongmin5788,
' O# [  B# w' d' Y1 A1 M/ y  h(1)因子分析只可以对你原来的连续变量来做。你人工的改变了它,再做因子分析就没有意思了。
6 `# M# v* r) P' b/ e3 S5 @(2) 承上面的答案,没有用其他相关的问题。只要用Pearson,但是是用在原来的变量,不是改变了的变量。+ B" j1 R7 p$ l! |2 u
(3) 人口统计变量本来就是 categorical 的 (比如性别),把他们看成是连续就可以了。0 h7 B7 ^" H/ h: p7 _% E3 ], o
(4) 如果变量本来是categorical的,就把它们看成是连续的,与其他的调节变量一同分析。如果它们本来是连续的,你硬要把它们变成 categorical,那对我来说,用什么方法都不对的。
回复

使用道具 举报

8

主题

7

听众

2291

积分

举人

Rank: 8Rank: 8

注册时间
2012-4-21
最后登录
2016-4-28
积分
2291
精华
0
主题
8
帖子
128
板凳
发表于 2012-7-19 16:12:45 |只看该作者
Kenneth 发表于 2012-7-18 15:49 4 V& p, m1 H. j6 [
zhongmin5788,( T) }: o: R) p
(1)因子分析只可以对你原来的连续变量来做。你人工的改变了它,再做因子分析就没有意思了 ...
- u) p* W# k% F1 h2 @
kenny,您好,请问您说的“(3) 人口统计变量本来就是 categorical 的 (比如性别),把他们看成是连续就可以了。”是什么意思啊?我不是很理解,是因为性别本身只有男和女,所以可以处理成连续变量么,还是指lz的模型中的M2本身就是用李克特量表测量,所以可以当做连续变量处理呢?
回复

使用道具 举报

8

主题

7

听众

2291

积分

举人

Rank: 8Rank: 8

注册时间
2012-4-21
最后登录
2016-4-28
积分
2291
精华
0
主题
8
帖子
128
地板
发表于 2012-7-19 16:47:38 |只看该作者
我试着回答一下pearson相关系数和spearman相关系数的区别:2 @" w6 w6 m# i' `$ j! \+ y; J3 y  h, _
1.连续变量,数据符合正态分布,变量间是线性关系,三者都符合的时候用pearson相关系数最合适,当然也可以用spearman相关系数(似乎pearson相关更好,我也不确定);二者的计算公式基本相同,只是spearman是用数据的ranking来计算相关系数。6 V/ x/ g& @- T3 z( E- m3 p
2.以上三个条件有任意一个不满足那么就需要用spearman相关系数。
+ c! s0 L7 V, D8 ]( S& j, q) K不知道说得对不对,请指教。
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

5
发表于 2012-7-20 20:10:54 |只看该作者
(3) 人口统计变量本来就是 categorical 的 (比如性别),把他们看成是连续就可以了。、
8 s! Y* l" n" ?2 H9 J性别本来是男女的,你把这个变量男的叫1,女的叫2。就把这个SEX变量当成一个普通的连续变量,我不觉得有什么问题。自然,这个变量到最后还是一个啞变量(或叫虚拟变量),它除了1和2以外,就没有其他数值了。
+ K6 m' m8 n) t4 k; P
# q* I; c! I/ I9 J0 [, \但是你叫 30岁以下做1; 30岁到40岁做2; 40到50岁叫3; 大于50岁叫4 的话,年龄本来不是categorical,你硬把它变成ordinal,还在特定的地方冠以1,2,3,4,那就是很大的问题了。因为这样计算出来的相关,可以随着你选择的cutoff point而改变。简单来说,就是你喜欢是什么就什么。  q( a8 @7 S) g! w
回复

使用道具 举报

8

主题

7

听众

2291

积分

举人

Rank: 8Rank: 8

注册时间
2012-4-21
最后登录
2016-4-28
积分
2291
精华
0
主题
8
帖子
128
6
发表于 2012-7-21 17:03:05 |只看该作者
Kenneth 发表于 2012-7-20 20:10
- b# S, V: \7 j+ ~* s! M  U% `* X(3) 人口统计变量本来就是 categorical 的 (比如性别),把他们看成是连续就可以了。、) m  {- @  r3 f# s" H* C1 b
性别本来是男女 ...

- n6 a9 [2 t* p谢谢您的回答,我同意您说的内容,但我似乎还是不能理解您这句话的意思,“如果变量本来是categorical的,就把它们看成是连续的,与其他的调节变量一同分析。”,类别变量除了构造哑变量之外难道也有方法直接看成连续变量么?还是您仅仅指的是类别变量可以和连续变量同时处理?(可能我有点钻牛角尖了,还请见谅。)
回复

使用道具 举报

69

主题

220

听众

2万

积分

中人网专家

Rank: 50Rank: 50Rank: 50Rank: 50Rank: 50

注册时间
2003-1-21
最后登录
2016-11-27
积分
29016
精华
0
主题
69
帖子
1438

2009年度勋章

7
发表于 2012-7-22 02:23:20 |只看该作者
chaoswang 发表于 2012-7-21 17:03
4 X' j% @: \# A! {  S谢谢您的回答,我同意您说的内容,但我似乎还是不能理解您这句话的意思,“如果变量本来是categorical的, ...
6 g9 C& `$ _- |3 M0 w3 x9 E! X
我猜我们讲的一样的东西。只是你不喜欢我的用语而已。
& R' O4 {$ ?0 U/ m6 L& u4 K
) ?. `& k$ Y( A& ~9 `1 N. B) D& c性别 sex 是0(男)或者是女(1)的啞变量, 工作满足  x  是连续的。当你计算性别月工作满足的相关时,你是如何的做的?不就是把 Sex 这个 dummy 直接与 X 相关,就是把 sex 看成是一个普通的连续变量吗?
回复

使用道具 举报

8

主题

7

听众

2291

积分

举人

Rank: 8Rank: 8

注册时间
2012-4-21
最后登录
2016-4-28
积分
2291
精华
0
主题
8
帖子
128
8
发表于 2012-7-23 17:44:10 |只看该作者
Kenneth 发表于 2012-7-22 02:23
# C+ p/ s4 y+ h6 i1 v+ G& j0 y我猜我们讲的一样的东西。只是你不喜欢我的用语而已。/ a; L4 N' Y% I# r) V. O5 {
. J' B$ Z! h" P- k! L: A
性别 sex 是0(男)或者是女(1)的啞变量, 工作 ...

9 b! ]+ e2 `6 m' k7 w  c6 ~我明白了,我一直误以为您这句话是可以针对一般的类型变量来说的,原来只针对性别,那就没有什么问题了。/ e  O6 `0 `1 \% x6 @9 y
学得不扎实导致总是怀疑有自己没有学过的东西,所以想追根究底,让您见笑了。
回复

使用道具 举报