查看: 35436|回复: 7

分类变量如何进行因子分析与相关分析

2 主题	6 听众	32 积分

书童

Rank: 1

注册时间: 2011-7-13
最后登录: 2012-7-29
积分: 32
精华: 0
主题: 2
帖子: 3

电梯直达

楼主

发表于 2012-7-17 20:33:04 |只看该作者 |倒序浏览

Kenny，
你好，我目前在做一个研究，其中自变量（X）和因变量(Y)是连续型变量，而2个调节变量中有一个是连续型变量（M1），另一个是分类型变量(M2)。其中M2是采用李克特量表进行测量，在原构思中有3个维度，但是研究主要是将其变成虚拟变量（M'2）,即将大于某一临界值的设定为1，低于临界值的设定为0，按照你的说法是属于“假”的分类变量。
而目前的主要问题是：
（1）对于M2的因子分析仍是如同连续型变量一样，还是采用不同的方法？
（2）在进行相关分析中，自变量、因变量、2个调节变量间究竟该采用什么方法进行相关分析？我也看过相关书籍，有的说可以采用Pearson，还有的书籍说可以用Spearman。但是理由都较为模糊。
（3）如果要进行如性别等人口统计变量对M2（事实上究竟应该用M2，还是M'2，我都感觉有点糊涂了）影响，是直接做回归还是做T检验？
（4）在圈里，你认可将调节变量一同放入回归模型来检验调节效应，那么不同类型的调节变量（如我的，一个是连续型变量，一个是分类型变量）也应该一同放入回归模型来检验调节效应吗？

thanks

转播0 淘帖0 分享0 收藏0 支持0 反对0 @朋友

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

沙发

发表于 2012-7-18 15:49:12 |只看该作者

zhongmin5788,
（1）因子分析只可以对你原来的连续变量来做。你人工的改变了它，再做因子分析就没有意思了。
（2）承上面的答案，没有用其他相关的问题。只要用Pearson，但是是用在原来的变量，不是改变了的变量。
（3）人口统计变量本来就是 categorical 的（比如性别），把他们看成是连续就可以了。
（4）如果变量本来是categorical的，就把它们看成是连续的，与其他的调节变量一同分析。如果它们本来是连续的，你硬要把它们变成 categorical，那对我来说，用什么方法都不对的。

使用道具举报

chaoswang

8 主题	7 听众	2291 积分

举人

Rank: 8 Rank: 8

注册时间: 2012-4-21
最后登录: 2016-4-28
积分: 2291
精华: 0
主题: 8
帖子: 128

板凳

发表于 2012-7-19 16:12:45 |只看该作者

Kenneth 发表于 2012-7-18 15:49 ! R2 O. _# q" T1 P; ?0 i8 b
zhongmin5788,
s; ]# V, v5 V4 k! w- |（1）因子分析只可以对你原来的连续变量来做。你人工的改变了它，再做因子分析就没有意思了 ...

kenny，您好，请问您说的“（3）人口统计变量本来就是 categorical 的（比如性别），把他们看成是连续就可以了。”是什么意思啊？我不是很理解，是因为性别本身只有男和女，所以可以处理成连续变量么，还是指lz的模型中的M2本身就是用李克特量表测量，所以可以当做连续变量处理呢？

中人网社区招募“中国好版主”11月话费已送出

使用道具举报

chaoswang

8 主题	7 听众	2291 积分

举人

Rank: 8 Rank: 8

注册时间: 2012-4-21
最后登录: 2016-4-28
积分: 2291
精华: 0
主题: 8
帖子: 128

地板

发表于 2012-7-19 16:47:38 |只看该作者

我试着回答一下pearson相关系数和spearman相关系数的区别：
1.连续变量，数据符合正态分布，变量间是线性关系，三者都符合的时候用pearson相关系数最合适，当然也可以用spearman相关系数（似乎pearson相关更好，我也不确定）；二者的计算公式基本相同，只是spearman是用数据的ranking来计算相关系数。
2.以上三个条件有任意一个不满足那么就需要用spearman相关系数。
不知道说得对不对，请指教。

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

5楼

发表于 2012-7-20 20:10:54 |只看该作者

（3）人口统计变量本来就是 categorical 的（比如性别），把他们看成是连续就可以了。、
性别本来是男女的，你把这个变量男的叫1，女的叫2。就把这个SEX变量当成一个普通的连续变量，我不觉得有什么问题。自然，这个变量到最后还是一个啞变量（或叫虚拟变量），它除了1和2以外，就没有其他数值了。

但是你叫 30岁以下做1； 30岁到40岁做2； 40到50岁叫3；大于50岁叫4 的话，年龄本来不是categorical，你硬把它变成ordinal，还在特定的地方冠以1，2，3，4，那就是很大的问题了。因为这样计算出来的相关，可以随着你选择的cutoff point而改变。简单来说，就是你喜欢是什么就什么。

使用道具举报

chaoswang

8 主题	7 听众	2291 积分

举人

Rank: 8 Rank: 8

注册时间: 2012-4-21
最后登录: 2016-4-28
积分: 2291
精华: 0
主题: 8
帖子: 128

6楼

发表于 2012-7-21 17:03:05 |只看该作者

Kenneth 发表于 2012-7-20 20:10
, ^/ _- p0 `, r6 @" X J) T（3）人口统计变量本来就是 categorical 的（比如性别），把他们看成是连续就可以了。、
( Q6 }8 V9 V; V性别本来是男女 ...

谢谢您的回答，我同意您说的内容，但我似乎还是不能理解您这句话的意思，“如果变量本来是categorical的，就把它们看成是连续的，与其他的调节变量一同分析。”，类别变量除了构造哑变量之外难道也有方法直接看成连续变量么？还是您仅仅指的是类别变量可以和连续变量同时处理？（可能我有点钻牛角尖了，还请见谅。）

使用道具举报

Kenneth

69 主题	220 听众	2万积分

中人网专家

Rank: 50

注册时间: 2003-1-21
最后登录: 2016-11-27
积分: 29016
精华: 0
主题: 69
帖子: 1438

7楼

发表于 2012-7-22 02:23:20 |只看该作者

chaoswang 发表于 2012-7-21 17:03
$ m% u2 W% A* ?# i谢谢您的回答，我同意您说的内容，但我似乎还是不能理解您这句话的意思，“如果变量本来是categorical的， ...

我猜我们讲的一样的东西。只是你不喜欢我的用语而已。

性别 sex 是0（男）或者是女（1）的啞变量，工作满足 x 是连续的。当你计算性别月工作满足的相关时，你是如何的做的？不就是把 Sex 这个 dummy 直接与 X 相关，就是把 sex 看成是一个普通的连续变量吗？

使用道具举报

chaoswang

8 主题	7 听众	2291 积分

举人

Rank: 8 Rank: 8

注册时间: 2012-4-21
最后登录: 2016-4-28
积分: 2291
精华: 0
主题: 8
帖子: 128

8楼

发表于 2012-7-23 17:44:10 |只看该作者

Kenneth 发表于 2012-7-22 02:23
4 ~% j- V. U5 f4 C' H9 \% e我猜我们讲的一样的东西。只是你不喜欢我的用语而已。
% t5 ~6 u0 Q9 |, x0 e+ N% v
4 F5 l$ q% V9 r. \: k性别 sex 是0（男）或者是女（1）的啞变量，工作 ...

我明白了，我一直误以为您这句话是可以针对一般的类型变量来说的，原来只针对性别，那就没有什么问题了。
学得不扎实导致总是怀疑有自己没有学过的东西，所以想追根究底，让您见笑了。

使用道具举报

返回列表

分类变量如何进行因子分析与相关分析

2009年度勋章