- 最后登录
- 2012-9-10
- 注册时间
- 2012-9-2
- 威望
- 0
- 金钱
- 20
- 贡献
- 10
- 阅读权限
- 10
- 积分
- 30
- 日志
- 0
- 记录
- 0
- 帖子
- 5
- 主题
- 2
- 精华
- 0
- 好友
- 0

- 注册时间
- 2012-9-2
- 最后登录
- 2012-9-10
- 积分
- 30
- 精华
- 0
- 主题
- 2
- 帖子
- 5
|
HI,Kenny。
& w5 P. N8 ?) Q我又来请教你了。
7 z. j7 c p5 L! i% R最近在使用explore来对数据进行预处理,但在数据处理的过程中发现了几个问题我不知道要怎样处理:
8 O' k6 o; I0 f* a" P( J! H
% H5 O: N2 t/ g, p6 z1.explore后,根据其结果删掉极端值和奇异值之后,再explore,直到不存在奇异值和极端值?
" U& p0 L+ y7 `2.不同变量得到的奇异值是不一样的,那么在处理时,是只针对某一个变量将奇异值和极端值删掉,还是要根据所有变量的结果将奇异值和极端值删掉?
* ]* Q* g2 g* {: ^& A" n3.explore到分布非正态的数据时,应该如何处理?# l4 {( @8 n1 m2 l
4.是不是在处理数据之前都应该explore一下?- R( p4 u+ k5 Y1 u0 x( x
/ \+ D5 S& [5 {* _1 J# z: Q, ^4 ^
谢谢! |
|