- 最后登录
- 2005-4-22
- 注册时间
- 2002-10-8
- 威望
- 20
- 金钱
- 2815
- 贡献
- 7
- 阅读权限
- 50
- 积分
- 2842
- 日志
- 0
- 记录
- 0
- 帖子
- 377
- 主题
- 28
- 精华
- 0
- 好友
- 0
 
该用户从未签到  - 注册时间
- 2002-10-8
- 最后登录
- 2005-4-22
- 积分
- 2842
- 精华
- 0
- 主题
- 28
- 帖子
- 377
|
6、决策树
6、决策树1 v% @( k3 [3 U. M q2 q, z2 A
[face=黑体]决策树是如何工作的
; x* _4 M) u& r. e决策树一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。7 A" G3 V: C+ V7 K( D
选择分割的方法有好几种,但是目的都是一致的:对目标类尝试进行最佳的分割。
: u7 K! N4 n3 i; G从根到叶子节点都有一条路径,这条路径就是一条“规则”。, D0 i% m; |7 {. ~$ I. {0 e
决策树可以是二叉的,也可以是多叉的。
: q/ i, F; c# I& ?4 p8 i# X对每个节点的衡量:
* D, r+ a# y- \ P( J1) 通过该节点的记录数5 w; ]" n9 X9 @, t2 s7 E3 p
2) 如果是叶子节点的话,分类的路径8 T& A! y# o k9 W: O' j# p
3) 对叶子节点正确分类的比例。! {1 |+ G+ ~+ w1 F. n+ M5 x! ]& U
有些规则的效果可以比其他的一些规则要好。- E. I& w5 z) X/ }) Z, O7 O
决策树对于常规统计方法的优缺点
2 l9 B7 G7 I' t( L% u优点:
7 d$ F" c. m. o* d, U9 ]1) 可以生成可以理解的规则。+ c; U7 }; U& F! a
2) 计算量相对来说不是很大。, _" C5 D' A1 i8 ^! w3 q# M4 a
3) 可以处理连续和种类字段。) G$ Y% u7 Q6 y( A
4) 决策树可以清晰的显示哪些字段比较重要
2 M r# L. A$ t |- n. ^3 j缺点:1 s/ n$ Q% x- R' P2 L
1) 对连续性的字段比较难预测。
! S9 b" J2 Y- K* m& L2) 对有时间顺序的数据,需要很多预处理的工作。, [/ _1 f4 h+ ^+ w# b
3) 当类别太多时,错误可能就会增加的比较快。% F% _1 f9 M3 `. q" s
4) 一般的算法分类的时候,只是根据一个字段来分类。
8 f3 u6 U, G0 { |
|