机器学习-候选消除法
e:\mydata.txt内容如下:
名称,形状,味道,种类,一般吃法,大小
苹果,圆形,甜味,水果,生吃,小型,是
西瓜,圆形,甜味,水果,生吃,中型,是
苦瓜,长条形,苦味,蔬菜,熟吃,中型,否
香蕉,长条形,甜味,水果,生吃,小型,否
南瓜,圆形,甜味,蔬菜,熟吃,中型,是
荔枝,圆形,甜味,水果,生吃,小型,是
候选消除法用于收集和归纳样本的特征,得出变型空间 ,然后可以对未知样本进行分类方法,它建立在对样本属性集的分析上总结基础上,基本原理是:
1、设立2个假设,一个是一般假设,一个是特殊假设,通过对每条样本的分析,扩大特殊假设,缩小一般假设。
2、假设就是对样本的每个属性值的设定,可以设定为固定值,也可以设定为未知值?即,什么值都可以接受,如果设为nothing,表示任何属性值都不接受
3、每分析一行,就提取每行的样本的各个属性
1)对于正例:
需要删除一般假设中与正例不符合的假设
需要将特殊假设中与正例不符合的属性删除(即改为“?”),开始特殊假设全部为NOTHING,即不接受任何属性值
2)对于反例
需要删除一般假设中与反例符合的假设,然后增加含有与反例不一致的属性值,其他属性值为“?”的假设
3)实质是一般假设说明了反例的特征,特殊假设说明了正例特征?
?
