找考题网-背景图
问答题

计算题

考虑下表所示二元分类问题的数据集。

(1)计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性?
(2)计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性?

【参考答案】

按照属性A和B划分时,数据集可分为如下两种情况:

按照属性A划分样本集分别得到的两个子集(A取值T和A取值F)的信息熵分别为:

按照属性B划分样本集分别得到的两个子集(B取值T和B取值F)的信息熵分别为:

因此,决策树归纳算法将会选择......

(↓↓↓ 点击‘点击查看答案’看完整答案 ↓↓↓)