已知数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用min-max规范化,将age值35转换到[0.0,1.0]区间。 (b)使用z-score规范化转换age值35,其中,age的标准偏差为12.94年。 (c)使用小数定标规范化转换age值35。
(a)已知最大值为70,最小值为13,则可将35规范化为: (b)已知均值为30,标准差为12.94,则可将35规范化为: (c)使用小数定标规范化可将35规范化为:35/100=0.35
问答题假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?
问答题数据的预处理方法有哪些?
填空题特征搜索过程中不可缺少的环节就是()。
问答题简述特征子集选择的搜索策略。
填空题根据特征选择过程与后续 数据挖掘任务的关联可分为三种方法:()。根据是否用到类信息的指导,分为(),()和()特征选择,