(1)模式识别:这主要是实体识别问题; (2)冗余:一个属性是冗余的,即它能由另一个表导出,如果属性或维的命名不一致,也可能导致冗余,可以用相关分析来检测; (3)数据值冲突的检测与处理:有些属性因表示比例或编码不同,会导致属性不同。
问答题以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。
问答题给定两个向量对象,分别表示为p1(22,1,42,10),p2(20,0,36,8): (a)计算两个对象之间的欧几里得距离 (b)计算两个对象之间的曼哈顿距离 (c)计算两个对象之间的闵可夫斯基距离,用x=3 (d)计算两个对象之间的切比雪夫距离