A.回归B.聚类C.分箱(binning)D.计算机和人工检查结合
多项选择题KDD和数据挖掘可以应用在很多领域中,它们具有如下一些公共特征:()。
A.数据利用非常不足B.在开发知识发现系统时,领域专家对该领域的熟悉程度至关重要C.最终用户专门知识缺乏D.海量数据集
多项选择题互联网本身具有()的特征,这种属性特征给数据搜集、整理、研究带来了革命性的突破。
A.快速性B.数字化C.互动性D.共享
多项选择题关于SOM聚类算法描述正确的是()
A.使用的质心具有预先确定的地形序关系B.保证收敛C.有具体的目标函数D.互为邻居的簇直接比非邻居的簇直接更相关
多项选择题如何进行数据清洗()
A.填写缺失的值B.平滑噪声数据C.删除离群点D.解决不一致性
多项选择题大数据领域的主要开源生态体系包括()
A.HadoopB.SparkC.YARND.HDFS