单项选择题

A.关联规则（AssociationRules）B.序列模式（Sequential Patterns）C.时间……

下列何种算法可以了解各产品间的先后购买的关系及概率值（）

A.关联规则（AssociationRules）
B.序列模式（Sequential Patterns）
C.时间序列（Time Series）
D.聚类分析（Cluster Analysis）

<上一题目录下一题>

热门试题

单项选择题在KNN算法上进行预测概率的推估时，会采用哪一种方法，以保证每一类的预测概率不为0（）

A.数据正规化（Data Normalization）
B.拉普拉斯修正法（Laplace Correction）
C.数据一般化（Data Generalization）
D.以上皆非

多项选择题20Newsgroups数据集是机器学习研究中常用的标准数据集，它使用20个Usenet新闻单位上几个月发布的18828个消息，共18828个文件，如果要对该数据集使用mahout进行文本分类，错误的做法是（）

A.直接使用mahout算法，在namenode机器的本地文件系统中调用这18828个文件
B.将这18828个文件上传到hdfs上，然后使用mahout算法分析
C.使用mahoutᨀ供的seqdirectory命令将18828个文件序列化成一个大文件上传到hdfs上，然后使用mahout算法分析
D.将这18828个文件rar压缩软件将其压缩成一个大文件上传到hdfs上，然后使用mahout算法分析

多项选择题给定一个巨大的文本（如1TB），可以编写mapreduce程序计算单词出现的数目，需要经历如下哪几个步骤（）

A.自动对文本进行分割
B.对分割后的每一个KV对应用用户定义的Map进行处理，生成新的KV对
C.对输出的结果集归拢、排序（系统自动完成）
D.通过Reduce操作生成最后结果

多项选择题Mahout中实现的canopy聚类命令的可选参数是（）

A.–input偏好数据路径
B.–output推荐结果路径
C.--t1（-t1）t1：T1阈值
D.--t2（-t2）t2：T2阈值

多项选择题Mahout中实现的kmeans聚类命令的必选参数是（）

A.–input偏好数据路径
B.–output推荐结果路径
C.–clusters初始聚类中心点文件路径
D.--overwrite对输出路径进行重写