A.决策树归纳是一种构建分类模型的非参数方法B.已开发的构建决策树技术不需要昂贵的计算代价,即使训练集非常大,也可以快速建立模型C.决策树相对容易解释,特别是小型的决策树D.冗余属性不会对决策树的准确率造成太大的影响
多项选择题下列对C4.5算法的描述正确的是()
A.每个节点的分支度只能为2B.使用gain ratio作为节点分割的依据C.可以处理数值型态的字段D.可以处理空值的字段
多项选择题决策树归纳的学习算法必须解决下面两个问题是()
A.如何分裂训练记录B.概率为0的问题C.如何停止分裂过程D.数值型字段离散化
多项选择题以下哪些属于非结构转结构数据-词的表示法()
A.词袋模型(Bag of Word,BoW)B.GloveC.TF-IDFD.Word2Vec(Skip-Gram &CBOW)
多项选择题自然语言处理方法中,IDF的含义是什么()
A.IDF代表着信息量B.IDF越大代表这个词越重要,也越是我们想要的关键词C.IDF越大代表这个词的索引价值也越低D.由IDF的大小我们可以得知一个词的重要程度
多项选择题属于NLP任务的有()
A.生成式任务:比如机器翻译,文本摘要,写诗造句,看图说话等B.句子关系判断:比如QA ,自然语言推理等C.分类任务:比如文本分类,情感计算等D.序列标注:比如中文分词,词性标注,命名实体识别,语义角色标注等