A.如何分裂训练记录B.概率为0的问题C.如何停止分裂过程D.数值型字段离散化
多项选择题以下哪些属于非结构转结构数据-词的表示法()
A.词袋模型(Bag of Word,BoW)B.GloveC.TF-IDFD.Word2Vec(Skip-Gram &CBOW)
多项选择题自然语言处理方法中,IDF的含义是什么()
A.IDF代表着信息量B.IDF越大代表这个词越重要,也越是我们想要的关键词C.IDF越大代表这个词的索引价值也越低D.由IDF的大小我们可以得知一个词的重要程度
多项选择题属于NLP任务的有()
A.生成式任务:比如机器翻译,文本摘要,写诗造句,看图说话等B.句子关系判断:比如QA ,自然语言推理等C.分类任务:比如文本分类,情感计算等D.序列标注:比如中文分词,词性标注,命名实体识别,语义角色标注等
多项选择题下面关于文本表示说法正确的是()
A.常用的文本表示方式有:离散式表示和分布式表示B.TF-IDF模型是分布式表示方式C.GLOVE模型得到的词向量不能解决多义词的问题D.ELMO模型训练的词向量可以解决多义词的问题
多项选择题在分词技术中,关于N-Gram的说法正确的是()
A.N-Gram的优点是不需要进行中文分词B.当N够大时,所有正确的分词均会出现于N-Gram中C.噪声少,可以与许多资源结合D.N-Gram的缺点是大多数撷取出来的词是没有语法及语意上意义