A.CBOW模型和Skip-Gram模型B.Bag-of-Word和GloVe模型C.LSA模型和CBOW模型D.GloVe模型和CBOW模型
单项选择题关于词嵌入模型,以下说法错误的是()
A.GloVe模型属于词嵌入模型B.Word2Vec模型属于词嵌入模型C.词袋模型属于词嵌入模型D.词嵌入模型基本假设是出现在相似的上下文中的词含义相似
单项选择题以下关于词袋模型(Bag of Word,BoW)的说法正确是()
A.是一种在自然语言处理和信息检索(IR)下被简化的表达模型B.词袋模型只能应用在文件分类C.CBOW是词袋模型的一种D.GloVe模型是词袋模型的一种
单项选择题逆向文件频率IDF的相关说法,以下错误的是()
A.IDF表示一个词在文档中的分布状况B.如果一个词没有集中出现在某些文档,则这个词越重要C.如果一个词集中出现在某些文档,则这个词越重要
单项选择题自然语言处理工作中,在自动建构关键词(非控制字汇)时,经常采用的方法是()
A.Controlled Vocabulary(控制字汇)B.Inversion of Terms(逐项反转)C.Inversion Document Frequency(IDF)D.Full-Text Scanning
单项选择题下面有关向量空间模型(VSM)的描述中,错误的是()
A.以向量来表示文档后,两者的夹角越小说明相似度越高B.文本特征词的向量权重可通过TF-IDF实现,从而保留文本词序结构信息C.在向量空间模型中,当有新文档加入时,需要重新计算特征词的权重D.基于向量的文本相似度计算中,除了内积,Dice系数、夹角余弦,还可以用Jaccard方法