A.常用的文本表示方式有:离散式表示和分布式表示B.TF-IDF模型是分布式表示方式C.GLOVE模型得到的词向量不能解决多义词的问题D.ELMO模型训练的词向量可以解决多义词的问题
多项选择题在分词技术中,关于N-Gram的说法正确的是()
A.N-Gram的优点是不需要进行中文分词B.当N够大时,所有正确的分词均会出现于N-Gram中C.噪声少,可以与许多资源结合D.N-Gram的缺点是大多数撷取出来的词是没有语法及语意上意义
多项选择题文本是由特定的人进行编撰的,文本的语义结构不可避免地会反映出什么()
A.人的特定立场B.人的特定观点C.人的特定价值D.人的特定利益
多项选择题对于数据降维的描述正确的是()
A.降维会让模型表现更差B.降低维度肯定会损失一些信息C.降维能提高训练速度D.降维能用于数据可视化
多项选择题特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,以下哪些方法是特征选择中的常用方法()
A.嵌入式方法B.融合法C.包裹式D.过滤法
多项选择题以下属于过滤式filter特征选择的方案有()
A.方差选择B.相关系数法C.卡方检验D.基于惩罚项的特征选择