A.在爬虫开始的时候,需要给爬虫输送一个URL列表,作为爬虫的起始位置B.根据某种抓取策略爬行新发现的URL,如此重复下去C.爬虫程序会抓取所有网页,以保证搜索正确性D.对于商业搜索引擎来说,分布式爬虫是必须采用的技术
单项选择题信息检索模型中,神经网络模型属于()。
A.布尔模型 B.向量模型 C.概率模型 D.结构化模型
单项选择题以下选项中属于概率模型的优点的是()。
A.模型具有内在的相关反馈机制,将文档根据相关概率按递减顺序排列 B.模型最初将文档分成相关的集合和不相关的集合 C.模型中所有的权值都是二值的 D.模型假设标引词相互独立
单项选择题T1、T2、T3表示特征项,D1、D2、D3、D4为文档向量,Q为查询向量,其中,D1=4T1+2T2+3T3,D2=T1+4T2+2T3,D3=5T1+2T3,D4=T2+3T3,Q=T1+0T2+2T3。以上文档中和Q最大可能相关的是()。
A.D1 B.D2 C.D3 D.D4
单项选择题在向量模型中,不可以通过()来衡量文档和查询之间的相似度。
A.向量间距离 B.向量内积 C.向量间夹角大小 D.向量间正切值
单项选择题所有检索策略都包含三个要素,以下选项中不属于三要素的一项是()。
A.匹配函数 B.排序函数 C.文档表示 D.查询表示