A.内容作弊 B.链接作弊 C.隐藏作弊 D.Web2.0作弊
单项选择题关于HITS算法描述正确的是()。
A.算法最后输出的是按照内容权威度排序的结果列表 B.如果在原有的扩展网页集合内添加删除个别网页或者改变少数链接关系,HITS算法的排名结果不会有非常大的改变 C.HITS算法核心思想是对网页两个方面的权威程度进行评价,一个是内容权威度,另一个是链接权威度,两者具有相互增强的关系 D.HITS是与查询相关的算法,计算效率较高
单项选择题关于Page Rank标准算法与简化算法正确的是()。
A.Page Rank简化算法对G中的每一个节点n,设定其初始值均为1/n B.Page Rank简化算法可以保证迭代过程中的Page Rank值之和为1 C.Page Rank标准算法不考虑没有超链接网页的情况 D.在实际运算过程中,由于节点数n的值巨大,因此通常采用适用于稀疏矩阵运算的Page Rank标准算法来对运算过程进行改善
单项选择题下面方法中,不是建立索引的方法的是()。
A.两边文档遍历法 B.排序法 C.归并法 D.HITS
单项选择题在实际的搜索引擎系统中,通过存储()来存储文档信息。
A.文档地址 B.文档简化序号 C.文档编号 D.文档编号差值
单项选择题以下关于网络爬虫的描述中,错误的一项是()。
A.在爬虫开始的时候,需要给爬虫输送一个URL列表,作为爬虫的起始位置B.根据某种抓取策略爬行新发现的URL,如此重复下去C.爬虫程序会抓取所有网页,以保证搜索正确性D.对于商业搜索引擎来说,分布式爬虫是必须采用的技术