A.可以公平获得不同算法实际在线时的性能指标 B.成本较低,容易部署 C.可以获得商业上关注的指标,如转化率、点击率等 D.周期较长,需要进行长期的实验才能得到可靠的结果
单项选择题以下关于推荐系统和搜索引擎的说法中,错误的是()。
A.推荐系统和搜索引擎都是为了解决信息过载的问题 B.搜索引擎需要用户提供明确的需求 C.推荐系统是由用户主导的 D.搜索引擎注重结果之间的排序
单项选择题关于信息检索,以下选项中描述正确的是()。
A.动态索引包含2个关键的索引结构:倒排索引、临时索引 B.查准率是衡量系统在实施某一作业时检出相关文献能力的一种测度指标,是对检索遗漏程度的度量。 C.中文分词技术采用了基于符号的方法来识别 D.机器学习的四个步骤中,文档特征抽取是指利用抽取算法抽取查询词TF/IDF信息、文档长度、网页Page Rank值、网页入链/出链数量等
单项选择题以下选项中描述不正确的是()。
A.爬虫的作用是为搜索引擎抓取大量的数据,抓取的对象是整个互联网上的网页 B.根据具体应用的不同,可以将爬虫分为两种类型,即增量型爬虫和垂直型爬虫 C.暗网是一些垂直领域网站,它们通常是网站提供组合查询界面,用户按照需求输入查询之后,才能获取相关数据 D.倒排列表是指记载出现过某个单词的所有文档的文档列表、以及单词在该文档中出现的位置信息
单项选择题以下不是搜索引擎的主要功能模块的一项是()。
A.网络爬虫 B.搜索引擎索引 C.PageRank D.搜索排序
单项选择题对网页进行两次抓取,第一次是正常的搜索引擎爬虫抓取,第二次以模拟人工访问页面的方式抓取,如果两次抓取到的内容差异较大,则认为是作弊页面,这属于()。
A.识别网页重定向 B.识别页面隐藏 C.反内容作弊 D.链接反作弊