A.原文档创建B.索引创建C.对外接口D.搜索索引E.置入档案
多项选择题内容检索与采集技术主要包括()等。
A.灾备技术B.云存储C.网络爬虫D.扫描识别E.视频检索
单项选择题OCR识别的流程中,()居于核心地位。
A.特征抽取B.图像预处理C.字符识别D.像素识别
单项选择题扫描识别的识别率不受()因素影响。
A.颜色B.字体C.格式D.图片的质量
单项选择题关于网络爬虫的基本流程,发生在解析DNS之前的步骤是()。
A.分析其他的URLB.分析已抓取的URLC.将URL对应的网页下载D.选取一部分精心挑选的种子URL
单项选择题常见的抓取策略不包括()。
A.深度优先B.最全优先C.最佳优先D.广度优先