增量式爬虫中的()指的是:爬虫根据网页改变频率将其分为更新较快网页子集和更新较慢网页子集两类,然后以不同的频率访问这两类网页。
A.统一更新法B.基于分类的更新法C.个体更新法D.随机更新法
单项选择题在HTTP请求中,通过()方法发送的表单数据,会放在URL之后,以分割URL和传输数据,参数之间以&相连,可能会造成信息泄露问题。
A.GETB.POSTC.PUTD.CONNECT
单项选择题如果HTTP请求的响应信息是404,则应采取下列哪项措施()。
A.向网管报障B.再次核对请求的页面地址是否正确C.向管理员请求用户名和密码D.检查浏览器权限
单项选择题()实现的两个主要目标为保持本地页面集中存储的页面为最新页面和提高本地页面集中页面的质量。
A.聚焦网络爬虫B.增量式网络爬虫C.通用网络爬虫D.深层网络爬虫
单项选择题()采集的目标是那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的,只有用户提交一些关键词才能获得的Web页面。
单项选择题正则表达式的规则中,x|y表示匹配()。
A.x和yB.x或yC.xyD.x+y