网站一般在()文件中描述被爬取的规则。
A.txtB.robots.txtC.ReadMe.txtD.hentrix.txt
单项选择题在正则表达式中d匹配()。
A.数字B.字母、数字、下划线C.任意字符D.转义字符
单项选择题发送了一个HTTP请求后,客户端收到一个200的响应,这表示()。
A.拒绝访问B.登录失败C.重定向到其他URLD.请求成功
单项选择题()是Hadoop的前身,是一种分布式爬虫工具,更适合集群爬取。
A.CrawlerB.JsoupC.HertrixD.Nutch
单项选择题Hertrix默认的运行端口是()。
A.80B.8080C.10D.1010
单项选择题运行Hertrix前首先要搭建()运行环境。
A.JavaB.C++C.PythonD.C#