User agent Nutch 1.3:更改用户代理

User agent Nutch 1.3:更改用户代理,user-agent,nutch,User Agent,Nutch,我需要更改每个已爬网域的用户代理字符串。我使用标准的Nutch爬行实用程序代码,它每次爬行一个域。它是在多线程模式下启动的,用于对多个域进行爬网。我需要将域字符串[botname]+domainID传递给,但我不确定如何实现它 由于用户代理显示在配置文件(nutch site.xml)中,因此不可能更改特定域的用户代理 我建议您为每个要爬网的域创建一个nutch实例。在每个实例中,设置url筛选器、种子url和与要爬网的域匹配的用户代理 这将允许您使用自定义设置执行每个爬网 干杯玛娜由于用户代理

我需要更改每个已爬网域的用户代理字符串。我使用标准的Nutch爬行实用程序代码,它每次爬行一个域。它是在多线程模式下启动的,用于对多个域进行爬网。我需要将域字符串[botname]+domainID传递给,但我不确定如何实现它

由于用户代理显示在配置文件(nutch site.xml)中,因此不可能更改特定域的用户代理

我建议您为每个要爬网的域创建一个nutch实例。在每个实例中,设置url筛选器、种子url和与要爬网的域匹配的用户代理

这将允许您使用自定义设置执行每个爬网


干杯玛娜

由于用户代理显示在配置文件(nutch site.xml)中,因此不可能更改特定域的用户代理

我建议您为每个要爬网的域创建一个nutch实例。在每个实例中,设置url筛选器、种子url和与要爬网的域匹配的用户代理

这将允许您使用自定义设置执行每个爬网

干杯,玛娜