Apache 如何在windows中配置nutch 1.8错误:找不到nutch:命令
我正在尝试在Windows7中配置nutch,我遵循了以下步骤 我已经下载并解压了apache nutch 1.8, 我已经在conf/nutch-site.xml中指定了代理名称Apache 如何在windows中配置nutch 1.8错误:找不到nutch:命令,apache,nutch,Apache,Nutch,我正在尝试在Windows7中配置nutch,我遵循了以下步骤 我已经下载并解压了apache nutch 1.8, 我已经在conf/nutch-site.xml中指定了代理名称 <configuration> <property> <name>http.agent.name</name> <value>My Nutch Spider</value> </property> </configurati
<configuration>
<property>
<name>http.agent.name</name>
<value>My Nutch Spider</value>
</property>
</configuration>
在apache home Folling命令中,我做到了->
mkdir-p URL
cd URL
触按seed.txt->在URL/下创建一个文本文件seed.txt,其中包含以下内容:对于要Nutch爬网的每个站点,每行一个URL
nutch.apache.org/
在conf/regex-urlfilter.txt中,使用->+^[a-z0-9]*.*nutch.apache.org/
但当我在垃圾桶里做的时候
bin/nutch爬网URL-目录爬网-深度3-顶部5
出现错误->找不到bash:nutch:命令
为什么?Nutch脚本是为linux环境编写的 您可能会使用此选项,尽管它似乎需要完成更多的工作: 或者按照此处的建议设置Cygwin: