Windows 7 如何在Windows 7 x64中安装和运行Nutch

Windows 7 如何在Windows 7 x64中安装和运行Nutch,windows-7,installation,web-crawler,nutch,Windows 7,Installation,Web Crawler,Nutch,我想在Windows 7 x64上运行Nutch。我有来自的Nutch版本1.5.1和2 我用了教程。但我在第二步搞砸了,我无法验证安装。其他步骤很难理解 安装和使用nutch的步骤是什么?第二步你没有搞糟-你根本没有(我猜)安装Cygwin,所以你不能运行bash脚本。要么安装Cygwin(最简单的),要么尝试将bash脚本移植到Windows cmd文件。(如果这样做,您可能会发现其他依赖项 希望这能有所帮助。您没有弄糟第二步-您根本没有(我猜)安装Cygwin,因此无法运行bash脚本。请

我想在Windows 7 x64上运行Nutch。我有来自的Nutch版本1.5.1和2

我用了教程。但我在第二步搞砸了,我无法验证安装。其他步骤很难理解


安装和使用nutch的步骤是什么?

第二步你没有搞糟-你根本没有(我猜)安装Cygwin,所以你不能运行bash脚本。要么安装Cygwin(最简单的),要么尝试将bash脚本移植到Windows cmd文件。(如果这样做,您可能会发现其他依赖项


希望这能有所帮助。

您没有弄糟第二步-您根本没有(我猜)安装Cygwin,因此无法运行bash脚本。请安装Cygwin(最简单的),或者您可以尝试将bash脚本移植到Windows cmd文件中。(如果这样做,您可能会发现其他依赖项。)

希望这有帮助

按照步骤在windows中安装nutch:

您将获得给定的输出

按照步骤在windows中安装nutch:

您将获得给定的输出


我按照上面的步骤进行了操作。当我使用/cygdrive/c/cygwin64/home/apache-nutch-1.13/src/bin$nutch检查安装是否正确时,它给出了一个-bash:nutch:command未找到它为什么会发生?使用“/nutch”而不是“nutch”运行它我按照上面的步骤进行了操作。当我使用/cygdrive/c/cygwin64/home/apache-nutch-1.13/src/bin$nutch检查安装是否正确时,它给出了一个-bash:nutch:command未找到它为什么会发生?使用“/nutch”而不是“nutch”运行它
1) download and install cygwin from : https://www.cygwin.com/
2) download nutch from : http://nutch.apache.org/downloads.html
3) paste nutch downloaded and extracted folder into C:\cygwin64\home\
4) rename to apache-nutch
5) open cygwin terminal and type given commands 

 - $ cd C:
 - $ cd cygwin64
 - $ cd home
 - $ cd apache-nutch
 - $ cd src/bin
 - $ ./nutch
Usage: nutch COMMAND
where COMMAND is one of:
 inject         inject new urls into the database
 hostinject     creates or updates an existing host table from a text file
 generate       generate new batches to fetch from crawl db
 fetch          fetch URLs marked during generate
 parse          parse URLs marked during fetch
 updatedb       update web table after parsing
 updatehostdb   update host table after parsing
 readdb         read/dump records from page database
 readhostdb     display entries from the hostDB
 index          run the plugin-based indexer on parsed batches
 elasticindex   run the elasticsearch indexer - DEPRECATED use the index command instead
 solrindex      run the solr indexer on parsed batches - DEPRECATED use the index command instead
 solrdedup      remove duplicates from solr
 solrclean      remove HTTP 301 and 404 documents from solr - DEPRECATED use the clean command instead
 clean          remove HTTP 301 and 404 documents and duplicates from indexing backends configured via plugins
 parsechecker   check the parser for a given url
 indexchecker   check the indexing filters for a given url
 plugin         load a plugin and run one of its classes main()
 nutchserver    run a (local) Nutch server on a user defined port
 webapp         run a local Nutch web application
 junit          runs the given JUnit test
 or
 CLASSNAME      run the class named CLASSNAME
Most commands print help when invoked w/o parameters.