Apache Nutch 2.1 URL注入需要永远的时间
我正试图在Ubuntu12.04上部署Nutch2.1。一切顺利 直到我尝试将URL注入数据库。当我键入($bin/nutch injecturl)并按 进入我得到的Apache Nutch 2.1 URL注入需要永远的时间,apache,nutch,Apache,Nutch,我正试图在Ubuntu12.04上部署Nutch2.1。一切顺利 直到我尝试将URL注入数据库。当我键入($bin/nutch injecturl)并按 进入我得到的 InjectorJob: starting InjectorJob: urlDir: urls 在我决定取消死刑之前,我会在那里呆上几个小时。URL是一个目录 包含带有URL的文件的。我按照建议在nutch-site.xml中添加了代理和端口详细信息,但这并不能解决问题。我尝试了ApacheNutch2.2.1,
InjectorJob: starting
InjectorJob: urlDir: urls
在我决定取消死刑之前,我会在那里呆上几个小时。URL是一个目录
包含带有URL的文件的。我按照建议在nutch-site.xml中添加了代理和端口详细信息,但这并不能解决问题。我尝试了ApacheNutch2.2.1,但问题仍然存在
如果你知道如何解决这个问题,请帮帮我
提前谢谢 Ubuntu默认主机中的环回IP地址为127.0.1.1。HBase(根据)要求环回IP地址为127.0.0.1 Ubuntu
/etc/hosts
文件默认包含(myComputerName是您的计算机名):
使用sudo gedit/etc/hosts
更新主机文件,如下所示:
127.0.0.1 localhost
127.0.0.1 myComputerName
重新启动Ubuntu。Nutch应该不会再在将URL注入HBase时遇到问题
127.0.0.1 localhost
127.0.0.1 myComputerName