基于PHP的网络爬虫或基于JAVA的网络爬虫

基于PHP的网络爬虫或基于JAVA的网络爬虫,java,php,web-crawler,Java,Php,Web Crawler,我对基于PHP的网络爬虫有些怀疑,它能像基于java线程的爬虫一样运行吗?我这样问是因为,在java中,线程可以一次又一次地执行,我不认为PHP有类似线程功能的东西,你们能说,哪个网络爬虫会更充分地使用吗?基于PHP还是基于java的,而不是自己编写,使用下面的一个。顺便说一句,基于Java的网络爬虫是首选。我最喜欢的坚果 基于Java的:,Heritrix,JSpider,JoBo(简单爬虫) 基于PHP的:PHPCrawl使用以下方法之一,而不是自己编写。顺便说一句,基于Java的网络爬虫是

我对基于PHP的网络爬虫有些怀疑,它能像基于java线程的爬虫一样运行吗?我这样问是因为,在java中,线程可以一次又一次地执行,我不认为PHP有类似线程功能的东西,你们能说,哪个网络爬虫会更充分地使用吗?基于PHP还是基于java的,而不是自己编写,使用下面的一个。顺便说一句,基于Java的网络爬虫是首选。我最喜欢的坚果

基于Java的:,Heritrix,JSpider,JoBo(简单爬虫)


基于PHP的:PHPCrawl

使用以下方法之一,而不是自己编写。顺便说一句,基于Java的网络爬虫是首选。我最喜欢的坚果

基于Java的:,Heritrix,JSpider,JoBo(简单爬虫)


基于PHP的:PHPCrawl一般来说,在PHP中运行长时间运行的任务需要跨越更多的障碍,因为它更多的是基于请求/响应的设置。

一般来说,在PHP中运行长时间运行的任务需要跨越更多的障碍,因为它更多的是基于请求/响应的设置。

哪一个好??基于Java还是基于PHP?基于Java!使用Lucene附带的Nutch。Nutch只做网络爬网(跟踪和下载链接)的工作。Lucene是一个索引引擎,它构建文档的
反向索引。别担心,露西,纳奇会处理好的。(如果对你有效,请投票:P)我没有足够的理由投票:(哪一个好??基于Java还是基于PHP?基于Java!使用Lucene附带的Nutch。Nutch进行网络爬网(跟踪和下载链接)仅供参考。Lucene是一个索引引擎,可以建立文档的
倒排索引。别担心,abt Lucene,Nutch会处理好的。(如果对你有效,请投票:P)我没有足够的理由投票:(