Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/307.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Ruby替代Scrapy?_Python_Ruby_Screen Scraping_Scrapy - Fatal编程技术网

Python Ruby替代Scrapy?

Python Ruby替代Scrapy?,python,ruby,screen-scraping,scrapy,Python,Ruby,Screen Scraping,Scrapy,有哪些基于Ruby的工具可以帮助我实现类似于Scrapy对python所做的事情? 在诺科吉里的基础上建造了一座城堡 有一个基于XPath的 是另一种工具 有一种基于CSS选择器提取信息的方法,但根据我的测试,它的执行速度比Nokogiri慢 有一个 我肯定还有其他人,但这些是我遇到的 如果你找不到一个工具来解决你的问题,可以像签出web爬行库一样,将它与上面列出的一个低级刮取框架结合起来 或者继续学习Python。这将扩大你在编程世界中的业力。你也可以去看看你可能想给scrapy一个机会。它似

有哪些基于Ruby的工具可以帮助我实现类似于Scrapy对python所做的事情?

在诺科吉里的基础上建造了一座城堡

有一个基于XPath的

是另一种工具

有一种基于CSS选择器提取信息的方法,但根据我的测试,它的执行速度比Nokogiri慢

有一个

我肯定还有其他人,但这些是我遇到的

如果你找不到一个工具来解决你的问题,可以像签出web爬行库一样,将它与上面列出的一个低级刮取框架结合起来


或者继续学习Python。这将扩大你在编程世界中的业力。

你也可以去看看

你可能想给scrapy一个机会。它似乎有优秀的文档和非常友好的API。如果您熟悉ruby,那么学习python可能只需要一两天。它们是非常相似的语言。@zeekay,你的意思是?不,他问了关于ruby替代scrapy的问题,scrapy是用于抓取网站和提取结构化数据的python应用程序框架。我刚刚指出,学习python很容易,他也可以直接使用它(假设没有令人满意的替代方法)。HTTP客户端:据我所知(我不知道Ruby),这些模块只是HTML/XML解析器,而不是像Scrapy这样的抓取框架。@Acorn-这些都是抓取框架。他们没有的是爬虫或蜘蛛。刮擦和爬行是正交的,但是。。爬行只是刮痧的一个方面。它有许多适用于任何类型的刮取的功能,例如用于存储结果的项目和管道。您链接到的工具似乎与lxml或BeautifulSoup相当,而不是Scrapy。@Acorn-没错,Nokogiri、Hpricot和Scrapi用于从单个页面提取数据。scRUBYt可以选择以下链接,但它们的文档不是很好。还有一个我没有列出的工具——它是建立在Nokigiri的基础上的,似乎是一个更好的工具。@Acorn,@Anurag——我正在寻找一种更类似于Scrapy的工具,它也使爬行变得更容易。使用nogogiri从单个页面中提取信息非常容易,但是遍历页面获取单个帖子的链接是一件痛苦的事情。但我想我也可以去学Python:-)