一个好的开源网络爬虫,可以为特定网站的特定内容编制索引? 请给我一个好的开源的Web爬虫,用C++、java或php编写。

一个好的开源网络爬虫,可以为特定网站的特定内容编制索引? 请给我一个好的开源的Web爬虫,用C++、java或php编写。,java,php,c++,web-crawler,Java,Php,C++,Web Crawler,我只需要抓取/索引一些特定内容的特定网站图片、文本、视频 我知道他们在这个网站上已经有很多关于这个话题的问题和答案了 但读完所有的书后,我有点困惑 因此,如果我再次重复同样的问题,我很抱歉 -提前感谢这取决于网站的类型。如果要求您在能够查看/下载所需内容之前登录或执行类似操作,我建议您最好在中使用。否则,您可以使用一些简单的东西,比如,使用sh或PHP 您应该使用某种HTML解析器和/或正则表达式来查找特定内容,具体取决于您正在抓取的网站。您要求为特定网站提供特定的web爬虫程序,但没有向我们提

我只需要抓取/索引一些特定内容的特定网站图片、文本、视频

我知道他们在这个网站上已经有很多关于这个话题的问题和答案了

但读完所有的书后,我有点困惑

因此,如果我再次重复同样的问题,我很抱歉


-提前感谢

这取决于网站的类型。如果要求您在能够查看/下载所需内容之前登录或执行类似操作,我建议您最好在中使用。否则,您可以使用一些简单的东西,比如,使用sh或PHP


您应该使用某种HTML解析器和/或正则表达式来查找特定内容,具体取决于您正在抓取的网站。

您要求为特定网站提供特定的web爬虫程序,但没有向我们提供任何关于网站内容和要抓取内容的提示。我们不能真正帮助你……我建议你看一下PHP或C++的卷曲。@ SaveTeInternet,我想索引www. TekCurunChina的内容,这里的内容是文本、照片和视频。例如,我想索引www. TeCracunChina的内容,这里的内容是指文本、照片和视频。