Web crawler 如何查找网站中任何地方出现的单词的所有实例
我想列出我的web应用程序中出现的所有单词。 我已经看到的地方很少有HTML页面、代码文件、数据库、上传的文档、图像和视频。 请建议我应该去其他什么地方看看,在那里这个词可以出现。Web crawler 如何查找网站中任何地方出现的单词的所有实例,web-crawler,Web Crawler,我想列出我的web应用程序中出现的所有单词。 我已经看到的地方很少有HTML页面、代码文件、数据库、上传的文档、图像和视频。 请建议我应该去其他什么地方看看,在那里这个词可以出现。 我知道crawler可以用于此任务,但如果有人在过去有相同的经验,请推荐一些好的自动化工具,可以在网站上轻松找到该词。由于文件是本地的,我认为您不需要crawler。你只需要搜索文件 正如我在评论中所说,操作系统本身应该能够找到大多数事件 这个程序应该能够做你想做的事情。它是用Perl编写的,因此可以完全移植到Win
我知道crawler可以用于此任务,但如果有人在过去有相同的经验,请推荐一些好的自动化工具,可以在网站上轻松找到该词。由于文件是本地的,我认为您不需要crawler。你只需要搜索文件 正如我在评论中所说,操作系统本身应该能够找到大多数事件 这个程序应该能够做你想做的事情。它是用Perl编写的,因此可以完全移植到Windows。这是窗户上的一张照片。这将适用于所有HTML文件和源代码 一些警告:
- 我不确定这对数据库的效果如何。这完全取决于数据库如何存储数据。您应该为您的特定数据库寻找搜索工具
- 我不知道你在图片和视频中搜索作品是什么意思。您是否希望能够自动在图像/视频中找到任何文本并对其进行解析?这种搜索功能实际上并不存在
- “上传文件”。。。什么样的文件?能否再次找到单词完全取决于文档的编码方式。如果它以明文形式存储内容,那么ack将找到它。如果它类似于Word文档,那么您可能只需要使用Word进行搜索,除非有我从未听说过的用于搜索Word文档的特定工具