Java 使用不同国家/地区语言爬网网页

Java 使用不同国家/地区语言爬网网页,java,selenium,web-crawler,Java,Selenium,Web Crawler,我已经在网上搜索了我的问题,但没有找到任何合适的。因为,我被卡住了,所以我将我的问题发布在这里,以便至少找到解决问题的方法。 如果我能得到确切的解决方案,那就太好了,但我至少需要关于如何对网页进行爬网的建议,因为爬网程序会对网页的内容做出某些结论。 获取英文或德文文本是我的原则,因为我用英文和德文制作了一组特定的关键字,我的爬虫用这些关键字检查网页内容并验证到特定类别。 我想到了一个解决方案,那就是翻译每个网页,其中的内容不是英语或德语,但首先,我没有找到翻译的确切代码,其次,我认为如果我翻译每

我已经在网上搜索了我的问题,但没有找到任何合适的。因为,我被卡住了,所以我将我的问题发布在这里,以便至少找到解决问题的方法。
如果我能得到确切的解决方案,那就太好了,但我至少需要关于如何对网页进行爬网的建议,因为爬网程序会对网页的内容做出某些结论。
获取英文或德文文本是我的原则,因为我用英文和德文制作了一组特定的关键字,我的爬虫用这些关键字检查网页内容并验证到特定类别。
我想到了一个解决方案,那就是翻译每个网页,其中的内容不是英语或德语,但首先,我没有找到翻译的确切代码,其次,我认为如果我翻译每个网页,会花费很多时间,因为我有数千个网页需要抓取。
我试图在网上找到任何东西,但没有找到足够的解决方案。
至少,我需要面对这类问题的人的建议,如何让爬虫理解网页的内容。

“我需要精确的解决方案”祝你好运。“我需要精确的解决方案”…你先试试自己,在遇到困难时展示你的工作,然后我们会帮助你。我们不是来为他们编写代码的。好了,我来帮你开始吧。抱歉我的错误,我已经编辑了我的帖子。“我需要精确的解决方案”祝你好运。“我需要精确的解决方案”…你先试试自己,当你陷入困境时展示你的工作,然后我们会帮助你。我们不是来为他们编写代码的。好了,我来帮你开始吧。对不起我的错误,我已经编辑了我的文章。