Python剽窃检查文本与在线源代码的比较

Python剽窃检查文本与在线源代码的比较,python,Python,我正在创建一个python程序,它在web上搜索源文件中的特定文本片段,以查看它们是否在线/是否剽窃。我目前正在使用google和beautifulsoup的组合来查找可能有这段文本的网站(字面上就像我在google上搜索字符串一样),但我不知道如何实际搜索每个特定的网站。我正在寻找关于如何在每个网站上搜索文本字符串的建议。(*目前对python的这一方面还很陌生)任何建议都将不胜感激!谢谢你的时间 我认为bs有提取html页面文本的方法。否则,您可以简单地遍历html正文并递归提取文本。我认为

我正在创建一个python程序,它在web上搜索源文件中的特定文本片段,以查看它们是否在线/是否剽窃。我目前正在使用google和beautifulsoup的组合来查找可能有这段文本的网站(字面上就像我在google上搜索字符串一样),但我不知道如何实际搜索每个特定的网站。我正在寻找关于如何在每个网站上搜索文本字符串的建议。(*目前对python的这一方面还很陌生)任何建议都将不胜感激!谢谢你的时间

我认为bs有提取html页面文本的方法。否则,您可以简单地遍历html正文并递归提取文本。我认为bs有方法提取html页面的文本。否则,您只需遍历html正文并递归提取文本即可