如何使用Python只获取网页的文本,就像selectall&;在浏览器中复制?

如何使用Python只获取网页的文本,就像selectall&;在浏览器中复制?,python,Python,我想获取“Main content”,而不是Main content,后者是html代码,可以使用urllib.urlopen(url)检索 就像在浏览器中打开url一样,选择所有文本,然后复制粘贴 有没有一种可能的方法可以通过Python实现这一点 谢谢。看一看 Beauty Soup是一个Python HTML/XML解析器,专为屏幕抓取等快速周转项目而设计。三大功能使其功能强大: 如果你给它加不好的加价,漂亮的汤就不会呛人。它生成的解析树与原始文档的意义大致相同。这通常足以收集您所需的数据

我想获取“Main content”,而不是Main content,后者是html代码,可以使用urllib.urlopen(url)检索

就像在浏览器中打开url一样,选择所有文本,然后复制粘贴

有没有一种可能的方法可以通过Python实现这一点

谢谢。

看一看

Beauty Soup是一个Python HTML/XML解析器,专为屏幕抓取等快速周转项目而设计。三大功能使其功能强大:

  • 如果你给它加不好的加价,漂亮的汤就不会呛人。它生成的解析树与原始文档的意义大致相同。这通常足以收集您所需的数据,然后逃之夭夭
  • Beauty Soup提供了一些用于导航、搜索和修改解析树的简单方法和Python习惯用法:一个用于解析文档和提取所需内容的工具包。您不必为每个应用程序创建自定义解析器
  • Beauty Soup自动将传入文档转换为Unicode,将传出文档转换为UTF-8。您不必考虑编码,除非文档没有指定编码,并且Beauty Soup无法自动检测编码。然后您只需指定原始编码
  • 复制品?