用Python阅读网页上的普通文本_Python

用Python阅读网页上的普通文本

python

用Python阅读网页上的普通文本,python,Python,我想知道是否有一种方法可以读取网页的文本来与其他值进行比较，比如网页：“玉米饼” Python程序： x=the webpage text if x == 'Tacos': print('The text is: ', x) Web抓取是使用Python执行的一项非常常见的任务。如果您有一个直接链接到您想要从中获取文本的网页，那么您可以使用get请求来获取HTML： from requests import get html_as_text = get(url_to_webpage).

我想知道是否有一种方法可以读取网页的文本来与其他值进行比较，比如网页：“玉米饼” Python程序：

x=the webpage text
 if x == 'Tacos':
 print('The text is: ', x)

Web抓取是使用Python执行的一项非常常见的任务。如果您有一个直接链接到您想要从中获取文本的网页，那么您可以使用

get

请求来获取HTML：

from requests import get

html_as_text = get(url_to_webpage).text

然后您可以使用来解析它：

from bs4 import BeautifulSoup
html = BeautifulSoup(html_as_text, 'html.parser')
print(html.prettify())

如果您没有到该网页的直接链接，可以使用类似的方式导航到该网页。

从请求导入获取从bs4导入BeautifulSoup url\u到\u网页=''html\u as\u text=get（url\u到\u网页）html=BeautifulSoup（html\u as\u text，'html.parser'）print（soup.prettify（））我写了这篇文章，但收到一个错误html=BeautifulSoup（html_as_text，'html.parser'）文件“/usr/local/lib/python2.7/site packages/bs4/_init__uuuuu.py”，第307行，在init elif len（标记）中哦，这是我的错。你需要在get函数的末尾添加

.text

。用正确的代码编辑答案。很抱歉给你带来不便，但现在我得到了一个错误名称error:name'soup'未定义。你需要键入

html.prettify（）

如果没有办法阅读网页文本并与其他值进行比较，而不是soupI，那么很可能是的。请参阅。