用Python阅读网页上的普通文本

用Python阅读网页上的普通文本,python,Python,我想知道是否有一种方法可以读取网页的文本来与其他值进行比较,比如 网页:“玉米饼” Python程序: x=the webpage text if x == 'Tacos': print('The text is: ', x) Web抓取是使用Python执行的一项非常常见的任务。如果您有一个直接链接到您想要从中获取文本的网页,那么您可以使用get请求来获取HTML: from requests import get html_as_text = get(url_to_webpage).

我想知道是否有一种方法可以读取网页的文本来与其他值进行比较,比如 网页:“玉米饼” Python程序:

x=the webpage text
 if x == 'Tacos':
 print('The text is: ', x)

Web抓取是使用Python执行的一项非常常见的任务。如果您有一个直接链接到您想要从中获取文本的网页,那么您可以使用
get
请求来获取HTML:

from requests import get

html_as_text = get(url_to_webpage).text
然后您可以使用来解析它:

from bs4 import BeautifulSoup
html = BeautifulSoup(html_as_text, 'html.parser')
print(html.prettify())

如果您没有到该网页的直接链接,可以使用类似的方式导航到该网页。

从请求导入获取从bs4导入BeautifulSoup url\u到\u网页=''html\u as\u text=get(url\u到\u网页)html=BeautifulSoup(html\u as\u text,'html.parser')print(soup.prettify())我写了这篇文章,但收到一个错误html=BeautifulSoup(html_as_text,'html.parser')文件“/usr/local/lib/python2.7/site packages/bs4/_init__uuuuu.py”,第307行,在init elif len(标记)中哦,这是我的错。你需要在get函数的末尾添加
.text
。用正确的代码编辑答案。很抱歉给你带来不便,但现在我得到了一个错误名称error:name'soup'未定义。你需要键入
html.prettify()
如果没有办法阅读网页文本并与其他值进行比较,而不是soupI,那么很可能是的。请参阅。