如何从urllib python获取网站的特定部分

如何从urllib python获取网站的特定部分,python,urllib,Python,Urllib,所以,现在我有这个非常简单的代码,只是为了从网站上收集信息,下面是代码 导入urllib.request f=urllib.request.urlopen(“https://generator.email/") 打印(f.read()) 我只想看到页面上显示电子邮件的部分,但我不知道从哪里开始。有人有什么想法吗 当我在wing ide中运行程序时,它会给我一个垃圾响应,下面是一个响应: 无法在此处发布全文,但您可以在该链接中看到,从您的问题中,您似乎需要学习网页抓取的基础知识。您可以从Beaut

所以,现在我有这个非常简单的代码,只是为了从网站上收集信息,下面是代码

导入urllib.request
f=urllib.request.urlopen(“https://generator.email/")
打印(f.read())

我只想看到页面上显示电子邮件的部分,但我不知道从哪里开始。有人有什么想法吗

当我在wing ide中运行程序时,它会给我一个垃圾响应,下面是一个响应:


无法在此处发布全文,但您可以在该链接中看到,

从您的问题中,您似乎需要学习网页抓取的基础知识。您可以从BeautifulSoup或Scrapy开始构建爬虫。就您的问题而言,您想要的电子邮件文本部分可以通过BeautifulSoup和python请求模块轻松实现:

import requests
from bs4 import BeautifulSoup

base_url = 'https://generator.email/'
r = requests.get(base_url)
soup = BeautifulSoup(r.text, "html.parser")
data = soup.find_all('span', {"id":"email_ch_text"})
print(data[0].text)

我个人的观点是,你的问题太宽泛了,我“连开始都没有线索”有时这意味着你必须先努力学习基础知识(HTML和Web编程基础知识)。请别人解决你的问题不是你应该用的方法。一个好问题通常要具体得多。我知道你要找的东西叫“刮”。您需要使用解析器或更高级别的库(如Beauty Soup),然后您可以告诉它如何通过XPath或css选择器或一系列简单的
find
调用来查找所需的部分。但是,在你知道这意味着什么之前,你将无法做到这一点,因此你需要找到一些关于“用Python中的靓汤刮汤”或类似的教程,并完成它。非常感谢!你是最棒的!