如何从urllib python获取网站的特定部分_Python_Urllib

如何从urllib python获取网站的特定部分

python

如何从urllib python获取网站的特定部分,python,urllib,Python,Urllib,所以，现在我有这个非常简单的代码，只是为了从网站上收集信息，下面是代码导入urllib.request f=urllib.request.urlopen（“https://generator.email/") 打印（f.read（））我只想看到页面上显示电子邮件的部分，但我不知道从哪里开始。有人有什么想法吗当我在wing ide中运行程序时，它会给我一个垃圾响应，下面是一个响应：无法在此处发布全文，但您可以在该链接中看到，从您的问题中，您似乎需要学习网页抓取的基础知识。您可以从Beaut

所以，现在我有这个非常简单的代码，只是为了从网站上收集信息，下面是代码

导入urllib.request
f=urllib.request.urlopen（“https://generator.email/")
打印（f.read（））

我只想看到页面上显示电子邮件的部分，但我不知道从哪里开始。有人有什么想法吗

当我在wing ide中运行程序时，它会给我一个垃圾响应，下面是一个响应：

无法在此处发布全文，但您可以在该链接中看到，

从您的问题中，您似乎需要学习网页抓取的基础知识。您可以从BeautifulSoup或Scrapy开始构建爬虫。就您的问题而言，您想要的电子邮件文本部分可以通过BeautifulSoup和python请求模块轻松实现：

import requests
from bs4 import BeautifulSoup

base_url = 'https://generator.email/'
r = requests.get(base_url)
soup = BeautifulSoup(r.text, "html.parser")
data = soup.find_all('span', {"id":"email_ch_text"})
print(data[0].text)

我个人的观点是，你的问题太宽泛了，我“连开始都没有线索”有时这意味着你必须先努力学习基础知识（HTML和Web编程基础知识）。请别人解决你的问题不是你应该用的方法。一个好问题通常要具体得多。我知道你要找的东西叫“刮”。您需要使用解析器或更高级别的库（如Beauty Soup），然后您可以告诉它如何通过XPath或css选择器或一系列简单的

find

调用来查找所需的部分。但是，在你知道这意味着什么之前，你将无法做到这一点，因此你需要找到一些关于“用Python中的靓汤刮汤”或类似的教程，并完成它。非常感谢！你是最棒的！