Python 如何提取这段文本
我正在尝试从下面的代码获取电子邮件Python 如何提取这段文本,python,beautifulsoup,Python,Beautifulsoup,我正在尝试从下面的代码获取电子邮件 <div class="col-lg-4" style="border-left:1px solid #d0d0d0;"> <p> <img class="img-responsive" src="/uploads/logos/b75ba9c72de548d665b233d547d92402.jpg" alt=" AJ Navalho"> </p> <h4&g
<div class="col-lg-4" style="border-left:1px solid #d0d0d0;">
<p>
<img class="img-responsive" src="/uploads/logos/b75ba9c72de548d665b233d547d92402.jpg" alt=" AJ Navalho">
</p>
<h4> AJ Navalho</h4>
<p>SEDE/LOJA<br>
Rua Rómulo de Carvalho, n.º 15
<br>
Pendão - 2745-373 Queluz
<br>
<br>
ARMAZÉM
<br>
Rua Mário Castelhano, n.º 42
<br>
Queluz de Baixo
<br>
2745-575 Barcarena
</p>
<h3>
<i class="fa fa-phone"></i>
21 435 38 67
</h3>
<p>
<i class="fa fa-envelope"></i>
ajnavalho@ajnavalho.pt
</p>
</div>
纳瓦略酒店
SEDE/LOJA
鲁阿·罗穆洛·德卡瓦略,北纬15度
潘多-2745-373克卢兹
阿玛兹埃姆
Rua Mário Castelhano,北纬42度
克卢兹德拜克索
2745-575巴尔卡雷纳
21 435 38 67
ajnavalho@ajnavalho.pt
我如何从“fa-fa信封”课程中获取电子邮件?
我不擅长html,所以我不知道什么是文本,如果这意味着什么的话。使用BeautifulSoup 演示:
from bs4 import BeautifulSoup
s = -->>Your HTML
soup = BeautifulSoup(s, "html.parser")
print(soup.find("i", class_="fa fa-envelope").parent.text.strip())
ajnavalho@ajnavalho.pt
输出:
from bs4 import BeautifulSoup
s = -->>Your HTML
soup = BeautifulSoup(s, "html.parser")
print(soup.find("i", class_="fa fa-envelope").parent.text.strip())
ajnavalho@ajnavalho.pt
这对我很有用:
from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen("https://www.oportaldaconstrucao.com/empresa/1964/aj-navalho/").read()
soup = BeautifulSoup(r, 'lxml')
letter = soup.find_all("i", class_="fa fa-envelope")[0].next_sibling
print letter
输出:
ajnavalho@ajnavalho.pt
你能提供更多关于你需要什么的信息吗?在我提供的链接上,右边有一个小信封,我正在尝试获取信封(电子邮件)右边的文本。无法访问链接。AttributeError:“NoType”对象没有属性“parent”打印什么(soup.find(“I”,class=“fa envelope”))print?抛出一个错误>AttributeError:'NoneType'对象没有属性'parent','module'urllib'没有属性'urlopen'。另外,python 3.6Yeah我正在使用python3Try,并将
import urllib.request和urllib.request.urlopen(“html adress”)作为url:r=url.read()
不幸的是,我无法在这台电脑中尝试python3代码