Python 如何提取这段文本_Python_Beautifulsoup

Python 如何提取这段文本

python

Python 如何提取这段文本,python,beautifulsoup,Python,Beautifulsoup,我正在尝试从下面的代码获取电子邮件 <div class="col-lg-4" style="border-left:1px solid #d0d0d0;"> <p> <img class="img-responsive" src="/uploads/logos/b75ba9c72de548d665b233d547d92402.jpg" alt=" AJ Navalho"> </p> <h4&g

我正在尝试从下面的代码获取电子邮件

<div class="col-lg-4" style="border-left:1px solid #d0d0d0;">

    <p>
        <img class="img-responsive" src="/uploads/logos/b75ba9c72de548d665b233d547d92402.jpg" alt="    AJ Navalho">
    </p>
    <h4>    AJ Navalho</h4>
    <p>SEDE/LOJA<br>

    Rua Rómulo de Carvalho, n.º 15
    <br>

    Pendão - 2745-373 Queluz
    <br>

    <br>

    ARMAZÉM
    <br>

    Rua Mário Castelhano, n.º 42
    <br>

    Queluz de Baixo
    <br>

    2745-575 Barcarena
    </p>
    <h3>
        <i class="fa fa-phone"></i>
         21 435 38 67
    </h3>
    <p>
        <i class="fa fa-envelope"></i> 
        ajnavalho@ajnavalho.pt
    </p>
</div>




纳瓦略酒店
SEDE/LOJA

鲁阿·罗穆洛·德卡瓦略，北纬15度


潘多-2745-373克卢兹




阿玛兹埃姆


Rua Mário Castelhano，北纬42度


克卢兹德拜克索


2745-575巴尔卡雷纳

21 435 38 67

ajnavalho@ajnavalho.pt

我如何从“fa-fa信封”课程中获取电子邮件？

我不擅长html，所以我不知道什么是文本，如果这意味着什么的话。

使用BeautifulSoup

演示：

from bs4 import BeautifulSoup
s = -->>Your HTML
soup = BeautifulSoup(s, "html.parser")
print(soup.find("i", class_="fa fa-envelope").parent.text.strip())

ajnavalho@ajnavalho.pt

输出：

from bs4 import BeautifulSoup
s = -->>Your HTML
soup = BeautifulSoup(s, "html.parser")
print(soup.find("i", class_="fa fa-envelope").parent.text.strip())

ajnavalho@ajnavalho.pt

这对我很有用：

from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen("https://www.oportaldaconstrucao.com/empresa/1964/aj-navalho/").read()
soup = BeautifulSoup(r, 'lxml')
letter = soup.find_all("i", class_="fa fa-envelope")[0].next_sibling
print letter

输出：

ajnavalho@ajnavalho.pt

你能提供更多关于你需要什么的信息吗？在我提供的链接上，右边有一个小信封，我正在尝试获取信封（电子邮件）右边的文本。无法访问链接。AttributeError:“NoType”对象没有属性“parent”打印什么（soup.find（“I”，class=“fa envelope”））print？抛出一个错误>AttributeError:'NoneType'对象没有属性'parent'，'module'urllib'没有属性'urlopen'。另外，python 3.6Yeah我正在使用python3Try，并将

import urllib.request和urllib.request.urlopen（“html adress”）作为url:r=url.read（）

不幸的是，我无法在这台电脑中尝试python3代码