Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/334.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何提取这段文本_Python_Beautifulsoup - Fatal编程技术网

Python 如何提取这段文本

Python 如何提取这段文本,python,beautifulsoup,Python,Beautifulsoup,我正在尝试从下面的代码获取电子邮件 <div class="col-lg-4" style="border-left:1px solid #d0d0d0;"> <p> <img class="img-responsive" src="/uploads/logos/b75ba9c72de548d665b233d547d92402.jpg" alt=" AJ Navalho"> </p> <h4&g

我正在尝试从下面的代码获取电子邮件

<div class="col-lg-4" style="border-left:1px solid #d0d0d0;">

    <p>
        <img class="img-responsive" src="/uploads/logos/b75ba9c72de548d665b233d547d92402.jpg" alt="    AJ Navalho">
    </p>
    <h4>    AJ Navalho</h4>
    <p>SEDE/LOJA<br>

    Rua Rómulo de Carvalho, n.º 15
    <br>

    Pendão - 2745-373 Queluz
    <br>

    <br>

    ARMAZÉM
    <br>

    Rua Mário Castelhano, n.º 42
    <br>

    Queluz de Baixo
    <br>

    2745-575 Barcarena
    </p>
    <h3>
        <i class="fa fa-phone"></i>
         21 435 38 67
    </h3>
    <p>
        <i class="fa fa-envelope"></i> 
        ajnavalho@ajnavalho.pt
    </p>
</div>


纳瓦略酒店 SEDE/LOJA
鲁阿·罗穆洛·德卡瓦略,北纬15度
潘多-2745-373克卢兹

阿玛兹埃姆
Rua Mário Castelhano,北纬42度
克卢兹德拜克索
2745-575巴尔卡雷纳

21 435 38 67 ajnavalho@ajnavalho.pt

我如何从“fa-fa信封”课程中获取电子邮件?
我不擅长html,所以我不知道什么是文本,如果这意味着什么的话。

使用BeautifulSoup

演示:

from bs4 import BeautifulSoup
s = -->>Your HTML
soup = BeautifulSoup(s, "html.parser")
print(soup.find("i", class_="fa fa-envelope").parent.text.strip())
ajnavalho@ajnavalho.pt
输出:

from bs4 import BeautifulSoup
s = -->>Your HTML
soup = BeautifulSoup(s, "html.parser")
print(soup.find("i", class_="fa fa-envelope").parent.text.strip())
ajnavalho@ajnavalho.pt
这对我很有用:

from bs4 import BeautifulSoup
import urllib
r = urllib.urlopen("https://www.oportaldaconstrucao.com/empresa/1964/aj-navalho/").read()
soup = BeautifulSoup(r, 'lxml')
letter = soup.find_all("i", class_="fa fa-envelope")[0].next_sibling
print letter
输出:

ajnavalho@ajnavalho.pt

你能提供更多关于你需要什么的信息吗?在我提供的链接上,右边有一个小信封,我正在尝试获取信封(电子邮件)右边的文本。无法访问链接。AttributeError:“NoType”对象没有属性“parent”打印什么(soup.find(“I”,class=“fa envelope”))print?抛出一个错误>AttributeError:'NoneType'对象没有属性'parent','module'urllib'没有属性'urlopen'。另外,python 3.6Yeah我正在使用python3Try,并将
import urllib.request和urllib.request.urlopen(“html adress”)作为url:r=url.read()
不幸的是,我无法在这台电脑中尝试python3代码