Html 解析<；br>；带有beautifulsoup的标记_Html_Web Scraping_Beautifulsoup_Tags_Web Crawler

Html 解析<；br>；带有beautifulsoup的标记

html web-scraping tags web-crawler

Html 解析<；br>；带有beautifulsoup的标记,html,web-scraping,beautifulsoup,tags,web-crawler,Html,Web Scraping,Beautifulsoup,Tags,Web Crawler,我正在抓取一个网站，标签的结构是： <div class="content" "C Space" "802 white avenue" "xyz 123" "Lima" 我得到以下输出： C Space802白色大道123利马而我希望输出是：C空间80

我正在抓取一个网站，标签的结构是：

<div class="content"
    <p> 
        "C Space"
        <br>
        "802 white avenue"
        <br>
        "xyz 123"
        <br>
        "Lima"
    </p>

我得到以下输出： C Space802白色大道123利马

而我希望输出是：C空间802白色大道xyz 123利马

从后续br标记获取数据时，如何添加额外的空白

谢谢

您可以在此处使用

split

和

join

：

>>> ' '.join(templist.get_text().split())
'"C Space" "802 white avenue" "xyz 123" "Lima"'

您可以使用以下参数：

In [4]: elm = soup.select_one(".content")

In [5]: print(elm.get_text(strip=True, separator=" "))
"C Space" "802 white avenue" "xyz 123" "Lima"

In [4]: elm = soup.select_one(".content")

In [5]: print(elm.get_text(strip=True, separator=" "))
"C Space" "802 white avenue" "xyz 123" "Lima"