替代<；br/>；使用python&；靓汤_Python_Html_Beautifulsoup

替代<；br/>；使用python&；靓汤

python html

替代<；br/>；使用python&；靓汤,python,html,beautifulsoup,Python,Html,Beautifulsoup,Html代码行如上所示我设法从他那里得到了它不过，它的打印方式是这样的'29 BOSWALL Parkway Edinburghehh5 2BR' 如果文本之间有，则将其替换为“无空格” 我想在当前有的地方加一个逗号有人能推荐一种方法吗？来自bs4 import BeautifulSoup from bs4 import BeautifulSoup soup = BeautifulSoup('<td rowspan="1">29 BOSWALL PARKWAY<br /&

Html代码行如上所示

我设法从他那里得到了它

不过，它的打印方式是这样的

'29 BOSWALL Parkway Edinburghehh5 2BR'

如果文本之间有

，则将其替换为

“无空格”

我想在当前有

的地方加一个逗号

有人能推荐一种方法吗？

来自bs4 import BeautifulSoup
from bs4 import BeautifulSoup
soup = BeautifulSoup('<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>')
text_list = soup.td.contents
text_you_want = '{}, {}, {}'.format(text_list[0], text_list[2], text_list[4])

// similarly

text_you_want = ", ".join([item for item in text_list if isinstance(item, str)])

汤=BeautifulSoup（'29 BOSWALL PARKWAY
爱丁堡
EHS 2BR'）
text_list=soup.td.contents
您想要的文本=“{}，{}，{}”。格式（文本列表[0]、文本列表[2]、文本列表[4]）
//同样地
text_you_want=“，”.join（[item for item in text_list if is instance（item，str）]）

来自bs4导入组
汤=BeautifulSoup（'29 BOSWALL PARKWAY
爱丁堡
EHS 2BR'）
text_list=soup.td.contents
您想要的文本=“{}，{}，{}”。格式（文本列表[0]、文本列表[2]、文本列表[4]）
//同样地
text_you_want=“，”.join（[item for item in text_list if is instance（item，str）]）

获取节点文本时，可以设置分隔符

from bs4 import BeautifulSoup

example = """<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>"""

soup = BeautifulSoup(example, "xml")

print(soup.find("td").get_text(strip=True, separator=','))

从bs4导入美化组
示例=“29博斯沃尔公园路
爱丁堡
EHS 2BR”“”
soup=BeautifulSoup（例如，“xml”）
打印（soup.find（“td”）.get_文本（strip=True，separator='，'））

产出：

爱丁堡博斯沃尔公园路29号，EHS 2BR

获取节点文本时，可以设置分隔符

from bs4 import BeautifulSoup

example = """<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>"""

soup = BeautifulSoup(example, "xml")

print(soup.find("td").get_text(strip=True, separator=','))

从bs4导入美化组
示例=“29博斯沃尔公园路
爱丁堡
EHS 2BR”“”
soup=BeautifulSoup（例如，“xml”）
打印（soup.find（“td”）.get_文本（strip=True，separator='，'））

产出：

爱丁堡博斯沃尔公园路29号，EHS 2BR

我想到了一些可能的方法：

使用

。获取文本（分隔符=”）

。这些部分将被一个空格隔开

在BeautifulSoup4中，您可以使用<代码>“”.join（LeftBlockData[3].字符串）

我想到了一些可能的方法：

使用

。获取文本（分隔符=”）

。这些部分将被一个空格隔开

在BeautifulSoup4中，您可以使用<代码>“”.join（LeftBlockData[3].字符串）

当然，我添加了更多的代码谢谢。当然，我添加了更多的代码谢谢。再次感谢zroq，在我的代码a的最后第二行中，我将Address=LeftBlockData[3]。get_text（strip=True，separator='，'），它工作得非常好！！再次感谢zroq，在我代码a的最后一行的第二行，我把Address=LeftBlockData[3]放在上面，得到了文本（strip=True，separator='，'），它工作得非常好！！