替代<;br/>;使用python&;靓汤
Html代码行如上所示 我设法从他那里得到了它 不过,它的打印方式是这样的替代<;br/>;使用python&;靓汤,python,html,beautifulsoup,Python,Html,Beautifulsoup,Html代码行如上所示 我设法从他那里得到了它 不过,它的打印方式是这样的'29 BOSWALL Parkway Edinburghehh5 2BR' 如果文本之间有,则将其替换为“无空格” 我想在当前有的地方加一个逗号 有人能推荐一种方法吗?来自bs4 import BeautifulSoup from bs4 import BeautifulSoup soup = BeautifulSoup('<td rowspan="1">29 BOSWALL PARKWAY<br /&
'29 BOSWALL Parkway Edinburghehh5 2BR'
如果文本之间有
,则将其替换为“无空格”
我想在当前有
的地方加一个逗号
有人能推荐一种方法吗?来自bs4 import BeautifulSoup
from bs4 import BeautifulSoup
soup = BeautifulSoup('<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>')
text_list = soup.td.contents
text_you_want = '{}, {}, {}'.format(text_list[0], text_list[2], text_list[4])
// similarly
text_you_want = ", ".join([item for item in text_list if isinstance(item, str)])
汤=BeautifulSoup('29 BOSWALL PARKWAY
爱丁堡
EHS 2BR')
text_list=soup.td.contents
您想要的文本=“{},{},{}”。格式(文本列表[0]、文本列表[2]、文本列表[4])
//同样地
text_you_want=“,”.join([item for item in text_list if is instance(item,str)])
来自bs4导入组
汤=BeautifulSoup('29 BOSWALL PARKWAY
爱丁堡
EHS 2BR')
text_list=soup.td.contents
您想要的文本=“{},{},{}”。格式(文本列表[0]、文本列表[2]、文本列表[4])
//同样地
text_you_want=“,”.join([item for item in text_list if is instance(item,str)])
获取节点文本时,可以设置分隔符
from bs4 import BeautifulSoup
example = """<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>"""
soup = BeautifulSoup(example, "xml")
print(soup.find("td").get_text(strip=True, separator=','))
从bs4导入美化组
示例=“29博斯沃尔公园路
爱丁堡
EHS 2BR”“”
soup=BeautifulSoup(例如,“xml”)
打印(soup.find(“td”).get_文本(strip=True,separator=','))
产出:
爱丁堡博斯沃尔公园路29号,EHS 2BR
获取节点文本时,可以设置分隔符
from bs4 import BeautifulSoup
example = """<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>"""
soup = BeautifulSoup(example, "xml")
print(soup.find("td").get_text(strip=True, separator=','))
从bs4导入美化组
示例=“29博斯沃尔公园路
爱丁堡
EHS 2BR”“”
soup=BeautifulSoup(例如,“xml”)
打印(soup.find(“td”).get_文本(strip=True,separator=','))
产出:
爱丁堡博斯沃尔公园路29号,EHS 2BR
我想到了一些可能的方法:
。获取文本(分隔符=”)
。这些部分将被一个空格隔开我想到了一些可能的方法:
。获取文本(分隔符=”)
。这些部分将被一个空格隔开当然,我添加了更多的代码谢谢。当然,我添加了更多的代码谢谢。再次感谢zroq,在我的代码a的最后第二行中,我将Address=LeftBlockData[3]。get_text(strip=True,separator=','),它工作得非常好!!再次感谢zroq,在我代码a的最后一行的第二行,我把Address=LeftBlockData[3]放在上面,得到了文本(strip=True,separator=','),它工作得非常好!!