Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/70.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
替代<;br/>;使用python&;靓汤_Python_Html_Beautifulsoup - Fatal编程技术网

替代<;br/>;使用python&;靓汤

替代<;br/>;使用python&;靓汤,python,html,beautifulsoup,Python,Html,Beautifulsoup,Html代码行如上所示 我设法从他那里得到了它 不过,它的打印方式是这样的'29 BOSWALL Parkway Edinburghehh5 2BR' 如果文本之间有,则将其替换为“无空格” 我想在当前有的地方加一个逗号 有人能推荐一种方法吗?来自bs4 import BeautifulSoup from bs4 import BeautifulSoup soup = BeautifulSoup('<td rowspan="1">29 BOSWALL PARKWAY<br /&

Html代码行如上所示

我设法从他那里得到了它

不过,它的打印方式是这样的
'29 BOSWALL Parkway Edinburghehh5 2BR'

如果文本之间有

,则将其替换为
“无空格”

我想在当前有

的地方加一个逗号

有人能推荐一种方法吗?

来自bs4 import BeautifulSoup
from bs4 import BeautifulSoup
soup = BeautifulSoup('<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>')
text_list = soup.td.contents
text_you_want = '{}, {}, {}'.format(text_list[0], text_list[2], text_list[4])

// similarly

text_you_want = ", ".join([item for item in text_list if isinstance(item, str)])
汤=BeautifulSoup('29 BOSWALL PARKWAY
爱丁堡
EHS 2BR') text_list=soup.td.contents 您想要的文本=“{},{},{}”。格式(文本列表[0]、文本列表[2]、文本列表[4]) //同样地 text_you_want=“,”.join([item for item in text_list if is instance(item,str)])
来自bs4导入组
汤=BeautifulSoup('29 BOSWALL PARKWAY
爱丁堡
EHS 2BR') text_list=soup.td.contents 您想要的文本=“{},{},{}”。格式(文本列表[0]、文本列表[2]、文本列表[4]) //同样地 text_you_want=“,”.join([item for item in text_list if is instance(item,str)])
获取节点文本时,可以设置分隔符

from bs4 import BeautifulSoup

example = """<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>"""

soup = BeautifulSoup(example, "xml")

print(soup.find("td").get_text(strip=True, separator=','))
从bs4导入美化组
示例=“29博斯沃尔公园路
爱丁堡
EHS 2BR”“” soup=BeautifulSoup(例如,“xml”) 打印(soup.find(“td”).get_文本(strip=True,separator=','))
产出:

爱丁堡博斯沃尔公园路29号,EHS 2BR


获取节点文本时,可以设置分隔符

from bs4 import BeautifulSoup

example = """<td rowspan="1">29 BOSWALL PARKWAY<br />EDINBURGH<br />EHS 2BR</td>"""

soup = BeautifulSoup(example, "xml")

print(soup.find("td").get_text(strip=True, separator=','))
从bs4导入美化组
示例=“29博斯沃尔公园路
爱丁堡
EHS 2BR”“” soup=BeautifulSoup(例如,“xml”) 打印(soup.find(“td”).get_文本(strip=True,separator=','))
产出:

爱丁堡博斯沃尔公园路29号,EHS 2BR


我想到了一些可能的方法:

  • 使用
    。获取文本(分隔符=”)
    。这些部分将被一个空格隔开
  • 在BeautifulSoup4中,您可以使用<代码>“”.join(LeftBlockData[3].字符串)

  • 我想到了一些可能的方法:

  • 使用
    。获取文本(分隔符=”)
    。这些部分将被一个空格隔开
  • 在BeautifulSoup4中,您可以使用<代码>“”.join(LeftBlockData[3].字符串)

  • 当然,我添加了更多的代码谢谢。当然,我添加了更多的代码谢谢。再次感谢zroq,在我的代码a的最后第二行中,我将Address=LeftBlockData[3]。get_text(strip=True,separator=','),它工作得非常好!!再次感谢zroq,在我代码a的最后一行的第二行,我把Address=LeftBlockData[3]放在上面,得到了文本(strip=True,separator=','),它工作得非常好!!