Python-Beautiful Soup-删除之前的值<;br>;标签
我在一个用br分隔的标记中有数据,我试图找出如何删除br标记之前的所有值,但遇到了困难 以下是我的数据的示例:Python-Beautiful Soup-删除之前的值<;br>;标签,python,beautifulsoup,Python,Beautifulsoup,我在一个用br分隔的标记中有数据,我试图找出如何删除br标记之前的所有值,但遇到了困难 以下是我的数据的示例: 要删除的值 值保留 也许: text = text.split('<br/>')[-1] print(text.replace('</td>','').strip()) 您可以使用正则表达式来完成特定的任务 您可以尝试以下适用于我的代码(需要测试更多案例): 重新导入 html=”“” 要删除的值 值保留 """ value\u search=re.s
要删除的值
值保留
也许:
text = text.split('<br/>')[-1]
print(text.replace('</td>','').strip())
您可以使用正则表达式来完成特定的任务 您可以尝试以下适用于我的代码(需要测试更多案例):
重新导入
html=”“”
要删除的值
值保留
"""
value\u search=re.search(r'\(.*),html,re.IGNORECASE)
如果是值搜索:
值=标题搜索组(1)
打印(值)
您可以通过使用正则表达式模式来实现这一点,这样做可能会奏效^ \(.*)请注意,您要查找的内容将在第一组中如果文本中有\n
?
from bs4 import BeautifulSoup as soup
soup_ = soup(html,'html.parser')
soup_ = soup_.find('td').text.split('\n')[-2]
import re
html=""" <td>
ValueToBeDeleted
<br>
<br/> ValueToKeep
</td>"""
value_search = re.search(r'\<br\/\>(.*)', html, re.IGNORECASE)
if value_search:
value = title_search.group(1)
print(value)