使用Regex-python2.7从HTML中删除IMG标记
我有HTML,我想从中删除IMG标记 我不擅长正则表达式,我有这个函数,但它不删除IMG标签使用Regex-python2.7从HTML中删除IMG标记,python,regex,python-2.7,Python,Regex,Python 2.7,我有HTML,我想从中删除IMG标记 我不擅长正则表达式,我有这个函数,但它不删除IMG标签 def remove_img_tags(data): p = re.compile(r'<img.*?/>') return p.sub('', data) 什么是合适的正则表达式?我不想使用任何库。试试这个: image_tag = re.compile(r'<img.*?/>').search(data).group() data.replace(image
def remove_img_tags(data):
p = re.compile(r'<img.*?/>')
return p.sub('', data)
什么是合适的正则表达式?我不想使用任何库。试试这个:
image_tag = re.compile(r'<img.*?/>').search(data).group()
data.replace(image_tag, '')
试试这个:
image_tag = re.compile(r'<img.*?/>').search(data).group()
data.replace(image_tag, '')
您只需要捕获img标记并用空字符串替换它
clean_data = re.sub("(<img.*?>)", "", data, 0, re.IGNORECASE | re.DOTALL | re.MULTILINE)
您将在数据中传递HTML内容。Regex将删除所有img标记及其内容,并在clean_data变量中返回干净的数据。只需捕获img标记并用空字符串替换即可
clean_data = re.sub("(<img.*?>)", "", data, 0, re.IGNORECASE | re.DOTALL | re.MULTILINE)
您将在数据中传递HTML内容。Regex将删除所有img标记及其内容,并在clean_数据变量中返回干净的数据