Python 蟒蛇:我如何脱衣<;脚本>;及</脚本>;没有导入的HTML标签?
如上所述,输入HTML是一个字符串。我可以使用什么简单易懂的方法来删除标签?我想在他们之间保留信息。您可以这样做:Python 蟒蛇:我如何脱衣<;脚本>;及</脚本>;没有导入的HTML标签?,python,html,parsing,tags,remove,Python,Html,Parsing,Tags,Remove,如上所述,输入HTML是一个字符串。我可以使用什么简单易懂的方法来删除标签?我想在他们之间保留信息。您可以这样做: new_string=html_string.replace(“”,).replace(“”,) 但请记住,这不是一种为跨站点脚本(XSS)清理字符串的保存方式。有许多其他方法可以在不使用脚本标记的情况下触发XSS。例如,使用图像标签的onload功能: 阅读更多关于XSS的信息对于您来说,不导入任何内容似乎很奇怪 您可以尝试这样做,以便从任何标记中提取文本 >text='A
new_string=html_string.replace(“”,).replace(“”,)
但请记住,这不是一种为跨站点脚本(XSS)清理字符串的保存方式。有许多其他方法可以在不使用脚本标记的情况下触发XSS。例如,使用图像标签的onload
功能:
阅读更多关于XSS的信息对于您来说,不导入任何内容似乎很奇怪 您可以尝试这样做,以便从任何标记中提取文本
>text='ABCD'
>>>text.split('>')[1]。split(“您好,谢谢您的评论。我之前忘了提及,但有些页面的脚本标记中包含文本。此方法不会处理诸如:@user14233932的标记。StackOverflow上有很多问题涉及此。您在提问之前是否进行过搜索?@PranavHosangadi您好,之前的所有问题都需要使用module:regexp、BeautifulSoup等。更好的复制: