如何处理Python中不完整的html标记?

如何处理Python中不完整的html标记?,python,html-parsing,wysiwyg,Python,Html Parsing,Wysiwyg,背景:- 我在我的网站上使用JS编辑器。现在,当我复制粘贴外部文本内容时,会粘贴一些无效/不完整的html标记。(但它在编辑器上不可见) 问题:- 现在,当这些数据被发布时,整个页面的对齐就被破坏了。如何检测和更改不完整的html标记(如果有)。我应该为此使用html解析器吗? 如您所见,编辑和删除按钮已从div中出来(说明或数据已复制粘贴)您可以尝试使用奇妙的库满足所有解析需求。现在就买 您可以尝试使用奇妙的库满足所有解析需求。现在就买 +1对于Beauty Soup,它是一个很棒的HTM

背景:- 我在我的网站上使用JS编辑器。现在,当我复制粘贴外部文本内容时,会粘贴一些无效/不完整的html标记。(但它在编辑器上不可见)

问题:- 现在,当这些数据被发布时,整个页面的对齐就被破坏了。如何检测和更改不完整的html标记(如果有)。我应该为此使用html解析器吗?


如您所见,编辑和删除按钮已从div中出来(说明或数据已复制粘贴)

您可以尝试使用奇妙的库满足所有解析需求。现在就买

您可以尝试使用奇妙的库满足所有解析需求。现在就买

+1对于Beauty Soup,它是一个很棒的HTML解析器,可以很好地处理格式错误的HTML。+1对于Beauty Soup,它是一个很棒的HTML解析器,可以很好地处理格式错误的HTML。