如何在Python3中删除具有相同id的html源Duplicate元素

如何在Python3中删除具有相同id的html源Duplicate元素,python,Python,我正在使用Python3通过feedparser(6.0.2)lib提取RSS数据,最终在flatter应用程序中呈现文章html文本。现在我面临的一个问题是,html源数据有一些非标准的内容。例如,这个: 责任编辑:靖宇<br /></p><p>图片来源:TikTok官网、Pixabay</p><div id="article-body"><div><div id="article-bo

我正在使用Python3通过
feedparser
(6.0.2)lib提取RSS数据,最终在flatter应用程序中呈现文章html文本。现在我面临的一个问题是,html源数据有一些非标准的内容。例如,这个:

责任编辑:靖宇<br /></p><p>图片来源:TikTok官网、Pixabay</p><div id="article-body"><div><div id="article-body"><div><p>本文由极客公园 GeekPark 原创发布,转载请添加极客君微信 geekparker</p></div></div></div></div>
责任编辑:靖宇

图片来源:TIKTOK官网、皮克斯湾本文由极客公园 极客公园原创发布,转载请添加极客君微信 极客

html文本有两个div元素,它们具有相同的id
文章主体
,这使得flatter html呈现偶尔执行一些意外的操作。现在,如果源html文本包含Duplicate,我想删除具有相同id的Duplicate元素。在Python3中可以这样做吗?或者有一个函数来确定html内容是否标准