Python 3.2是否有本机HTML解析模块?
我正在尝试解析一些html。我想要类似于Python 3.2是否有本机HTML解析模块?,python,html,python-3.x,Python,Html,Python 3.x,我正在尝试解析一些html。我想要类似于sgmllib的东西,但它在Python3.2中被弃用 是否有其他模块可供我使用 谢谢。内置HTMLPasser模块: 不是本地人,但值得一提; 美丽小组: 我不知道你说的“本地”是什么意思,但我非常喜欢。+1表示“靓汤”,因为现实世界的HTML是一团乱麻。“不管你往它扔什么垃圾,它都会滚过来,然后微笑着走出来。”@Peter:不幸的是,BeautifulSoup在Python 3中工作得不太好,因为它依赖于sgmllib。我在新的html5lib上做了
sgmllib
的东西,但它在Python3.2中被弃用
是否有其他模块可供我使用
谢谢。内置HTMLPasser模块: 不是本地人,但值得一提; 美丽小组:
我不知道你说的“本地”是什么意思,但我非常喜欢。+1表示“靓汤”,因为现实世界的HTML是一团乱麻。“不管你往它扔什么垃圾,它都会滚过来,然后微笑着走出来。”@Peter:不幸的是,BeautifulSoup在Python 3中工作得不太好,因为它依赖于sgmllib。我在新的html5lib上做了很多工作,但还不完整。(如果你感兴趣的话,可以随意做)。太好了。我想我会使用HTMLPasser,因为它非常类似于
sgmllib
。我还读了很多关于BeautifulSoup
的书,人们都在抱怨Python 3的兼容性问题。谢谢。在那个页面上,它说Python3.1有问题,但在3.2中修复了:@utdmr:不幸的共同事件-这些是BeautifulSoup本身的版本号。BS3.2与Python3.x不兼容。只有BS3.1(有问题的版本)在Python3.x上运行。我认为lxml更好:更灵活、更快。特别是当与扭曲使用。