Qt中是否有用于从HTML中提取数据的类?

Qt中是否有用于从HTML中提取数据的类?,qt,pyqt,pyside,Qt,Pyqt,Pyside,Qt文档说 提供QtXML模块是为了与旧代码兼容。信息技术 已被QXMLStreamReader和QXMLStreamWriter取代 Qt核心模块中的类 我认为在这个声明之前,我们可以使用QDom*类从HTML中获取数据,尽管我从未使用过它。 这是否意味着我们可以使用QXmlStreamReader从HTML中提取数据? 我不知道XML和HTML之间的区别。XML代表“可扩展标记语言”,而HTML代表超文本标记语言。简单地说,它们不是相同的,或者至少不是用于相同的目的 XML HTML 看看h

Qt文档说

提供QtXML模块是为了与旧代码兼容。信息技术 已被QXMLStreamReader和QXMLStreamWriter取代 Qt核心模块中的类

我认为在这个声明之前,我们可以使用QDom*类从HTML中获取数据,尽管我从未使用过它。 这是否意味着我们可以使用QXmlStreamReader从HTML中提取数据? 我不知道XML和HTML之间的区别。

XML代表“可扩展标记语言”,而HTML代表超文本标记语言。简单地说,它们不是相同的,或者至少不是用于相同的目的

XML

HTML

看看html和xml,它们看起来很相似,因为它们都包含用于定义元素的标记,尽管html使用的元素是固定的集合,而xml的元素是元素所在文档的元数据


由于XML元素可以自由命名,与HTML不同,HTML可以添加到DOM文档中。至于能够使用QXmlStreamReader,根据,看起来您可以,但请注意,该问题的OP将html包装在一个XML标记中,我认为这是Dom文档接受数据解析所必需的。

因为您也使用pyqt和pyside标记了您的问题,可能值得注意的是,python中还有各种xml/html解析器,例如,
beautifulsoup
似乎相当流行。