C++ 从网页检索特定信息

C++ 从网页检索特定信息,c++,qt,qnetworkaccessmanager,C++,Qt,Qnetworkaccessmanager,我正在寻找一种使用Qt从网页获取特定信息的方法。到目前为止,我一直在使用QNetworkAccessManager,并设法获得包含页面中所有内容的HTTP响应 现在过滤这些信息并解析xml以获取相关信息的正确方法是什么?例如,如果您想查询wikipedia中的信息,如何只保存信息而不保存页面的源代码 您可以解析内容,只检索需要的信息,然后存储它 Qt为您提供了一些工具来帮助您实现这一点 政府对此有更多的信息 如果是有效的XML,则可以使用其他工具将损坏的XML HTML页面转换为有效的XML,如

我正在寻找一种使用Qt从网页获取特定信息的方法。到目前为止,我一直在使用
QNetworkAccessManager
,并设法获得包含页面中所有内容的HTTP响应


现在过滤这些信息并解析xml以获取相关信息的正确方法是什么?例如,如果您想查询wikipedia中的信息,如何只保存信息而不保存页面的源代码

您可以解析内容,只检索需要的信息,然后存储它

Qt为您提供了一些工具来帮助您实现这一点

政府对此有更多的信息

如果是有效的XML,则可以使用其他工具将损坏的XML HTML页面转换为有效的XML,如中所述

要验证和修复HTML文件,可以使用