C++ 使用c/c++;

C++ 使用c/c++;,c++,html,c,xml-parsing,html-parsing,C++,Html,C,Xml Parsing,Html Parsing,我正在寻找从html文件中提取表的更好的方法。现在我使用tidy()将html文件转换为xhtml,然后使用rapidxml解析xml。在解析时,我将查找、和节点,从而创建表数据结构 它工作得很好,但我想知道是否有更好的方法来完成我的任务。此外,tidy lib似乎是一个废弃的项目 还有,每个人都曾在整洁的源代码中尝试过“实验性”补丁吗 谢谢, 克里斯汀我认为你的方法很好。我认为最好的方法是整理html并将其转换为xhtml,然后解析xml。看不出它是如何简化的 你没有提到任何问题,所以我不确定

我正在寻找从html文件中提取表的更好的方法。现在我使用tidy()将html文件转换为xhtml,然后使用rapidxml解析xml。在解析时,我将查找
节点,从而创建表数据结构

它工作得很好,但我想知道是否有更好的方法来完成我的任务。此外,tidy lib似乎是一个废弃的项目

还有,每个人都曾在整洁的源代码中尝试过“实验性”补丁吗

谢谢,
克里斯汀

我认为你的方法很好。我认为最好的方法是整理html并将其转换为xhtml,然后解析xml。看不出它是如何简化的

你没有提到任何问题,所以我不确定问题是什么

您可以使用htmlparser() 这个库可以解析、读取和修改html和css

例如,在您读取表的情况下


html_解析器html;
html.set_text(html_text);
auto table=html.query(“#table_id”)。位于(0);
对于(自动tr:table->childs()){
对于(自动td:tr->childs()){
//现在你有了一个td,你可以自由地修改和读取数据
//e、 g:
自动td_标记=动态投射(td);
td_tag->set_attr(“id”,“new_id”);//更改attr
自动id=td_标签->属性(“id”);
自动测试=td_标签->InUser_文本();
auto html=td_tag->outter_html();
}
}

快速启动示例是

可能的副本,所以您只是在寻找XML或HTML解析的替代库?我正在寻找用C或C++从HTML中提取表的想法。在使用本网站的搜索时,可以通过在方括号之间写入标记来指定标记。查找:
[c++][xml解析]
。按投票顺序排列结果可能会让您遇到更有趣的问题。我是在[html解析]中这样做的,但我认为我可能会更具体一点,并提供一个简单的解决方案。