Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C++ 使用正则表达式搜索HTML文件_C++_Regex_Qt_Html Parsing - Fatal编程技术网

C++ 使用正则表达式搜索HTML文件

C++ 使用正则表达式搜索HTML文件,c++,regex,qt,html-parsing,C++,Regex,Qt,Html Parsing,我有一个html文件池,希望通过它们搜索相同的目标文本。只需在忽略所有html标记、标题、脚本等的情况下搜索其文本内容 我尝试了QRegExp,Qt中的regex类,但是找不到一个好的模式来完成我想要的 我非常感谢在这方面的任何帮助 谢谢。这对您来说可能是一个好答案,也可能不是一个好答案,但是您考虑过使用DOM解析器吗?这将消除过滤文本和HTML标记的需要。遗憾的是,我不能推荐一个C++的好方法。似乎几乎必须链接toIF问题。包含‘/x*HTML/’和提问。http://stackoverflo

我有一个html文件池,希望通过它们搜索相同的目标文本。只需在忽略所有html标记、标题、脚本等的情况下搜索其文本内容

我尝试了QRegExp,Qt中的regex类,但是找不到一个好的模式来完成我想要的

我非常感谢在这方面的任何帮助


谢谢。

这对您来说可能是一个好答案,也可能不是一个好答案,但是您考虑过使用DOM解析器吗?这将消除过滤文本和HTML标记的需要。遗憾的是,我不能推荐一个C++的好方法。

似乎几乎必须链接toIF问题。包含‘/x*HTML/’和提问。http://stackoverflow.com/questions/1732348/1732454“@Tim Sylvester:说得好-除了你的正则表达式需要一些工作;它也应该真正匹配xhtml。@Jerry确实如此,“xhtml”包含“html”!我想我忘了/I,但它毕竟是伪代码。@Tim Sylvester:好吧,听起来很合理…:-