C++ 使用正则表达式搜索HTML文件
我有一个html文件池,希望通过它们搜索相同的目标文本。只需在忽略所有html标记、标题、脚本等的情况下搜索其文本内容 我尝试了QRegExp,Qt中的regex类,但是找不到一个好的模式来完成我想要的 我非常感谢在这方面的任何帮助C++ 使用正则表达式搜索HTML文件,c++,regex,qt,html-parsing,C++,Regex,Qt,Html Parsing,我有一个html文件池,希望通过它们搜索相同的目标文本。只需在忽略所有html标记、标题、脚本等的情况下搜索其文本内容 我尝试了QRegExp,Qt中的regex类,但是找不到一个好的模式来完成我想要的 我非常感谢在这方面的任何帮助 谢谢。这对您来说可能是一个好答案,也可能不是一个好答案,但是您考虑过使用DOM解析器吗?这将消除过滤文本和HTML标记的需要。遗憾的是,我不能推荐一个C++的好方法。似乎几乎必须链接toIF问题。包含‘/x*HTML/’和提问。http://stackoverflo
谢谢。这对您来说可能是一个好答案,也可能不是一个好答案,但是您考虑过使用DOM解析器吗?这将消除过滤文本和HTML标记的需要。遗憾的是,我不能推荐一个C++的好方法。似乎几乎必须链接toIF问题。包含‘/x*HTML/’和提问。http://stackoverflow.com/questions/1732348/1732454“@Tim Sylvester:说得好-除了你的正则表达式需要一些工作;它也应该真正匹配xhtml。@Jerry确实如此,“xhtml”包含“html”!我想我忘了/I,但它毕竟是伪代码。@Tim Sylvester:好吧,听起来很合理…:-