Regex 从流读取时准备(x)html

Regex 从流读取时准备(x)html,regex,parsing,stream,cgi,Regex,Parsing,Stream,Cgi,我正在为嵌入式系统构建一个cgi,需要能够将系统信息插入网页。 我的计划是插入源xhtml,让cgi在看到FunctionCall“macro”时发挥其魔力。 如果我可以在内存中保存完整的源代码xhtml并对其执行正则表达式,那么处理这个问题就没有问题,但我更希望能够在读取时花费更少的内存并处理流或块。 问题是:我必须确定,我不在“ReX”或“正则表达式”的中间不工作。 是否有一个好的替代正则表达式的方法,或者你有什么想法,这可能会有所帮助?你想要一个替代正则表达式的方法是正确的,因为(X)HT

我正在为嵌入式系统构建一个cgi,需要能够将系统信息插入网页。 我的计划是插入源xhtml,让cgi在看到FunctionCall“macro”时发挥其魔力。 如果我可以在内存中保存完整的源代码xhtml并对其执行正则表达式,那么处理这个问题就没有问题,但我更希望能够在读取时花费更少的内存并处理流或块。 问题是:我必须确定,我不在“ReX”或“正则表达式”的中间不工作。
是否有一个好的替代正则表达式的方法,或者你有什么想法,这可能会有所帮助?

你想要一个替代正则表达式的方法是正确的,因为(X)HTML不是一种“常规”语言

您可能会受益于HTML::Parser的子类之一:HTML::TokParser、HTML::TokParser::Simple、HTML::TreeBuilder(::Xpath)、HTML::TableExtract等