用于在非ASCII流中匹配模式的Regcomp替代方案
到目前为止,我一直在我的程序用于在非ASCII流中匹配模式的Regcomp替代方案,c,regex,linux,unicode,gnu,C,Regex,Linux,Unicode,Gnu,到目前为止,我一直在我的程序regcomp中使用正则表达式处理正则字符串 现在,我需要在非ASCII二进制流中找到特定的字节模式:据我所知,regcomp不能在这种上下文中工作 实际上,我希望能够定义(比如)一个3字节的模式,可能使用十六进制表示法: \x27\x87\xFE 谢谢如果您需要一个适用于UTF-8的正则表达式库,您应该使用 我的发现简而言之: regexp.h不解释输入字符串。这意味着: 您可以像这样轻松地将任意字节传递给regcomp 字符缓冲区[10]=“\x01abcd\
regcomp
中使用正则表达式处理正则字符串
现在,我需要在非ASCII二进制流中找到特定的字节模式:据我所知,regcomp
不能在这种上下文中工作
实际上,我希望能够定义(比如)一个3字节的模式,可能使用十六进制表示法:
\x27\x87\xFE
谢谢如果您需要一个适用于UTF-8的正则表达式库,您应该使用 我的发现简而言之:
- regexp.h不解释输入字符串。这意味着:
您可以像这样轻松地将任意字节传递给
字符缓冲区[10]=“\x01abcd\x03” 但是当要传递上面用ASCII编码的相同字符串时,regexp.h不会像C编译器那样解释它regcomp
- PCRE在解析网络内容时更适合使用。谢谢