C++ 支持原始UTF-8的正则表达式引擎?

C++ 支持原始UTF-8的正则表达式引擎?,c++,regex,C++,Regex,我需要一个支持原始UTF-8的正则表达式引擎——也就是说,UTF-8字符串以两个字符(或一个或更少)的形式存储在char*中——例如,Ab是数组{0x41,0x62}。 有人知道可以接收这种格式的正则表达式引擎吗? 如果需要,我可以先转换为wchar\t PCRE的当前实施 (7.x版)第XI版- 与Perl 5.10配合,包括对UTF-8编码的支持 弦和 Unicode常规类别属性。但是,UTF-8和Unicode 支持 必须明确启用;这不是默认值。Unicode 桌子 对应于Unicode

我需要一个支持原始UTF-8的正则表达式引擎——也就是说,UTF-8字符串以两个字符(或一个或更少)的形式存储在char*中——例如,Ab是数组{0x41,0x62}。 有人知道可以接收这种格式的正则表达式引擎吗? 如果需要,我可以先转换为wchar\t

PCRE的当前实施 (7.x版)第XI版- 与Perl 5.10配合,包括对UTF-8编码的支持 弦和 Unicode常规类别属性。但是,UTF-8和Unicode 支持 必须明确启用;这不是默认值。Unicode 桌子 对应于Unicode 5.1版


表示在配置和使用的条件下,Boost.Regex是可能的。

处理UTF-8的非恒定字符长度特性使得创建算法(如Regex)非常困难

最好使用将utf-8字符串转换为unicode wstring,然后使用的wstring变量