C++ 使用boost spirit从括号中提取字符串
我有以下字符串:C++ 使用boost spirit从括号中提取字符串,c++,boost,boost-spirit,boost-spirit-qi,C++,Boost,Boost Spirit,Boost Spirit Qi,我有以下字符串: %%DocumentNeededResources: CMap (90pv-RKSJ-UCS2C) 我想解析它并存储/提取括号中的90pv-RKSJ-UCS2C字符串 我的规则如下: std::string strLinesRecur = "%%DocumentNeededResources: CMap (90pv-RKSJ-UCS2C)"; std::string strStartTokenRecur; std::string token_intRecur; bool bP
%%DocumentNeededResources: CMap (90pv-RKSJ-UCS2C)
我想解析它并存储/提取括号中的90pv-RKSJ-UCS2C
字符串
我的规则如下:
std::string strLinesRecur = "%%DocumentNeededResources: CMap (90pv-RKSJ-UCS2C)";
std::string strStartTokenRecur;
std::string token_intRecur;
bool bParsedLine1 = qi::phrase_parse(strLinesRecur.begin(), strLinesRecur.end(), +char_>>+char_,':', token_intRecur, strStartTokenRecur);
看起来你认为skipper是一个分隔符。恰恰相反 在这种罕见的情况下,我想我更喜欢正则表达式。但是,既然你问了,这就是你的精神:
#include <boost/spirit/include/qi.hpp>
namespace qi = boost::spirit::qi;
int main() {
std::string const line = "%%DocumentNeededResources: CMap (90pv-RKSJ-UCS2C)";
auto first = line.begin(), last = line.end();
std::string label, token;
bool ok = qi::phrase_parse(
first, last,
qi::lexeme [ "%%" >> +~qi::char_(":") ] >> ':' >> qi::lexeme["CMap"] >> '(' >> qi::lexeme[+~qi::char_(')')] >> ')',
qi::space,
label, token);
if (ok)
std::cout << "Parse success: label='" << label << "', token='" << token << "'\n";
else
std::cout << "Parse failed\n";
if (first!=last)
std::cout << "Remaining unparsed input: '" << std::string(first, last) << "'\n";
}
好的,假设我们使用和别名名称空间指令得到以下
:
using namespace boost::spirit::qi;
namespace phx = boost::phoenix;
给定字符串:
std::string strLinesRecur = "%%DocumentNeededResources: CMap (90pv-RKSJ-UCS2C)";
我们想将括号内的“代码”提取到res
:
std::string res;
一种方法是使用boost::phoenix::ref
作为语义动作。
因此,给出如下代码语法:
using boost::spirit::ascii::alnum;
auto code = copy(+(alnum | char_('-')));
(这与正则表达式中的[a-zA-Z\-]
类似)
我们可以为整个字符串创建自己的语法:
using boost::spirit::ascii::alpha;
auto grammar = copy(
(char_('%') >> char_('%') >> +alpha >> char_(':'))
>> +alpha >> char_('(') >> as_string[lexeme[code]][phx::ref(res) = _1] >> char_(')'));
它解析以两个%
开头的任何内容,后跟一些字母字符和一个:
,然后在括号内后跟一些“code”
这一点的关键是作为字符串[lexeme[code]][phx::ref(res)=\u1]
。如果我们把它分解:lexeme[code]
只是说把解析的code
当作一个原子单元,作为字符串
“返回”结果作为std::string
(与std::vector
)和[phx::ref(res)=\u 1]
使用语义操作将解析的字符串存储到res(\u 1
是该语法中第一个匹配项的占位符)
在这种情况下,以下调用将跳过空格:
using boost::spirit::ascii::blank;
phrase_parse(begin(strLinesRecur), end(strLinesRecur), grammar, blank);
当然,这只是一个适合字符串的语法示例
注意:copy
指的是qi::copy
,它是一种能够存储语法片段的方法,比如在对象code
和grammar
中。如果不这样做,auto
的使用将失败(可能有分段错误).Hmm我不知道qi::copy
o.o我总是使用boost::proto::deep\u copy
或boost\u SPIRIT\u AUTO
(这也有在c++03中工作的好处)。这里我根据您的想法为您提供我的(非常:)简化版:谢谢各位上帝保佑您:)
using boost::spirit::ascii::blank;
phrase_parse(begin(strLinesRecur), end(strLinesRecur), grammar, blank);