Antlr 在Python目标中使用语义谓词_Antlr_Antlr4

Antlr 在Python目标中使用语义谓词

antlr antlr4

Antlr 在Python目标中使用语义谓词,antlr,antlr4,Antlr,Antlr4,我目前正在为我的公司使用的专有语言的单元测试构建语法这种语言在某种程度上类似于正则表达式，例如F=bing*表示bing的可能重复。但是，单个*表示任意一个块，***表示任意数量的块我唯一的解决方案是使用语义谓词，检查前面的标记是否是空格。如果有人提出了以不同方式规避此问题的建议，请分享否则，我的语法现在看起来是这样的，但谓词似乎并不像预期的那样工作 grammar Pattern; element: ID | macro; macro: MACRONAME m

我目前正在为我的公司使用的专有语言的单元测试构建语法

这种语言在某种程度上类似于正则表达式，例如

F=bing*

表示bing的可能重复。但是，单个

表示任意一个块，

***

表示任意数量的块

我唯一的解决方案是使用语义谓词，检查前面的标记是否是空格。如果有人提出了以不同方式规避此问题的建议，请分享

否则，我的语法现在看起来是这样的，但谓词似乎并不像预期的那样工作

grammar Pattern;

element:
    ID
    | macro;

macro:
    MACRONAME macroarg? REPEAT?;

macroarg: '['( (element | MACROFREE ) ';')* (element | MACROFREE) ']';


and_con : 
    element '&' element
    | and_con '&' element
    |'(' and_con ')';

head_con :
    'H[' block '=>' block ']';

block :
    element
    | and_con
    | or_con
    | head_con
    | '(' block ')';

blocksequence :
    (block ' '+)* block;

or_con :
     ((element | and_con) '|')+ (element | and_con)
    | or_con '|' (element | and_con)
    | '(' blocksequence (')|(' blocksequence)+ ')' REPEAT?;

patternlist :
    (blocksequence ' '* ',' ' '*)* blocksequence;

sentenceord :
    'S=(' patternlist ')';

sentenceunord :
    'S={' patternlist '}';

pattern :
    sentenceord
    | sentenceunord
    |  blocksequence;   

multisentence :
    MS pattern;

clause :
    'CLS' ' '+ pattern;

complexpattern :
    pattern
    | multisentence
    | clause
    | SECTIONS ' ' complexpattern;

dictentry:
    NUM ';' complexpattern
    | NUM ';' NAME ';' complexpattern
    | COMMENT;

dictionary:
    (dictentry ('\n'|'\r\n'))* (dictentry)? EOF;


ID : ( '^'? '!'? ('F'|'C'|'L'|'P'|'CA'|'N'|'PE'|'G'|'CD'|'T'|'M'|'D')'=' NAME REPEAT? '$'? )
    | SINGLESTAR REPEAT?;

fragment SINGLESTAR: {_input.LA(-1)==' '}? '*';
fragment REPEATSTAR: {_input.LA(-1)!=' '}? '*';

fragment NAME: CHAR+ | ',' | '.' | '*';

fragment CHAR: [a-zA-Z0-9_äöüßÄÖÜ\-];

REPEAT: (REPEATSTAR|'+'|'?'|FROMTIL);

fragment FROMTIL: '{'NUM'-'NUM'}';

MS : 'MS' [0-9];

SECTIONS: 'SEC' '=' ([0-9]+','?)+;

NUM: [0-9]+;

MACRONAME: '#'[a-zA-Z_][a-zA-Z_0-9]*;

MACROFREE: [a-zA-Z!]+;

COMMENT: '//' ~('\r'|'\n')*;

以Python为目标时，前瞻谓词的语法需要如下所示：

SINGLESTAR:{self._input.LA（-1）=ord（''''）}？'*'

请注意，有必要将“self.”引用添加到调用中，并使用ord（）函数包装字符，该函数返回一个unicode值进行比较。Python目标的Antlr文档严重缺乏

通过翻阅生成的代码，我发现语义谓词必须写成

self.\u input

，而不仅仅是

\u input

。不过还是不行。