是否需要Antlr多余谓词?
我有一个文件,我想忽略它的一部分。在Lexer中,我使用门控语义谓词来避免为文件中不感兴趣的部分创建标记。我的规则与下面的相似是否需要Antlr多余谓词?,antlr,predicate,Antlr,Predicate,我有一个文件,我想忽略它的一部分。在Lexer中,我使用门控语义谓词来避免为文件中不感兴趣的部分创建标记。我的规则与下面的相似 A : {!ignore}?=> 'A' ; START_IGNORE : 'foo' {ignore = true; skip();} ; END_IGNORE : 'oof' {ignore = false; skip();} ; IGNORE : {ignore}?=> . {skip();} ; 但是,除非我将开始和结束更改为同时使用语
A
: {!ignore}?=> 'A'
;
START_IGNORE
: 'foo' {ignore = true; skip();}
;
END_IGNORE
: 'oof' {ignore = false; skip();}
;
IGNORE
: {ignore}?=> . {skip();}
;
但是,除非我将开始和结束更改为同时使用语义谓词(如下所示),否则它将不起作用
A
: {!ignore}?=> 'A'
;
START_IGNORE
: {true}?=> 'foo' {ignore = true; skip();}
;
END_IGNORE
: {true}?=> 'oof' {ignore = false; skip();}
;
IGNORE
: {ignore}?=> . {skip();}
;
为什么我必须添加谓词
编辑:我正在使用antlr-3.4
为什么我必须添加谓词
你没有。至少,不使用AntlRv3.3。我不知道您到底在测试什么,但不要使用AntlWorks的解释器或EclipseAntlrIDE插件。始终从命令行执行一点测试
grammar T;
@parser::members {
public static void main(String[] args) throws Exception {
TLexer lexer = new TLexer(new ANTLRStringStream("A foo A B C oof A"));
TParser parser = new TParser(new CommonTokenStream(lexer));
parser.parse();
}
}
@lexer::members {
private boolean ignore = false;
}
parse
: (t=.
{System.out.printf("[\%02d] type=\%s text='\%s'\n", $t.getCharPositionInLine(), tokenNames[$t.type], $t.text);}
)* EOF
;
A
: {!ignore}?=> 'A'
;
START_IGNORE
: 'foo' {ignore = true; skip();}
;
END_IGNORE
: 'oof' {ignore = false; skip();}
;
IGNORE
: {ignore}?=> . {skip();}
;
SPACE
: ' ' {skip();}
;
按如下方式运行:
java -cp antlr-3.3.jar org.antlr.Tool T.g
javac -cp antlr-3.3.jar *.java
java -cp .:antlr-3.3.jar TParser
java-cp antlr-3.3.jar org.antlr.Tool T.g
javac-cp antlr-3.3.jar*.java
java-cp.:antlr-3.3.jar TParser
将打印以下内容:
[00] type=A text='A'
[16] type=A text='A'
[00]type=A text='A'
[16] type=A text='A'
即:从输入的“A foo A B C oof A”
中,以下内容:“foo A B C oof”
为跳过ped
为什么我必须添加谓词
你没有。至少,不使用AntlRv3.3。我不知道您到底在测试什么,但不要使用AntlWorks的解释器或EclipseAntlrIDE插件。始终从命令行执行一点测试
grammar T;
@parser::members {
public static void main(String[] args) throws Exception {
TLexer lexer = new TLexer(new ANTLRStringStream("A foo A B C oof A"));
TParser parser = new TParser(new CommonTokenStream(lexer));
parser.parse();
}
}
@lexer::members {
private boolean ignore = false;
}
parse
: (t=.
{System.out.printf("[\%02d] type=\%s text='\%s'\n", $t.getCharPositionInLine(), tokenNames[$t.type], $t.text);}
)* EOF
;
A
: {!ignore}?=> 'A'
;
START_IGNORE
: 'foo' {ignore = true; skip();}
;
END_IGNORE
: 'oof' {ignore = false; skip();}
;
IGNORE
: {ignore}?=> . {skip();}
;
SPACE
: ' ' {skip();}
;
按如下方式运行:
java -cp antlr-3.3.jar org.antlr.Tool T.g
javac -cp antlr-3.3.jar *.java
java -cp .:antlr-3.3.jar TParser
java-cp antlr-3.3.jar org.antlr.Tool T.g
javac-cp antlr-3.3.jar*.java
java-cp.:antlr-3.3.jar TParser
将打印以下内容:
[00] type=A text='A'
[16] type=A text='A'
[00]type=A text='A'
[16] type=A text='A'
例如:从输入的“A foo A B C oof A”
中,以下内容:“foo A B C oof”
是跳过ped。我确实使用Eclipse插件进行编译等,但不使用插件提供的解释器。从命令行编译得到的结果和以前一样,所以代码中有一些奇怪的东西。通常我会接受我得到的解决方案,但还有一些其他问题。我将尝试找出导致该行为的原因。@HeinrichOdy,如果您使用的是v3.4,请尝试还原到v3.3:根据我的经验,v3.3的问题较少。我将查看是否可以轻松更改版本,如果可以,请尝试3.3,谢谢。@HeinrichOdy,我向您展示了语法与ANTLR 3.3一起工作,因为您可以测试自己。不确定你还期望什么…我确实使用Eclipse插件来编译等等,但不是插件提供的解释器。从命令行编译得到的结果和以前一样,所以代码中有一些奇怪的东西。通常我会接受我得到的解决方案,但还有一些其他问题。我将尝试找出导致该行为的原因。@HeinrichOdy,如果您使用的是v3.4,请尝试还原到v3.3:根据我的经验,v3.3的问题较少。我将查看是否可以轻松更改版本,如果可以,请尝试3.3,谢谢。@HeinrichOdy,我向您展示了语法与ANTLR 3.3一起工作,因为您可以测试自己。不知道你还期待什么。。。