Python '；无法识别的规则'；和'；致命的分析错误'；弹性_Python_Parsing_Bison_Flex Lexer

Python '；无法识别的规则'；和'；致命的分析错误'；弹性

python parsing bison

Python '；无法识别的规则'；和'；致命的分析错误'；弹性,python,parsing,bison,flex-lexer,Python,Parsing,Bison,Flex Lexer,我必须使用flex和bison为简化的Python3做一个解析器，我得到了这两个错误。terminal说它们在我写的78行中的第79行。我在课堂上还有其他类似于这种格式的“.l”示例，它们很好用这是我写的 %option noyywrap %{ #define YYSTYPE double #include "scanner.tab.h" #include <stdlib.h> #include <string> extern int flag; exte

我必须使用flex和bison为简化的Python3做一个解析器，我得到了这两个错误。terminal说它们在我写的78行中的第79行。我在课堂上还有其他类似于这种格式的“.l”示例，它们很好用

这是我写的

    %option noyywrap

%{ 
#define YYSTYPE double
#include "scanner.tab.h"
#include <stdlib.h>
#include <string>

extern int flag;
extern int line;
%}

DELIMITER    [ ]+|[/t]+

KEYWORD      False|class|finally|is|return|None|continue|for|lambda|try|True|def|from|nonlocal|while|and|del|global|not|with|as|elif|if|or|yield|assert|else|import|pass|break|except|in|raise

OPERATOR     ([+\-$@&|^~])|(\*{1,2})|(\/{1,2})|(<[=<]?)|(>[=>]?)|(==)|!

COMMENT      #.+

IDENTIFIER   [a-zA-Z_][a-zA-Z0-9_]*
ID_ERR       [0-9]{IDENTIFIER}

STRINGESCAPESEQ  [\\].  
SHORTSTRINGCHAR1 [^\\'\n]*
SHORTSTRINGCHAR2 [^\\"\n]*
SHORTSTRINGITEM1 {SHORTSTRINGCHAR1}|{STRINGESCAPESEQ}
SHORTSTRINGITEM2 {SHORTSTRINGCHAR2}|{STRINGESCAPESEQ}
STRING       [']{SHORTSTRINGITEM1}*[']|(["]{SHORTSTRINGITEM2}*["])
STRING_ERR   ['].[^'\n\t]*|["].[^"\n\t]* 

BINDIGIT     [01]
BININTEGER   0[bB]{BINDIGIT}+
BIN_ERR1     0[Bb]+{BINDIGIT}+

DIGIT        [0-9]
NONZERODIGIT     [1-9]
INTEGER      {NONZERODIGIT}{DIGIT}*|[0]+
INT_ERR1     {INTEGER}[a-zA-Z]{DIGIT}
INT_ERR2     [-+]{INTEGER}
INT_ERR3     [0+]{INTEGER}

INTPART      {DIGIT}+
EXPONENT     [eE][+-]*{INTPART}
FRACTION     [\.]{INTPART}
EXPONENTFLOAT    ({INTPART}|{POINTFLOAT}){EXPONENT}
POINTFLOAT   {INTPART}*{FRACTION}|{INTPART}[\.]
FLOATNUMBER  {POINTFLOAT}|{EXPONENTFLOAT}
FLOAT_ERR_POINT  {INTPART}*[\.]+{DIGIT}+[\.]*{DIGIT}*|{INTPART}[\.]+
FLOAT_ERR_SIGN   ([-+]{FLOATNUMBER})
FLOAT_ERR_LETTER {FLOATNUMBER}[A-Za-z]+

IMAGINARYNUMBER  ({FLOATNUMBER}|{INTPART})[jJ]

%%

{DELIMITER}     { }
{KEYWORD}       { return KEYWORD; }
{OPERATOR}      { }
{COMMENT}       { printf("Line %d: Found COMMENT\n", line); }   
{IDENTIFIER}        { printf("Line %d: Found IDENTIFIER %s\n", line, yytext);                    return IDENTIFIER; }
{ID_ERR}        { printf("Line %d: !!ERROR!!\tWrong IDENTIFIER statement %s\n", line, yytext);           return ID_ERR;}  
{STRING}        { printf("Line %d: Found STRING %s\n", line, yytext);                        return STRING; }
{STRING_ERR}        { printf("Line %d: !!ERROR!!\tWrong STRING statement %s\n", line, yytext);           return STRING_ERR;}
{BININTEGER}        { printf("Line %d: Found BINARY INTEGER NUMBER %s\n", line, yytext);                 return BININTEGER; }
{BIN_ERR1}      { printf("Line %d: !!ERROR!!\tWrong BINARY NUMBER statement, too many 'Bb's%s\n", line, yytext); return BIN_ERR1;}
{INTEGER}       { printf("Line %d: Found INTEGER NUMBER %s\n", line, yytext);                    return INTEGER; }
{INT_ERR1}      { printf("Line %d: !!ERROR!!\tWrong INT statement %s\n", line, yytext);              return INT_ERR1;}
{INT_ERR2}      { printf("Line %d: !!ERROR!!\tWrong INT statement, '+/-' found %s\n", line, yytext);         return INT_ERR2;}
{INT_ERR3}      { printf("Line %d: !!ERROR!!\tWrong INT statement, first digit(s) zeros %s\n", line, yytext);    return INT_ERR3;}
{FLOATNUMBER}       { printf("Line %d: Found FLOAT NUMBER %s\n", line, yytext);                  return FLOATNUMBER; }
{FLOAT_ERR_POINT}   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, too many '.' %s\n", line, yytext);      return FLOAT_ERR_POINT;}
{FLOAT_ERR_POINT}   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, '+/-' FOUND %s\n", line, yytext);       return FLOAT_ERR_SIGN;}
{FLOAT_ERR_LETTER   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, letter FOUND %s\n", line, yytext);      return FLOAT_ERR_LETTER;}
{IMAGINARYNUMBER}   { printf("Line %d: Found IMAGINARY NUMBER %s\n", line, yytext);                  return IMAGINARYNUMBER; }
.           { printf("Line %d: UNKNOWN TOKEN:%s", line, yytext);    BEGIN(error);}
\n                  { line++; }
<<EOF>>         { printf("#END OF FILE\n"); exit(0); }

第74行末尾缺少一个大括号：

{FLOAT_ERR_LETTER   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, letter FOUND %s\n", line, yytext);      return FLOAT_ERR_LETTER;}
                 ^  <--- here

大多数情况下，flex输入结束后的行中出现的致命错误是由于缺少大括号或其他类似问题造成的，但是校对整个文件是一件痛苦的事情，而且很少有IDE正确地对flex文件进行语法着色。因此，像上面这样的技巧可以节省大量的时间。（这并不总是那么简单；在本例中，没有任何操作跨越一行以上。）

一旦修复了该错误，您将发现有几个模式无法匹配。第73行无法匹配，因为模式与第72行相同（

{FLOAT\u ERR\u POINT}

）。第65行和第66行（

BININTEGER

和

BIN_ERR1

）无法匹配，因为所讨论的模式（以

0B

开头，后跟一个数字）也与

IDERR

匹配，后者（奇怪的是）是一个单位数，后跟一个标识符。（您可能指的是

[[：digit:][]+{IDENTIFIER}

）总的来说，您应该将错误模式放在末尾，以便它们永远不会优先于正确标记的模式。这也使得编写错误标记变得简单得多。（另外，您需要将特定的错误模式放在更一般的错误模式之前，以便

BIN_ERR1

应该放在

IDERR

之前）

其他一些评论：

如果要查看flex匹配模式，请将

--debug

（或

-d

）添加到命令行，而不是在代码中添加

printf

命令。它可以更好地向您显示正在发生的事情，并且可以在不编辑整个文件的情况下打开和关闭

总的来说，在输入文件中过度使用flex宏不是很有用。它实际上使规范更难阅读，因为您必须查找宏的每个用法。就我个人而言，我只在需要多次使用宏时才使用宏，即使它们只是隐藏内置字符类（如

[：digit:][]

）的一种方式，也不会使用宏。

{FLOAT_ERR_LETTER   { printf("Line %d: !!ERROR!!\tWrong FLOAT statement, letter FOUND %s\n", line, yytext);      return FLOAT_ERR_LETTER;}
                 ^  <--- here

for n in {57..79}; do head -n$n g.l | flex -o /dev/null -w || { echo $n; break; } done