Compiler construction 该程序语法是否只识别名为';ID';?
我需要在lex/flex中创建一个扫描器来查找令牌,在yacc/bison中创建一个解析器来根据以下语法处理这些令牌。当我在制作扫描仪的过程中,我发现,这个语言中的变量、函数和数组只能有“ID”的名称。我是不是误读了这个yacc文件Compiler construction 该程序语法是否只识别名为';ID';?,compiler-construction,flex-lexer,yacc,lexical-analysis,Compiler Construction,Flex Lexer,Yacc,Lexical Analysis,我需要在lex/flex中创建一个扫描器来查找令牌,在yacc/bison中创建一个解析器来根据以下语法处理这些令牌。当我在制作扫描仪的过程中,我发现,这个语言中的变量、函数和数组只能有“ID”的名称。我是不是误读了这个yacc文件 /* C-Minus BNF Grammar */ %token ELSE %token IF %token INT %token RETURN %token VOID %token WHILE %token ID %token NUM %token LTE
/* C-Minus BNF Grammar */
%token ELSE
%token IF
%token INT
%token RETURN
%token VOID
%token WHILE
%token ID
%token NUM
%token LTE
%token GTE
%token EQUAL
%token NOTEQUAL
%%
program : declaration_list ;
declaration_list : declaration_list declaration | declaration ;
declaration : var_declaration | fun_declaration ;
var_declaration : type_specifier ID ';'
| type_specifier ID '[' NUM ']' ';' ;
type_specifier : INT | VOID ;
fun_declaration : type_specifier ID '(' params ')' compound_stmt ;
params : param_list | VOID ;
param_list : param_list ',' param
| param ;
param : type_specifier ID | type_specifier ID '[' ']' ;
compound_stmt : '{' local_declarations statement_list '}' ;
local_declarations : local_declarations var_declaration
| /* empty */ ;
statement_list : statement_list statement
| /* empty */ ;
statement : expression_stmt
| compound_stmt
| selection_stmt
| iteration_stmt
| return_stmt ;
expression_stmt : expression ';'
| ';' ;
selection_stmt : IF '(' expression ')' statement
| IF '(' expression ')' statement ELSE statement ;
iteration_stmt : WHILE '(' expression ')' statement ;
return_stmt : RETURN ';' | RETURN expression ';' ;
expression : var '=' expression | simple_expression ;
var : ID | ID '[' expression ']' ;
simple_expression : additive_expression relop additive_expression
| additive_expression ;
relop : LTE | '<' | '>' | GTE | EQUAL | NOTEQUAL ;
additive_expression : additive_expression addop term | term ;
addop : '+' | '-' ;
term : term mulop factor | factor ;
mulop : '*' | '/' ;
factor : '(' expression ')' | var | call | NUM ;
call : ID '(' args ')' ;
args : arg_list | /* empty */ ;
arg_list : arg_list ',' expression | expression ;
/*C-减BNF语法*/
%其他代币
%代币如果
%标记整数
%代币返还
%代币无效
%代币
%令牌ID
%令牌数
%令牌LTE
%令牌GTE
%象征平等
%代币
%%
程序:申报单;
申报单:申报单申报单申报单;
声明:var|u声明| fun|u声明;
var_声明:类型_说明符ID';'
|类型_说明符ID'['NUM']''';
类型|说明符:INT | VOID;
fun_声明:类型_说明符ID'('params')'component_stmt;
参数:参数列表|无效;
参数列表:参数列表“,”参数
|param;
param:type_说明符ID | type_说明符ID'[''];
复合语句:“{”局部语句“}”;
局部声明:局部声明变量声明
|/*空*/;
语句列表:语句列表语句
|/*空*/;
语句:表达式
|复合材料
|选择
|迭代法
|返回测试;
表达式:表达式“;”
| ';' ;
选择stmt:IF'('expression')语句
|IF'('表达式')'语句ELSE语句;
迭代:WHILE'('expression')'语句;
return_stmt:return';'|返回表达式“;”;
表达式:var'='表达式|简单|表达式;
变量:ID | ID'['表达式']';
简单表达式:加法表达式重新加载加法表达式
|加性_表达;
重播:LTE |‘| GTE | EQUAL | NOTEQUAL;
加法表达式:加法表达式addop term | term;
addop:“+”|“-”;
术语:术语mulop因子|因子;
mulop:“*”|“/”;
因子:“(“表达式”)”| var | call | NUM;
调用:ID'('args');
args:arg_list |/*空*/;
arg_列表:arg_列表','表达式|表达式;
ID
只是lexer返回的终端类型。其思想是,在变量名(和数字)的情况下,其他返回的信息将指定名称(或数字)。在类似C的psuedo代码中,lexer执行以下操作:
char *tok = tokenise();
if (!strcmp(tok, "int"))
{
return INT;
}
else if (is_name(tok))
{
strcpy(parser.name, tok);
return ID;
}
else if (is_number(tok))
{
parser.number = atoi(tok);
return NUM;
}
...
解析器接收终端类型(INT、ID、NUM等),这是应用语法规则的足够信息。然后,规则中的操作可以直接或在构造AST时包含额外的信息(parser.name、parser.number等)。您如何判断INT是按字面意思取的,而不是ID?这是一个非常好的问题。从语法上看不出来。我的猜测是基于你的语法与我见过的其他几个伴随着他们的词汇的人的语法极其相似。尽管你的问题似乎是“这在现实世界中(使用现实的lexer)如何工作?”我认为我的假设是合理的。