Ruby 将树顶解析树转换为抽象语法树(AST)
我简化了用Treetop表示的语法,并尝试使用自定义节点将解析器的输出过滤到AST中Ruby 将树顶解析树转换为抽象语法树(AST),ruby,treetop,Ruby,Treetop,我简化了用Treetop表示的语法,并尝试使用自定义节点将解析器的输出过滤到AST中 grammar Elem rule top lpar 'top' space args_:(lpar 'args' space ((ident / number) space?)* rpar) space? rpar <Top> end rule ident [a-zA-Z] [a-zA-Z0-9_]* <Ident> end rule
grammar Elem
rule top
lpar 'top' space
args_:(lpar 'args' space ((ident / number) space?)* rpar) space?
rpar <Top>
end
rule ident
[a-zA-Z] [a-zA-Z0-9_]* <Ident>
end
rule number
[0-9]+ <Number>
end
rule space
[\s]+
end
rule lpar
space? '(' space?
end
rule rpar
space? ')' space?
end
end
自定义节点都继承Treetop::Runtime::SyntaxNode
现在,我需要将Treetop生成的解析树过滤到AST中
我按照解释的策略进行操作,但没有成功:我的AST只是空的
我的编译器驱动程序如下所示:
require 'treetop'
require 'pp'
require_relative 'elem'
require_relative 'node_extension'
class ElemCompiler
def initialize
@parser=ElemParser.new
end
def compile filename
puts "==> compiling #{filename}"
@ast=parse(filename)
puts "==> AST in memory. Good."
end
def parse filename
pp tree=@parser.parse(IO.read(filename))
pp clean(tree)
end
private
def clean(root_node)
return if(root_node.elements.nil?)
pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node.elements.each {|node| clean(node) }
end
end
compiler=ElemCompiler.new.parse ARGV[0]
我遗漏了什么?您的代码确实正确解析了提供的表达式 但是,在clean方法中有一个小错误:
def clean(root_node)
return if(root_node.elements.nil?)
pp root_node.elements.collect {|node| node.class.name =="Treetop::Runtime::SyntaxNode" }
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node.elements.each {|node| clean(node) }
end
clean方法返回最后计算的表达式,即数组元素的每个方法。实际上,您想要返回的是根节点,所以行pp clean(tree)
实际上将打印生成的、干净的树,而不是每个表达式的结果
您可以通过两种方式进行求解,一种是添加root_节点作为返回表达式:
def clean(root_node)
(...)
pp root_node.elements.delete_if{|node| node.class.name == "Treetop::Runtime::SyntaxNode" }
root_node # here
end
或者,您可以将解析方法更改为以下内容:
def parse filename
pp tree = @parser.parse(IO.read(filename))
clean(tree) # we clean the tree
pp tree # since tree is an object, side-effects will persist here
end
然而,我不建议清理这棵树。我在这方面有过一些非常糟糕的经验。确实,您可以获得一个更清晰的结构,您可以更好地理解它,因为Treetop通常保存许多您实际上不需要的信息,但是您可能会丢失,例如,使用其标识符(自定义标签或非终端符号)引用解析表达式的可能性(这是一个webarchive链接)
此外,在某些情况下,仅因为节点的类名为“Treetop::Runtime::SyntaxNode”而清除节点是不正确的,因为在某些情况下,必须使用模块而不是类来扩展节点,在这种情况下,节点类名仍然是“Treetop::Runtime::SyntaxNode”,但节点将从树中清除,您将失去混合模块功能
让我知道我是否清楚(不幸的是,文档网站似乎关闭了,我想向您展示很多有用的示例,而且因为已经有一段时间我不玩语法了,我真的不记得了)。Thx。顺便问一下:您提供的归档页面在treetop站点上仍然可以访问吗?我不这么认为=[这就是我抓取归档链接的原因
def parse filename
pp tree = @parser.parse(IO.read(filename))
clean(tree) # we clean the tree
pp tree # since tree is an object, side-effects will persist here
end