使用R获取CoreNLP解析树xml属性值作为树

使用R获取CoreNLP解析树xml属性值作为树,xml,r,Xml,R,我正在使用StanfordCorenlp获取句子的解析树。它生成一个xml输出,我正在使用R中的xml包对其进行处理。我能够使用以下命令检索xml文档中解析节点的属性值: xpathApply(doc,“//parse”,xmlValue)[] 我以类似字符串的方式获取属性值,但我想要的是获取原始解析树,其中的层次结构保持不变,如下所示,以便对其进行一些后处理——更具体地说,是对其进行一些树操作 那我该怎么做呢?我可以得到属性值,但不是以树的形式,如何得到相同的值?提前感谢。这是否与您提到的“

我正在使用StanfordCorenlp获取句子的解析树。它生成一个xml输出,我正在使用R中的xml包对其进行处理。我能够使用以下命令检索xml文档中解析节点的属性值:

xpathApply(doc,“//parse”,xmlValue)[]

我以类似字符串的方式获取属性值,但我想要的是获取原始解析树,其中的层次结构保持不变,如下所示,以便对其进行一些后处理——更具体地说,是对其进行一些树操作


那我该怎么做呢?我可以得到属性值,但不是以树的形式,如何得到相同的值?提前感谢。

这是否与您提到的“类似字符串”的值类似<代码>(ROOT(S(NP(PRP$My)(NN dog))(ADVP(RB也))(VP(VBZ喜欢)(S(VP(VBG吃)(NP(NN香肠);)))(…))如果是这样,层次结构是完整的……您希望使用哪种R对象?嵌套列表?如果xml文件只包含字符串值,那么除了将字符串输出解析为嵌套列表之外,您别无选择。我知道这不是小事,但您肯定可以找到资源来帮助您。另一方面,如果xml文件包含结构化xml中的树,那么您可以使用
xmlTreeParse
来保留结构。一些示例数据会有所帮助。是的,就是这样。正如您所说,层次结构在这里是完整的,但是如何将其转换为树结构呢?这就是问题所在。但我想我现在已经理解了你所说的话,并且正在朝着这个方向努力。谢谢我在stackoverflow上找到了相关的伪代码,作为相关google查询的顶部链接。。。同样,如果xml文件中的数据是结构化的(而不仅仅是字符串),则可以直接提取。否则,搜索“解析括号列表”或“括号匹配”,等等。