如何在R中使用XPath获取HTML标记中的所有内容_R_Xpath

如何在R中使用XPath获取HTML标记中的所有内容

r xpath

如何在R中使用XPath获取HTML标记中的所有内容,r,xpath,R,Xpath,我看过其他关于如何在java中实现这一点的帖子，但遗憾的是，我只知道R 我想一字不差地获得标签中包含的所有内容（标签、属性、值），包括子标签的内容。我想我可以做一些类似的事情 a = xpathSApply(html, "//span[@class = 'class name']/node()", ????) 但后来我意识到，我不知道任何函数可以获取路径的全部内容，而不仅仅是属性或文本。我将如何做到这一点？不确定这是否适用于您的用例，但您是否尝试过使用库xml2 content <- r

我看过其他关于如何在java中实现这一点的帖子，但遗憾的是，我只知道R

我想一字不差地获得标签中包含的所有内容（标签、属性、值），包括子标签的内容。我想我可以做一些类似的事情

a = xpathSApply(html, "//span[@class = 'class name']/node()", ????)

但后来我意识到，我不知道任何函数可以获取路径的全部内容，而不仅仅是属性或文本。我将如何做到这一点？

不确定这是否适用于您的用例，但您是否尝试过使用库xml2

content <- read_xml( html )
nodes <- xml_find_all(content, xpath)   # or xml_find_one if you want only the first result

content格雷厄姆-很乐意帮忙。你能举一个你想要解析的html的例子，结果是什么，以及你想要结果是什么样的吗？