使用R和XPath获取单元格表的文本
我是一个有R和XPath的乞丐, 我试图在起重机上刮东西,以了解刮东西是如何工作的 我想从一个包中获取依赖项 这些元素是“比特运算,RCurl” XPath应该是这个使用R和XPath获取单元格表的文本,r,xpath,R,Xpath,我是一个有R和XPath的乞丐, 我试图在起重机上刮东西,以了解刮东西是如何工作的 我想从一个包中获取依赖项 这些元素是“比特运算,RCurl” XPath应该是这个/html/body/table/tbody/tr[4]/td[2] 这是我的R代码 urlContent <- htmlParse("http://cran.r-project.org/web/packages/abc/index.html") xpathSApply(doc=urlContent,pat
/html/body/table/tbody/tr[4]/td[2]
这是我的R代码
urlContent <- htmlParse("http://cran.r-project.org/web/packages/abc/index.html")
xpathSApply(doc=urlContent,path="/html/body/table/tbody/tr[4]/td[2]")
urlContent另一个明智的选择是使用readHTMLTable
并避免编写xpath
在这里,我读取的是第一个表,而不是访问第一列等于建议:
的行
library(XML)
dat <- readHTMLTable('http://cran.r-project.org/web/packages/XML/index.html')[[1]]
dat[dat[,1] == "Suggests:",]
Version: 3.96-1.1
3 Suggests: bitops, RCurl
库(XML)
我用“//tr[4]/td[2]”解决了这些问题