Xml HtmlPasse缺少值NA
我正在尝试使用R中的HTMLPase(package:XML)从html文档中提取文本。在下面的代码中,我想知道当缺少标记(例如,Xml HtmlPasse缺少值NA,xml,r,Xml,R,我正在尝试使用R中的HTMLPase(package:XML)从html文档中提取文本。在下面的代码中,我想知道当缺少标记(例如,)时如何返回NA: 阳性阴性 正 阳性阴性 阴性 我希望结果如下所示: “正”“负” “阳性”NA “正”“负” NA“否定” 谢谢! 马杰索斯 :::::::::::::: 克里斯, 我加入了一个新记录(酒店名称): 阳性阴性 正 阳性阴性 阴性 布拉酒店 y您可以获取div节点并将命名向量列表返回到rbind div <-getNodeSet(doc,
)时如何返回NA:
阳性
阴性
正
阳性
阴性
阴性
我希望结果如下所示:
“正”“负”
“阳性”NA
“正”“负”
NA“否定”
谢谢!
马杰索斯
::::::::::::::
克里斯,
我加入了一个新记录(酒店名称):
阳性
阴性
正
阳性
阴性
阴性
布拉酒店
y您可以获取div节点并将命名向量列表返回到rbind
div <-getNodeSet(doc, "//div")
y <- lapply(div, function(x){
y <- xpathSApply(x, ".//p[@class]", xmlValue)
names(y) <- xpathSApply(x, ".//p[@class]", xmlGetAttr, "class")
y
})
ldply(y, "rbind")
pos neg
1 positive negative
2 positive <NA>
3 positive negative
4 <NA> negative
div
div <-getNodeSet(doc, "//div")
y <- lapply(div, function(x){
y <- xpathSApply(x, ".//p[@class]", xmlValue)
names(y) <- xpathSApply(x, ".//p[@class]", xmlGetAttr, "class")
y
})
ldply(y, "rbind")
pos neg
1 positive negative
2 positive <NA>
3 positive negative
4 <NA> negative