Xml HtmlPasse缺少值NA

Xml HtmlPasse缺少值NA,xml,r,Xml,R,我正在尝试使用R中的HTMLPase(package:XML)从html文档中提取文本。在下面的代码中,我想知道当缺少标记(例如,)时如何返回NA: 阳性阴性 正 阳性阴性 阴性 我希望结果如下所示: “正”“负” “阳性”NA “正”“负” NA“否定” 谢谢! 马杰索斯 :::::::::::::: 克里斯, 我加入了一个新记录(酒店名称): 阳性阴性 正 阳性阴性 阴性 布拉酒店 y您可以获取div节点并将命名向量列表返回到rbind div <-getNodeSet(doc,

我正在尝试使用R中的HTMLPase(package:XML)从html文档中提取文本。在下面的代码中,我想知道当缺少标记(例如,

)时如何返回NA:


阳性

阴性

阳性

阴性

阴性

我希望结果如下所示:

“正”“负”

“阳性”NA

“正”“负”

NA“否定”

谢谢! 马杰索斯

::::::::::::::

克里斯, 我加入了一个新记录(酒店名称):


阳性

阴性

阳性

阴性

阴性

布拉酒店
y您可以获取div节点并将命名向量列表返回到rbind

div <-getNodeSet(doc, "//div")

y <- lapply(div, function(x){
       y  <- xpathSApply(x, ".//p[@class]", xmlValue)
 names(y) <- xpathSApply(x, ".//p[@class]", xmlGetAttr, "class") 
       y  
})

ldply(y, "rbind")
       pos      neg
1 positive negative
2 positive     <NA>
3 positive negative
4     <NA> negative
div
div <-getNodeSet(doc, "//div")

y <- lapply(div, function(x){
       y  <- xpathSApply(x, ".//p[@class]", xmlValue)
 names(y) <- xpathSApply(x, ".//p[@class]", xmlGetAttr, "class") 
       y  
})

ldply(y, "rbind")
       pos      neg
1 positive negative
2 positive     <NA>
3 positive negative
4     <NA> negative