RecordLinkage包和RLBigDataLinkage类对象
我正在尝试使用R package RecordLinkage,并且由包作者将其用作包之外的使用指南 我使用了两个大数据集(100k+行),我希望链接它们,因此我使用了包中围绕S4类RecordLinkage包和RLBigDataLinkage类对象,r,R,我正在尝试使用R package RecordLinkage,并且由包作者将其用作包之外的使用指南 我使用了两个大数据集(100k+行),我希望链接它们,因此我使用了包中围绕S4类RLBigDataLinkage构建的元素 我首先在R中运行以下行: >library('RecordLinkage') >data1 <- as.data.frame(#source) >data2 <- as.data.frame(#source) >rpairs <- R
RLBigDataLinkage
构建的元素
我首先在R中运行以下行:
>library('RecordLinkage')
>data1 <- as.data.frame(#source)
>data2 <- as.data.frame(#source)
>rpairs <- RLBigDataLinkage(data1, data2, strcmp = 2:8, exclude = 9:10)
我收到错误消息:
Error in dbGetQuery(object@con, "select count(*) from data1") :
error in evaluating the argument 'conn' in selecting a method for function 'dbGetQuery': Error: no slot of name "con" for this object of class "RLBigDataLinkage"
Error in table.ff(object@data@pairs$is_match, object@prediction, useNA = "ifany") :
Only vmodes integer currently allowed - are you sure ... contains only factors or integers?
另一方面,如果我运行:
>result <- epiClassify(rpairs, 0.5)
>getTable(result)
很明显,我遗漏了一些关于如何处理这些对象的信息。有没有人有看到我的错误的经验?非常感谢。当“rpairs”的类型为“RLBigDataLinkage”时,请使用
打印(rpairs)
,您将获得rpairs的摘要
Error in dbGetQuery(object@con, "select count(*) from data1") :
error in evaluating the argument 'conn' in selecting a method for function 'dbGetQuery': Error: no slot of name "con" for this object of class "RLBigDataLinkage"
>result <- epiClassify(rpairs, 0.5)
>getTable(result)
Error in table.ff(object@data@pairs$is_match, object@prediction, useNA = "ifany") :
Only vmodes integer currently allowed - are you sure ... contains only factors or integers?