R:通过字符串匹配来子集数据表

R:通过字符串匹配来子集数据表,r,database,data.table,subset,R,Database,Data.table,Subset,我在R中有这个数据表(47541025行): require(data.table) DT@digEmAll演示了执行此操作的典型方法: DT[language1 %in% desired_subset & language2 %in% desired_subset] 如果您打算重复此操作,可能还需要为数据.table设置键,因为它太大了: setkey(DT, language1, language2) DT[.(desired_subset, desired_subset)]

我在R中有这个数据表(47541025行):

require(data.table)

DT@digEmAll演示了执行此操作的典型方法:

DT[language1 %in% desired_subset & language2 %in% desired_subset]
如果您打算重复此操作,可能还需要为
数据.table
设置键,因为它太大了:

setkey(DT, language1, language2)

DT[.(desired_subset, desired_subset)]

看来你应该好好阅读,尤其是你的问题。

你说的倒数距离是什么意思?你能显示几行.txt文件吗?我的错,只是两种语言之间的距离!txt文件只是我感兴趣的语言的一栏列表,
DT[language1%在%fortyOneLanguages中,language2%在%fortyOneLanguages中,]
setkey(DT, language1, language2)

DT[.(desired_subset, desired_subset)]