R:通过字符串匹配来子集数据表
我在R中有这个数据表(47541025行):R:通过字符串匹配来子集数据表,r,database,data.table,subset,R,Database,Data.table,Subset,我在R中有这个数据表(47541025行): require(data.table) DT@digEmAll演示了执行此操作的典型方法: DT[language1 %in% desired_subset & language2 %in% desired_subset] 如果您打算重复此操作,可能还需要为数据.table设置键,因为它太大了: setkey(DT, language1, language2) DT[.(desired_subset, desired_subset)]
require(data.table)
DT@digEmAll演示了执行此操作的典型方法:
DT[language1 %in% desired_subset & language2 %in% desired_subset]
如果您打算重复此操作,可能还需要为数据.table
设置键,因为它太大了:
setkey(DT, language1, language2)
DT[.(desired_subset, desired_subset)]
看来你应该好好阅读,尤其是你的问题。你说的倒数距离是什么意思?你能显示几行.txt文件吗?我的错,只是两种语言之间的距离!txt文件只是我感兴趣的语言的一栏列表,DT[language1%在%fortyOneLanguages中,language2%在%fortyOneLanguages中,]
?
setkey(DT, language1, language2)
DT[.(desired_subset, desired_subset)]