快速Levenshtein距离在R?
是否有一个包含Levenshtein距离计数函数的包,该函数是以C或Fortran代码实现的?我有很多字符串要比较,而快速Levenshtein距离在R?,r,performance,packages,levenshtein-distance,stringdist,R,Performance,Packages,Levenshtein Distance,Stringdist,是否有一个包含Levenshtein距离计数函数的包,该函数是以C或Fortran代码实现的?我有很多字符串要比较,而mischerpho中的stringMatch太慢了。(来自RecordLinkage包)调用编译的C代码。试一试。你也可以从Biostrings中尝试stringDist,包中的stringDist也可以这样做,甚至比levenshteinDist在某些条件下更快()你也可以使用textTinyR包中的levenshteindistance()。当涉及到大约30k个字符的较大字
mischerpho
中的stringMatch
太慢了。(来自RecordLinkage
包)调用编译的C代码。试一试。你也可以从Biostrings
中尝试stringDist
,包中的stringDist
也可以这样做,甚至比levenshteinDist
在某些条件下更快()你也可以使用textTinyR
包中的levenshteindistance()
。当涉及到大约30k个字符的较大字符向量时,我在所有其他软件包中都遇到了“calloc”内存错误。只有textTinyR
对我有效 自从你链接到那个博客后,stringdist的速度明显加快:它现在使用多个内核。只需注意RecordLink包显然不再维护,而是从CRAN中提取出来的。stringdist
包现在就是解决方案。