快速Levenshtein距离在R?

快速Levenshtein距离在R?,r,performance,packages,levenshtein-distance,stringdist,R,Performance,Packages,Levenshtein Distance,Stringdist,是否有一个包含Levenshtein距离计数函数的包,该函数是以C或Fortran代码实现的?我有很多字符串要比较,而mischerpho中的stringMatch太慢了。(来自RecordLinkage包)调用编译的C代码。试一试。你也可以从Biostrings中尝试stringDist,包中的stringDist也可以这样做,甚至比levenshteinDist在某些条件下更快()你也可以使用textTinyR包中的levenshteindistance()。当涉及到大约30k个字符的较大字

是否有一个包含Levenshtein距离计数函数的包,该函数是以C或Fortran代码实现的?我有很多字符串要比较,而
mischerpho
中的
stringMatch
太慢了。

(来自
RecordLinkage
包)调用编译的C代码。试一试。

你也可以从
Biostrings
中尝试
stringDist
,包中的
stringDist
也可以这样做,甚至比
levenshteinDist
在某些条件下更快()

你也可以使用
textTinyR
包中的
levenshteindistance()
。当涉及到大约30k个字符的较大字符向量时,我在所有其他软件包中都遇到了“calloc”内存错误。只有
textTinyR
对我有效

自从你链接到那个博客后,stringdist的速度明显加快:它现在使用多个内核。只需注意RecordLink包显然不再维护,而是从CRAN中提取出来的。
stringdist
包现在就是解决方案。