试图找到一种在R中使用adist()代替字符的方法

试图找到一种在R中使用adist()代替字符的方法,r,string,levenshtein-distance,R,String,Levenshtein Distance,我希望adist函数的工作方式与它对单词和字符的工作方式相同。我的意思是,我希望删除/替换/插入应用于整个单词,而不是字符。例如,我希望“警报12在凌晨3点发出”和“警报17在凌晨3点听到”的Levenshtein距离为3,因为从一个字符串到另一个字符串需要三个替换词。谢谢我想你可以试试下面的代码来计算不同的单词 library(vecsets) d <- length(vsetdiff(unlist(strsplit(s1," ")),unlist(strsplit(s2," "))))

我希望adist函数的工作方式与它对单词和字符的工作方式相同。我的意思是,我希望删除/替换/插入应用于整个单词,而不是字符。例如,我希望“警报12在凌晨3点发出”和“警报17在凌晨3点听到”的Levenshtein距离为3,因为从一个字符串到另一个字符串需要三个替换词。谢谢

我想你可以试试下面的代码来计算不同的单词

library(vecsets)
d <- length(vsetdiff(unlist(strsplit(s1," ")),unlist(strsplit(s2," "))))
数据

s1 <- "Alert 12 went off at 3am"
s2 <- "Alert 17 was heard at 3am"

s1那么你想数一数不同的单词
strsplit
将为您提供最便捷的服务。请阅读以下内容
s1 <- "Alert 12 went off at 3am"
s2 <- "Alert 17 was heard at 3am"