比较R中两列中每行存储的文本
我有两个向量比较R中两列中每行存储的文本,r,text-mining,cosine-similarity,lsa,R,Text Mining,Cosine Similarity,Lsa,我有两个向量 a=c(“abc”、“def”、“ghi”、“jkl”) b=c(“abc”、“dez”、“gyx”、“mno”) 如何获取余弦值以比较相应的条目?在这种情况下,我需要能够说每个向量中的第一个条目是完全相似的,每个向量中的第二个条目是稍微相似的。。。每个向量的最后一个条目是完全不同的?我尝试了lsa包-但我可以得到一个总余弦值您可以使用stringdist包 stringdist(a, b, method = "cosine") #[1] 0.0000000 0.3333333 0
a=c(“abc”、“def”、“ghi”、“jkl”)
b=c(“abc”、“dez”、“gyx”、“mno”)
如何获取余弦值以比较相应的条目?在这种情况下,我需要能够说每个向量中的第一个条目是完全相似的,每个向量中的第二个条目是稍微相似的。。。每个向量的最后一个条目是完全不同的?我尝试了lsa包-但我可以得到一个总余弦值您可以使用
stringdist
包
stringdist(a, b, method = "cosine")
#[1] 0.0000000 0.3333333 0.6666667 1.0000000