Nlp 使用字数计算欧几里德距离
考虑以下两句话 句子1:敏捷的棕色狐狸跳过懒惰的狗 敏捷的棕色狗胜过敏捷的狐狸Nlp 使用字数计算欧几里德距离,nlp,text-analysis,Nlp,Text Analysis,考虑以下两句话 句子1:敏捷的棕色狐狸跳过懒惰的狗 敏捷的棕色狗胜过敏捷的狐狸 使用字数计算欧几里德距离 您可以使用软件包tm查找字数,然后计算欧几里德距离 > library(tm) > s1 <- " The quick brown fox jumps over the lazy dog" > s2 <- "A quick brown dog outpaces a quick fox" > > VS <- VectorSource(c(s1,
使用字数计算欧几里德距离 您可以使用软件包
tm
查找字数,然后计算欧几里德距离
> library(tm)
> s1 <- " The quick brown fox jumps over the lazy dog"
> s2 <- "A quick brown dog outpaces a quick fox"
>
> VS <- VectorSource(c(s1,s2))
> corp <- Corpus(VS)
> dtm <- DocumentTermMatrix(corp)
> d <- dist(t(dtm), method = 'euclidean')
> d
brown dog fox jumps lazy outpaces over quick
dog 0.000000
fox 0.000000 0.000000
jumps 1.000000 1.000000 1.000000
lazy 1.000000 1.000000 1.000000 0.000000
outpaces 1.000000 1.000000 1.000000 1.414214 1.414214
over 1.000000 1.000000 1.000000 0.000000 0.000000 1.414214
quick 1.000000 1.000000 1.000000 2.000000 2.000000 1.414214 2.000000
the 1.414214 1.414214 1.414214 1.000000 1.000000 2.236068 1.000000 2.236068
>库(tm)
>s1 s2
>VS公司dtm d
棕色的狗狐狸跳得懒洋洋的,跑得快
狗0.000000
福克斯0.0000000.000000
跳跃1.000000 1.000000 1.000000
懒惰的1.0000001.0000001.0000000.000000
超过1.0000001.0000001.0000001.414214 1.414214
超过1.0000001.0000001.0000000.0000000.0000001.414214
快速1.0000001.0000001.0000002.0000002.0000001.414214.000000
1.414214 1.414214 1.414214 1.000000 1.000000 2.236068 1.000000 2.236068