Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby/22.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用Ruby测量两个字符串之间的距离?_Ruby_String_Function - Fatal编程技术网

用Ruby测量两个字符串之间的距离?

用Ruby测量两个字符串之间的距离?,ruby,string,function,Ruby,String,Function,我可以用Ruby测量两个字符串之间的距离吗 即: compare('Test', 'est') # Returns 1 compare('Test', 'Tes') # Returns 1 compare('Test', 'Tast') # Returns 1 compare('Test', 'Taste') # Returns 2 compare('Test', 'tazT') # Returns 5 我为你找到了这个: def levenshtein_distance(s, t) m

我可以用Ruby测量两个字符串之间的距离吗

即:

compare('Test', 'est') # Returns 1
compare('Test', 'Tes') # Returns 1
compare('Test', 'Tast') # Returns 1
compare('Test', 'Taste') # Returns 2
compare('Test', 'tazT') # Returns 5
我为你找到了这个:

def levenshtein_distance(s, t)
  m = s.length
  n = t.length
  return m if n == 0
  return n if m == 0
  d = Array.new(m+1) {Array.new(n+1)}

  (0..m).each {|i| d[i][0] = i}
  (0..n).each {|j| d[0][j] = j}
  (1..n).each do |j|
    (1..m).each do |i|
      d[i][j] = if s[i-1] == t[j-1]  # adjust index into string
                  d[i-1][j-1]       # no operation required
                else
                  [ d[i-1][j]+1,    # deletion
                    d[i][j-1]+1,    # insertion
                    d[i-1][j-1]+1,  # substitution
                  ].min
                end
    end
  end
  d[m][n]
end

[ ['fire','water'], ['amazing','horse'], ["bamerindos", "giromba"] ].each do |s,t|
  puts "levenshtein_distance('#{s}', '#{t}') = #{levenshtein_distance(s, t)}"
end
这是很棒的输出:=)


来源:

简单多了,我有时是一个红宝石炫耀者

# Levenshtein distance, translated from wikipedia pseudocode by ross

def lev s, t
  return t.size if s.empty?
  return s.size if t.empty?
  return [ (lev s.chop, t) + 1,
           (lev s, t.chop) + 1,
           (lev s.chop, t.chop) + (s[-1, 1] == t[-1, 1] ? 0 : 1)
       ].min
end

由于本机C绑定,更容易、更快速:

gem install levenshtein-ffi
gem install levenshtein

require 'levenshtein'

Levenshtein.normalized_distance string1, string2, threshold

我做了一个例子,算法是用C实现的

require "damerau-levenshtein"
dl = DamerauLevenshtein
dl.distance("Something", "Smoething") #returns 1

Rubygems中有一个实用方法实际上应该是公共的,但无论如何它不是:

require "rubygems/text"
ld = Class.new.extend(Gem::Text).method(:levenshtein_distance)

p ld.call("asd", "sdf") => 2

我喜欢上面的DigitalRoss解决方案。然而,正如dawg所指出的,它的运行时间是按照
O(3^n)
的顺序增长的,这对于较长的字符串是不好的。 使用记忆或“动态规划”可以大大加快解决方案的速度:

def lev(string1, string2, memo={})
  return memo[[string1, string2]] if memo[[string1, string2]]
  return string2.size if string1.empty?
  return string1.size if string2.empty?
  min = [ lev(string1.chop, string2, memo) + 1,
          lev(string1, string2.chop, memo) + 1,
          lev(string1.chop, string2.chop, memo) + (string1[-1] == string2[-1] ? 0 : 1)
       ].min
  memo[[string1, string2]] = min
  min
end
然后我们就有了更好的运行时(我认为它几乎是线性的?我不是很确定)


Ruby 2.3及更高版本随附,其中包括。适用于大多数情况,默认情况下可用

DidYouMean::Levenshtein.distance(“Test”,“est”)#=>1

你的意思是差异吗?搜索“levenshtein distance ruby”并查看。(我不太清楚为什么最后一个调用应该返回5;最大编辑距离是由输入长度决定的。)@nzifnab因此,我需要一个整数返回。检查“”。这可能会很慢,但如果您想调整代码以计算字符串以外的内容(例如,单词列表)的Levenshtein距离,这是一个很好的起点.require'levenshtein'答案也适用于单词数组,事实上,任何理解
:hash
:eql?
的东西的数组。这个答案闻起来最像红宝石。递归和切碎FTW!这是一个很酷的小演示,但不适合生产。尝试
lev“123456789123456789”,“123456789”
…我用它来比较两个字符串,一个是17个字符,一个是21个字符。在我取消之前,它运行了5分钟。接受的答案立即返回。请注意,这不处理Unicode(截至本文撰写时的levenstein ffi gem),如果您包含该模块,您可以说它已经是公共的。在代码中包含Gem::Text,然后像这样使用:
levenshtein\u距离('asd','sdf')
def lev(string1, string2, memo={})
  return memo[[string1, string2]] if memo[[string1, string2]]
  return string2.size if string1.empty?
  return string1.size if string2.empty?
  min = [ lev(string1.chop, string2, memo) + 1,
          lev(string1, string2.chop, memo) + 1,
          lev(string1.chop, string2.chop, memo) + (string1[-1] == string2[-1] ? 0 : 1)
       ].min
  memo[[string1, string2]] = min
  min
end
[9] pry(main)> require 'benchmark'
=> true
[10] pry(main)> @memo = {}
=> {}
[11] pry(main)> Benchmark.realtime{puts lev("Hello darkness my old friend", "I've come to talk with you again")}
26
=> 0.007071999832987785