String Lua-如何查找具有1或2个字符差异的子字符串

String Lua-如何查找具有1或2个字符差异的子字符串,string,lua,string-matching,String,Lua,String Matching,说我有一根绳子 local a = "Hello universe" 我通过 现在,假设字符串是 local a = "un#verse" 要搜索的字符串是宇宙;但子字符串的不同之处在于单个字符。 很明显Lua忽略了这一点 如何使函数在单个字符之间存在差异的情况下也能找到字符串 如果您知道字符的位置,请使用而不是该字符:a:find(“un.verse”) 但是,看起来您正在寻找模糊字符串搜索。它不在Luastring库的范围内。您可能希望从本文开始: 至于Lua模糊搜索的实现——我没有使用

说我有一根绳子

local a = "Hello universe"
我通过

现在,假设字符串是

local a = "un#verse"
要搜索的字符串是宇宙;但子字符串的不同之处在于单个字符。 很明显Lua忽略了这一点


如何使函数在单个字符之间存在差异的情况下也能找到字符串

如果您知道字符的位置,请使用
而不是该字符:
a:find(“un.verse”)

但是,看起来您正在寻找模糊字符串搜索。它不在Lua
string
库的范围内。您可能希望从本文开始:

至于Lua模糊搜索的实现——我没有使用过,但是谷歌搜索“Lua模糊搜索”会给出一些结果。其中一些基于本文:


试试。

听起来你想要的东西大致如下:

TRE是一个轻量级、健壮且高效的POSIX兼容regexp匹配库,具有一些令人兴奋的特性,例如近似(模糊)匹配

近似模式匹配允许匹配是近似的,也就是说,允许匹配在某种程度上接近搜索的模式。TRE使用编辑距离度量(也称为Levenshtein距离),在该度量中,可以在搜索文本中插入、删除或替换字符,以获得精确匹配。每次插入、删除或替换都会增加匹配的距离或成本。TRE可以报告成本低于某个给定阈值的匹配。TRE还可以用于搜索成本最低的匹配项


它的Lua绑定可以作为您自己的简单滚动方法的一部分提供(基于模式保持相同长度的假设):


但是请注意,
a-b
不等于
b-a

如果您真的在寻找单个字符的差异,而不关心性能,下面是一个简单的方法:

local a = "Hello un#verse"

local myfind = function(s,p)  
  local withdot = function(n)
    return p:sub(1,n-1) .. '.' .. p:sub(n+1)
  end
  local a,b
  for i=1,#s do
    a,b = s:find(withdot(i))
    if a then return a,b end
  end
end

print(myfind(a,"universe"))

Eep!我没有意识到这是一个复杂的问题。。。对于我目前的需求来说,这当然不值得实现,因为它非常琐碎。。虽然这看起来是个很有趣的话题。。也许有一天会有用:)谢谢你的回复!请注意,与标准类型混淆通常被认为是一种糟糕的风格。但这很有趣!遗憾的是,您不能使覆盖标准运算符成为1+1==3;)。但这确实是一种糟糕的风格。添加了免责声明。@jpjacobs谢谢您的代码。虽然表演会大受欢迎(二次时间?),不是吗?我会比较好几个词,所以…这要看情况而定。如果它正在解析用户输入,没有问题,那么用户的速度会变慢。否则,只需尝试一下,并测量性能命中率。整洁的小库。。不幸的是,我不能在我的程序中集成C库。这就是窗外:(检查一下算法。
function hammingdistance(a,b)
    local ta={a:byte(1,-1)}
    local tb={b:byte(1,-1)}
    local res = 0
    for k=1,#a do
        if ta[k]~=tb[k] then
            res=res+1
        end
    end
    print(a,b,res) -- debugging/demonstration print
    return res
end

function fuz(s,pat)
    local best_match=10000
    local best_location
    for k=1,#s-#pat+1 do
        local cur_diff=hammingdistance(s:sub(k,k+#pat-1),pat)
        if  cur_diff < best_match then
            best_location = k
            best_match = cur_diff
        end
    end
    local start,ending = math.max(1,best_location),math.min(best_location+#pat-1,#s)
    return start,ending,s:sub(start,ending)
end

s=[[Hello, Universe! UnIvErSe]]
print(fuz(s,'universe'))
getmetatable('').__sub=hammingdistance
a='Hello'
b='hello'
print(a-b)
local a = "Hello un#verse"

local myfind = function(s,p)  
  local withdot = function(n)
    return p:sub(1,n-1) .. '.' .. p:sub(n+1)
  end
  local a,b
  for i=1,#s do
    a,b = s:find(withdot(i))
    if a then return a,b end
  end
end

print(myfind(a,"universe"))