什么';在lua中,从很长的字符串中获得随机模式匹配的最快方法是什么?

什么';在lua中,从很长的字符串中获得随机模式匹配的最快方法是什么?,lua,lua-patterns,Lua,Lua Patterns,我有一个超过200万个字符的字符串,我觉得我目前从模式中找到随机匹配的方法并没有那么快 local function getRandomMatch(string, pattern) local occurenceCount = select(2, string.gsub(string, pattern, "")) local index, randomIndex = 0, math.random(1, occurenceCount) for match in string

我有一个超过200万个字符的字符串,我觉得我目前从模式中找到随机匹配的方法并没有那么快

local function getRandomMatch(string, pattern)
    local occurenceCount = select(2, string.gsub(string, pattern, ""))
    local index, randomIndex = 0, math.random(1, occurenceCount)
    for match in string:gmatch(pattern) do
        index = index + 1
        if index == randomIndex then
            return match
        end
    end
end
有没有办法更快一点

local find, random, match = string.find, math.random, string.match

local function getRandomMatch(string, pattern)
   local pos, random_pos = 0, 0
   for cnt = 1, math.huge do
      pos = find(string, pattern, pos + 1)
      if not pos then
         return match(string, pattern, random_pos)
      elseif random(cnt) == 1 then
         random_pos = pos
      end
   end
end

for j = 1, 20 do
   print(getRandomMatch("1234", "%d%d"))
end

更新:
快速而肮脏的解决方案:
(“脏”表示“匹配是随机的,但选择概率不相等”)


如果您的字符串是
1234
,模式是
%d%d
,您的算法将永远不会得到
23
。这对我来说运行得慢得多,但它确实帮助解决了我遇到的一个问题。
local random, match = math.random, string.match

local function getRandomMatchFastAndDirty(string, pattern)
   return match(string, pattern, random(#string)) or match(string, pattern)
end