在Redis中存储相似项的巨大随机列表_Redis_Data Storage_High Load

在Redis中存储相似项的巨大随机列表

redis

在Redis中存储相似项的巨大随机列表,redis,data-storage,high-load,Redis,Data Storage,High Load,Redis 2.0.3 我需要在Redis中存储一个庞大的项目列表。每个项目都是一个短字符串（少于256个字符）我需要在列表上执行两个操作：添加许多（数千到一百万）相同的项目。（一天几次）从列表中删除一个随机项。没有必要有“公平”的随机性。任何“足够好”的方法都可以。（每秒最多数百次）我没有足够的内存来逐个存储列表中的所有项目我认为我需要分批存储项目、名称和计数器。（将有多达数千个不同的项目，更像数百个。）但我不知道如何有效地组织这件事有什么提示吗？好吧，既然没有人来帮我，这里

Redis 2.0.3

我需要在Redis中存储一个庞大的项目列表。每个项目都是一个短字符串（少于256个字符）

我需要在列表上执行两个操作：

添加许多（数千到一百万）相同的项目。（一天几次）
从列表中删除一个随机项。没有必要有“公平”的随机性。任何“足够好”的方法都可以。（每秒最多数百次）

我没有足够的内存来逐个存储列表中的所有项目

我认为我需要分批存储项目、名称和计数器。（将有多达数千个不同的项目，更像数百个。）

但我不知道如何有效地组织这件事

有什么提示吗？

好吧，既然没有人来帮我，这里有一个伪代码的“愚蠢”解决方案

获取随机元素：

function maybe_get_next_item()
  item_name = SRANDMEMBER "items-set"
  item_key = "items:" + item_name

  new_item_count = DECR (item_key)

  if new_item_count < 0 then
    LOCK -- As explained in SETNX docs
      new_item_count = GET (item_key) -- More added while we were locking?
      if new_item_count and new_item_count < 0 then
        SREM (item_name) -- No, expire it
      end
    UNLOCK
  end

  if new_item_count and new_item_count >= 0 then
    return item_name
  end

  return false -- this item not found
end

function get_next_item()
  item_name = maybe_get_next_item()
  while not item_name and (SCARD "items-set" > 0) do
    item_name = maybe_get_next_item()
  end
  return item_name -- false if all items are expended
end

请建议一个更好的解决方案，如果它存在的话，我仍然在摸索Redis，可能会错过一些明显的东西

我怀疑

insert_items（）

中的

LOCK

UNLOCK

可能是多余的，可以用

MULTI

EXEC

替换，但我认为

中的LOCK
/UNLOCK
可能需要它才能正常工作（我不知道如何替换为MULTI
/EXEC
）…注意，这里的概率是倾斜的，因为相同项目的数量在获得项目的机会中不起任何作用。这对于我的特定用例来说是可以的。在2.2上，更好的方法是使用WATCH：
function insert_items(item_name, amount)
  LOCK -- As explained in SETNX docs
    SADD "items-set" (item_name)
    INCRBY ("items:" + item_name) amount
  UNLOCK
end