32位操作系统上的索引java lucene 3.0.2的最大文档大小/数量是多少

32位操作系统上的索引java lucene 3.0.2的最大文档大小/数量是多少,java,winapi,lucene,Java,Winapi,Lucene,我在玩lucene和40GB的数据(大约500万元组,两个字段的行为类似于键值)。令人惊讶的是,我创建了一个35 GB的索引,但它不起作用。因此,我想创建一组较小的标记,但为此,我需要有关最大大小的信息。您使用什么文件系统?您是否绝对确定已创建有效的索引?您如何准确地为数据编制索引 理论上,你不应该长时间处于最高点 限制 当提到术语编号时,Lucene的当前实现使用Java int,这意味着任何单个索引段中唯一术语的最大数量为2147483648。这在技术上不是索引文件格式的限制,只是Lucen

我在玩lucene和40GB的数据(大约500万元组,两个字段的行为类似于键值)。令人惊讶的是,我创建了一个35 GB的索引,但它不起作用。因此,我想创建一组较小的标记,但为此,我需要有关最大大小的信息。

您使用什么文件系统?您是否绝对确定已创建有效的索引?您如何准确地为数据编制索引

理论上,你不应该长时间处于最高点

限制

当提到术语编号时,Lucene的当前实现使用Java int,这意味着任何单个索引段中唯一术语的最大数量为2147483648。这在技术上不是索引文件格式的限制,只是Lucene当前实现的限制

类似地,Lucene使用Java int来表示文档编号,索引文件格式使用磁盘上的Int32来存储文档编号。这是索引文件格式和当前实现的一个限制。最终,这些值应替换为UInt64值,或者更好的是,没有限制的VInt值


您正在使用和32位虚拟机吗?如果是这样,地址空间就不足以覆盖整个索引,这可能会导致问题。在这种情况下,您需要使用或。请注意,像return a这样的函数可能是MMapDirectory,也可能不是MMapDirectory。

请详细说明“索引不起作用”?“不起作用”:*我在索引中搜索时没有得到任何结果。*我无法检索索引中的第一个文档。*Luke()无法打开我的索引并打印出错误消息:超出索引例外我将索引用作映射(键、值)。这些键被索引和规范化。将存储这些值。我的平台是NTFS上的Windows XP。