C# lucene.net可以在文档中处理的最大索引数是多少

C# lucene.net可以在文档中处理的最大索引数是多少,c#,lucene,lucene.net,C#,Lucene,Lucene.net,Lucene没有记录存储引擎的限制。有人知道每个文档允许的最大索引数吗?对于所有类型的索引(Lucene、RDBMS或其他),建议索引尽可能少的字段数,因为它可以使索引大小保持较小,并减少从索引读取的运行时开销 也就是说,字段计数限制受到系统资源的限制。字段由其名称(区分大小写)标识,而不是由任意数字ID标识,这通常成为此类系统中的限制因素。在没有严格的最大字段名长度(如Lucene)的系统中,理论字段计数限制也很难预测 我个人使用了200多个分析字段,20多亿个文档都没有问题。同时,在中型Az

Lucene没有记录存储引擎的限制。有人知道每个文档允许的最大索引数吗?

对于所有类型的索引(Lucene、RDBMS或其他),建议索引尽可能少的字段数,因为它可以使索引大小保持较小,并减少从索引读取的运行时开销

也就是说,字段计数限制受到系统资源的限制。字段由其名称(区分大小写)标识,而不是由任意数字ID标识,这通常成为此类系统中的限制因素。在没有严格的最大字段名长度(如Lucene)的系统中,理论字段计数限制也很难预测


我个人使用了200多个分析字段,20多亿个文档都没有问题。同时,在中型Azure VM上使用较小的索引时,同一索引的性能并不是我所期望的。

正如所有类型的索引(Lucene、RDBMS或其他)所建议的那样,建议索引尽可能少的字段数,因为这样可以使索引大小保持较小,并减少从索引读取的运行时开销

也就是说,字段计数限制受到系统资源的限制。字段由其名称(区分大小写)标识,而不是由任意数字ID标识,这通常成为此类系统中的限制因素。在没有严格的最大字段名长度(如Lucene)的系统中,理论字段计数限制也很难预测


我个人使用了200多个分析字段,20多亿个文档都没有问题。同时,在中型Azure VM上使用较小的索引时,同一索引的性能并不是我所期望的。

正如所有类型的索引(Lucene、RDBMS或其他)所建议的那样,建议索引尽可能少的字段数,因为这样可以使索引大小保持较小,并减少从索引读取的运行时开销

也就是说,字段计数限制受到系统资源的限制。字段由其名称(区分大小写)标识,而不是由任意数字ID标识,这通常成为此类系统中的限制因素。在没有严格的最大字段名长度(如Lucene)的系统中,理论字段计数限制也很难预测


我个人使用了200多个分析字段,20多亿个文档都没有问题。同时,在中型Azure VM上使用较小的索引时,同一索引的性能并不是我所期望的。

正如所有类型的索引(Lucene、RDBMS或其他)所建议的那样,建议索引尽可能少的字段数,因为这样可以使索引大小保持较小,并减少从索引读取的运行时开销

也就是说,字段计数限制受到系统资源的限制。字段由其名称(区分大小写)标识,而不是由任意数字ID标识,这通常成为此类系统中的限制因素。在没有严格的最大字段名长度(如Lucene)的系统中,理论字段计数限制也很难预测


我个人使用了200多个分析字段,20多亿个文档都没有问题。同时,在中型Azure VM上使用较小的索引时,同一索引的性能并不是我所期望的。

当提到术语编号时,Lucene当前的实现使用Java int来保存术语索引,这意味着任何单个索引段中唯一项的最大数量约为术语索引间隔的21亿倍(默认值128)=2740亿。这在技术上不是索引文件格式的限制,只是Lucene当前实现的限制

类似地,Lucene使用Java int来表示文档编号,索引文件格式使用磁盘上的Int32来存储文档编号。这是索引文件格式和当前实现的一个限制。最终,这些值应替换为UInt64值,或者更好的是,没有限制的VInt值


当提到术语编号时,Lucene当前的实现使用Java int来保存术语索引,这意味着任何单个索引段中唯一术语的最大数量约为术语索引间隔的21亿倍(默认值128)=2740亿。这在技术上不是索引文件格式的限制,只是Lucene当前实现的限制

类似地,Lucene使用Java int来表示文档编号,索引文件格式使用磁盘上的Int32来存储文档编号。这是索引文件格式和当前实现的一个限制。最终,这些值应替换为UInt64值,或者更好的是,没有限制的VInt值


当提到术语编号时,Lucene当前的实现使用Java int来保存术语索引,这意味着任何单个索引段中唯一术语的最大数量约为术语索引间隔的21亿倍(默认值128)=2740亿。这在技术上不是索引文件格式的限制,只是Lucene当前实现的限制

类似地,Lucene使用Java int来表示文档编号,索引文件格式使用磁盘上的Int32来存储文档编号。这是索引文件格式和当前实现的一个限制。最终,这些值应替换为UInt64值,或者更好的是,没有限制的VInt值


当提到术语编号时,Lucene当前的实现使用Java int来保存术语索引,这意味着任何单个索引段中唯一术语的最大数量约为术语索引间隔的21亿倍(默认值128)=2740亿。我是techni