减少Lucene索引的内存大小

减少Lucene索引的内存大小,lucene,Lucene,我使用Lucene搜索HTML文档。我的问题是增加了索引文件的大小,我有大约300-400MB大小的HTML文件,但索引运行高达.98Gb。我看到的原因是因为我们的规格。就像我们为四个不同的字段索引相同的内容一样,我想这就是问题所在(我们使用相同的内容,一个区分大小写,另一个不区分大小写,一个区分大小写,带特殊字符,另一个不区分大小写) 有没有办法减少索引的大小?保持相同的要求?是否有一种不同的方法来索引相同的字段并以不同的方式搜索以支持所有字段?我认为您的问题在于存储这些字段,而不仅仅是索引它

我使用Lucene搜索HTML文档。我的问题是增加了索引文件的大小,我有大约300-400MB大小的HTML文件,但索引运行高达.98Gb。我看到的原因是因为我们的规格。就像我们为四个不同的字段索引相同的内容一样,我想这就是问题所在(我们使用相同的内容,一个区分大小写,另一个不区分大小写,一个区分大小写,带特殊字符,另一个不区分大小写)


有没有办法减少索引的大小?保持相同的要求?是否有一种不同的方法来索引相同的字段并以不同的方式搜索以支持所有字段?

我认为您的问题在于存储这些字段,而不仅仅是索引它们。所以解决办法是:不要存储它们。

啊,这是我的问题。这是一个在大小上的巨大变化,大约为200MB。。非常感谢你,不过我应该想到这一点。。