Indexing 索引文件需要多少磁盘空间?

Indexing 索引文件需要多少磁盘空间?,indexing,lucene,Indexing,Lucene,我正在学习“Lucene在行动”。据说,为了搜索文件的内容,你需要对文件进行索引。我不太清楚索引文件 索引1 GB文档(如doc、xls、pdb)需要多少文件空间 为这些文件编制索引需要多长时间 我们需要每天更新索引吗 Q>索引1 GB文档(如doc、xls、pdb)需要多少文件空间? 你的问题太模糊了。文档和电子表格可以从几乎没有变化到数十甚至数百兆字节。它还取决于您将要使用的分析器和许多其他因素(例如,仅索引或索引并存储的字段等)。您可以使用进行粗略估算,并为合并添加一些额外的空间 Q>索

我正在学习“Lucene在行动”。据说,为了搜索文件的内容,你需要对文件进行索引。我不太清楚索引文件

  • 索引1 GB文档(如doc、xls、pdb)需要多少文件空间
  • 为这些文件编制索引需要多长时间
  • 我们需要每天更新索引吗

Q>索引1 GB文档(如doc、xls、pdb)需要多少文件空间?
你的问题太模糊了。文档和电子表格可以从几乎没有变化到数十甚至数百兆字节。它还取决于您将要使用的分析器和许多其他因素(例如,仅索引或索引并存储的字段等)。您可以使用进行粗略估算,并为合并添加一些额外的空间

Q>索引这些文件需要多长时间?
A>同样,这取决于有多少内容。一般来说。在给定的链接上,它的速度高达95.8GB/小时,但我假设从doc/xsl转换将增加一些成本(这与Lucene btw无关)

Q>我们需要每天更新索引吗?

A>这取决于你。如果不更新索引,将得到相同的搜索结果。没有什么神奇的方法可以让新的/更新的内容在不更新的情况下进入索引。

Q1、Q2:取决于您索引这些文档的方式和数量。问题3:您需要随时更新您的文档索引change@reto好的,所以每次文档发生更改时,我们都必须运行索引器?每次更新文档时,索引的大小都会增加吗?通常不会,您只需用更新的值替换索引中的信息。谢谢,我是初学者,如果这个问题太难问,我很抱歉。没关系。有时候,你只需要感觉自己站在回答者的立场上,想想是否有足够或太多的细节是有帮助的:-)