关于Lucene 4.4(日志搜索)的建议
我是Lucene的新手,尝试使用它搜索SystemA生成的日志文件/条目 建筑学关于Lucene 4.4(日志搜索)的建议,lucene,Lucene,我是Lucene的新手,尝试使用它搜索SystemA生成的日志文件/条目 建筑学 接收输入目录中的每个日志条目(即XML)。SystemA将日志条目发送到MQ队列,该队列由一个小型实用程序轮询,该实用程序拾取消息并在输入目录中创建一个文件 WriteIndex.java(即IndexWriter/Lucene)不断检查输入目录中是否接收到新文件。如果是,它将获取文件,放入索引并将文件移动到输出目录。作为索引的一部分,我将文件名、路径、时间戳和内容放入索引中。 “注意:我正在创建内容索引,并将整个
Rohit Goyal建筑看起来不错 几件事
- 考虑使用TextField而不是StringField。TextField将标记化,因此用户可以搜索标记。StringField未标记化,因此要使文档匹配搜索,全文应该匹配
- lucene的性能没有问题。查看Lucene性能图。Lucene可以在几分钟内为超过10亿个维基百科文档生成索引。搜索也很快