如何使用lucene从一份简历中提取信息

如何使用lucene从一份简历中提取信息,lucene,Lucene,各位! 我是Lucene的新人 我正在用lucene做一个简历过滤项目。首先,我想从简历中提取一些基本信息,如bithday等 假设总是有一行字写着生日:1989/10/19或类似的东西。如何用Lucene而不是直接使用正则表达式提取此类信息 目前我发现也许使用PanarQuery会有帮助。但我似乎无法将通配符查询添加到SpanarQuery以匹配生日信息 我完全被绊倒了。有什么好的建议吗?真的很感激 从包含一堆文本和日期格式的Lucene字段中提取日期并没有灵丹妙药。最好的方法是编写一个自定义

各位!

我是Lucene的新人

我正在用lucene做一个简历过滤项目。首先,我想从简历中提取一些基本信息,如bithday等

假设总是有一行字写着生日:1989/10/19或类似的东西。如何用Lucene而不是直接使用正则表达式提取此类信息

目前我发现也许使用PanarQuery会有帮助。但我似乎无法将通配符查询添加到SpanarQuery以匹配生日信息


我完全被绊倒了。有什么好的建议吗?真的很感激

从包含一堆文本和日期格式的Lucene字段中提取日期并没有灵丹妙药。最好的方法是编写一个自定义分析器,它可以在索引过程中将术语分开,并将数字字符标识为日期


我为Lucene编写了几个分析器,但是类似的东西并不是很简单……特别是如果您是Lucene新手。

Lucene具有正则表达式查询支持。