Java 如何将Lucene与;您想在PDF文档中进行搜索吗?

Java 如何将Lucene与;您想在PDF文档中进行搜索吗?,java,dictionary,lucene,information-retrieval,hunspell,Java,Dictionary,Lucene,Information Retrieval,Hunspell,我正在尝试将hunspell实现到lucene中。任务是制作一个应用程序,在pdf文档中查找单词。我知道我要做什么,但不具体。 我知道我必须制作一个包含文档词根的索引列表,然后在该列表中搜索 但是:我是一个java初学者,所以我真的不知道如何开始。 每一条建议都会很有帮助。我快速查看了Lucene API,看看发生了什么(您的项目似乎很有趣)。在这么短的时间内,我发现的唯一一件事是,也许你可以从那里开始。你是否试图确保PDF文件中的拼写错误被索引为最可能的更正?或者作为一个最有可能的更正和它出现

我正在尝试将hunspell实现到lucene中。任务是制作一个应用程序,在pdf文档中查找单词。我知道我要做什么,但不具体。 我知道我必须制作一个包含文档词根的索引列表,然后在该列表中搜索

但是:我是一个java初学者,所以我真的不知道如何开始。
每一条建议都会很有帮助。

我快速查看了Lucene API,看看发生了什么(您的项目似乎很有趣)。在这么短的时间内,我发现的唯一一件事是,也许你可以从那里开始。你是否试图确保PDF文件中的拼写错误被索引为最可能的更正?或者作为一个最有可能的更正和它出现的术语?我快速查看了Lucene API以了解发生了什么(您的项目似乎很有趣)。在这么短的时间内,我发现的唯一一件事是,也许你可以从那里开始。你是否试图确保PDF文件中的拼写错误被索引为最可能的更正?或者作为最有可能的修正和它出现的术语?