Symfony1 Lucene搜索的好选择是什么?

Symfony1 Lucene搜索的好选择是什么?,symfony1,lucene,ms-word,converter,zend-lucene,Symfony1,Lucene,Ms Word,Converter,Zend Lucene,我有数千份简历,我想搜索那些以“计算机科学”为背景的简历 所以,我在谷歌上搜索,知道Lucene做这项工作,我需要将数据提供给Lucene,它为所有文档编制索引 在搜索特定文本(比如“Compute science”)时,它会生成与结果匹配的CV 为此,我需要将MSword-93/MSword-2007/PDF转换为文本并向Lucene提供信息 我可以从MSword2007文档中获取文本,但无法从MSWord2003中获取文本 有很多pdf作者,但我没有任何pdf阅读器库可以做到这一点 请提供一

我有数千份简历,我想搜索那些以“计算机科学”为背景的简历

所以,我在谷歌上搜索,知道Lucene做这项工作,我需要将数据提供给Lucene,它为所有文档编制索引

在搜索特定文本(比如“Compute science”)时,它会生成与结果匹配的CV

为此,我需要将MSword-93/MSword-2007/PDF转换为文本并向Lucene提供信息

我可以从MSword2007文档中获取文本,但无法从MSWord2003中获取文本

有很多pdf作者,但我没有任何pdf阅读器库可以做到这一点

请提供一些关于PDF阅读器库和将ms93文档转换为文本的说明,或者请让我知道Lucene搜索是否有其他选择


谢谢,非常感谢您的回答

您可以使用或直接从PDF和MS Word中提取文本并编制索引。这两个项目都是Java项目,但您可以从PHP调用它们的服务器。

这里您一次问了半打问题。请将问题的范围限制在一个明确的主题上。