C# 使用Lucene/iFiler/sqlfts/等索引数据库进行全文搜索
我已经询问了执行全文搜索的最佳算法/实践,现在我想决定使用哪种算法/实践。在过去的几天里,我已经彻底阅读了这个话题,但没有任何经验,我仍然需要帮助找出满足我需求的最佳工具,这就是这个问题的目的 需要考虑的要点:C# 使用Lucene/iFiler/sqlfts/等索引数据库进行全文搜索,c#,sql,mysql,full-text-search,lucene.net,C#,Sql,Mysql,Full Text Search,Lucene.net,我已经询问了执行全文搜索的最佳算法/实践,现在我想决定使用哪种算法/实践。在过去的几天里,我已经彻底阅读了这个话题,但没有任何经验,我仍然需要帮助找出满足我需求的最佳工具,这就是这个问题的目的 需要考虑的要点: 1-我正在使用C#Net 2010和SQL Server 2008 R2,也就是说,我需要一个C#/SQL友好的方法 3-要编制索引的文件为PDF、MS Office、TXT 3-我还使用OCR将收到的传真文档渲染成文本文件,现在我正在考虑使用OCR从数据库中输入的任何图片渲染文本,并使
1-我正在使用C#Net 2010和SQL Server 2008 R2,也就是说,我需要一个C#/SQL友好的方法
3-要编制索引的文件为PDF、MS Office、TXT
3-我还使用OCR将收到的传真文档渲染成文本文件,现在我正在考虑使用OCR从数据库中输入的任何图片渲染文本,并使用该文本为图片提供索引字符串。
4-能够为同一单词的不同形式提供不同的搜索结果。i、 e.搜索“国际”和“国际化”应返回不同的结果
5-我感兴趣的主要工具:
- 通过iTextSharp呈现文本,然后将其输入Lucene以获取索引字符串(这是使用Lucene的最佳方法吗?
- 使用adobe iFilter,尽管我不确定这是否足以满足使用SQL FTS的系统中的所有文件类型。它是否足够强大,可以处理文件内容的索引并执行复杂的搜索操作?
- 只要其他工具提供更好的功能,我们非常欢迎对其他工具提出任何建议。
非常感谢示例、教程和链接:)提前感谢 我使用Lucene为PDF和其他文档编制索引;非常棒 Lucene不支持词干分析(第4点),因此这两个单词将返回不同的结果;问题是,如果希望这两个搜索词返回相同的结果