Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/306.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/sql/71.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 使用Lucene/iFiler/sqlfts/等索引数据库进行全文搜索_C#_Sql_Mysql_Full Text Search_Lucene.net - Fatal编程技术网

C# 使用Lucene/iFiler/sqlfts/等索引数据库进行全文搜索

C# 使用Lucene/iFiler/sqlfts/等索引数据库进行全文搜索,c#,sql,mysql,full-text-search,lucene.net,C#,Sql,Mysql,Full Text Search,Lucene.net,我已经询问了执行全文搜索的最佳算法/实践,现在我想决定使用哪种算法/实践。在过去的几天里,我已经彻底阅读了这个话题,但没有任何经验,我仍然需要帮助找出满足我需求的最佳工具,这就是这个问题的目的 需要考虑的要点: 1-我正在使用C#Net 2010和SQL Server 2008 R2,也就是说,我需要一个C#/SQL友好的方法 3-要编制索引的文件为PDF、MS Office、TXT 3-我还使用OCR将收到的传真文档渲染成文本文件,现在我正在考虑使用OCR从数据库中输入的任何图片渲染文本,并使

我已经询问了执行全文搜索的最佳算法/实践,现在我想决定使用哪种算法/实践。在过去的几天里,我已经彻底阅读了这个话题,但没有任何经验,我仍然需要帮助找出满足我需求的最佳工具,这就是这个问题的目的

需要考虑的要点:
1-我正在使用C#Net 2010和SQL Server 2008 R2,也就是说,我需要一个C#/SQL友好的方法
3-要编制索引的文件为PDF、MS Office、TXT
3-我还使用OCR将收到的传真文档渲染成文本文件,现在我正在考虑使用OCR从数据库中输入的任何图片渲染文本,并使用该文本为图片提供索引字符串。
4-能够为同一单词的不同形式提供不同的搜索结果。i、 e.搜索“国际”和“国际化”应返回不同的结果
5-我感兴趣的主要工具:
  • 通过iTextSharp呈现文本,然后将其输入Lucene以获取索引字符串(这是使用Lucene的最佳方法吗?
  • 使用adobe iFilter,尽管我不确定这是否足以满足使用SQL FTS的系统中的所有文件类型。它是否足够强大,可以处理文件内容的索引并执行复杂的搜索操作?
  • 只要其他工具提供更好的功能,我们非常欢迎对其他工具提出任何建议。

非常感谢示例、教程和链接:)提前感谢

我使用Lucene为PDF和其他文档编制索引;非常棒

Lucene不支持词干分析(第4点),因此这两个单词将返回不同的结果;问题是,如果希望这两个搜索词返回相同的结果