Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/284.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# Xapian vs Lucene.Net-阿拉伯语文档文本搜索_C#_Full Text Search_Lucene.net_Arabic_Xapian - Fatal编程技术网

C# Xapian vs Lucene.Net-阿拉伯语文档文本搜索

C# Xapian vs Lucene.Net-阿拉伯语文档文本搜索,c#,full-text-search,lucene.net,arabic,xapian,C#,Full Text Search,Lucene.net,Arabic,Xapian,我面临着在C#Net中通过大量阿拉伯语内容文档(PDF和Doc文件)进行文本搜索的问题 经过一番又一番的搜索,我想出了两个解决方案 首先,Lucene.Net和我面临以下问题 1-阿拉伯语分析器将与Lucene.Net一起使用并找到,不知道它是否会工作 2-从文档(大约6000个PDF和Doc文件)中提取文本,并找到Tika,我将在ikvm的帮助下在.Net中使用它。 然而,考虑到这个解决方案会起作用,我不知道性能会如何 其次,Xapian为了利用omega库,我转向了这个解决方案,但仍然发现了

我面临着在C#Net中通过大量阿拉伯语内容文档(PDF和Doc文件)进行文本搜索的问题

经过一番又一番的搜索,我想出了两个解决方案

首先,Lucene.Net和我面临以下问题

1-阿拉伯语分析器将与Lucene.Net一起使用并找到,不知道它是否会工作

2-从文档(大约6000个PDF和Doc文件)中提取文本,并找到Tika,我将在ikvm的帮助下在.Net中使用它。 然而,考虑到这个解决方案会起作用,我不知道性能会如何

其次,Xapian为了利用omega库,我转向了这个解决方案,但仍然发现了一些问题

1-xapian是否可以与阿拉伯语环境一起使用,或者它也需要一个阿拉伯语分析器,如果需要,我将如何解决这个问题

事实上,对于阿拉伯语内容和几乎大量的数据,我无法决定采用哪种解决方案

非常感谢您的任何帮助或建议

谢谢


Samer

如果你想使用nLucene,你必须创建阿拉伯语分析器,但我使用的是阿拉伯语,它可以很好地与阿拉伯语配合使用。选中

Solr是否可以执行以下3个步骤:提取文本,然后索引,然后搜索?