Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/333.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 什么是最好的全文搜索开源项目(.NET首选)?_C#_Lucene_Full Text Search - Fatal编程技术网

C# 什么是最好的全文搜索开源项目(.NET首选)?

C# 什么是最好的全文搜索开源项目(.NET首选)?,c#,lucene,full-text-search,C#,Lucene,Full Text Search,我用Lucene库开发了一个索引和搜索应用程序。但是这个库在我的上下文中的自定义排名中有一些限制,除了它的性能之外,我还需要可伸缩性和对各种词频的访问等等。有没有强大的开源全文库可用 斯芬克斯的主要特征是: 高索引和搜索性能; 先进的索引和查询工具,具有灵活的富文本标记器、查询语言、多种不同的排名模式等特点; 高级结果集后处理在文本搜索结果上使用表达式、WHERE、ORDER BY、GROUP BY等进行选择; 经验证的可扩展性高达每秒数十亿文档、TB数据和数千次查询; 易于与SQL和XML数据

我用Lucene库开发了一个索引和搜索应用程序。但是这个库在我的上下文中的自定义排名中有一些限制,除了它的性能之外,我还需要可伸缩性和对各种词频的访问等等。有没有强大的开源全文库可用

斯芬克斯的主要特征是:

高索引和搜索性能; 先进的索引和查询工具,具有灵活的富文本标记器、查询语言、多种不同的排名模式等特点; 高级结果集后处理在文本搜索结果上使用表达式、WHERE、ORDER BY、GROUP BY等进行选择; 经验证的可扩展性高达每秒数十亿文档、TB数据和数千次查询; 易于与SQL和XML数据源以及SphinxAPI、SphinxQL或SphinxSE搜索接口集成; 使用分布式搜索轻松扩展。 要展开一点,Sphinx:

在内部基准上,每个核心的索引速度高达10-15 MB/秒; 针对1000000个文档和1.2GB的内部基准数据,每个核心的搜索速度高达150-250次查询/秒; 具有高可扩展性最大的已知群集索引超过3000000000个文档,最繁忙的群集索引峰值超过50000000个查询/天; 通过短语接近度排名和统计BM25排名相结合,提供良好的相关性排名; 提供分布式搜索功能; 提供文档摘录和代码段生成; 使用SphinxAPI或SphinxQL接口从应用程序内部进行搜索,并使用可插入SphinxSE存储引擎从MySQL内部进行搜索; 支持布尔、短语、单词接近度和其他类型的查询; 默认情况下,支持每个文档最多32个全文字段; 支持每个文档的多个附加属性,即组、时间戳等; 支持停止字; 支持词法词典; 支持标记化异常; 支持单字节编码和UTF-8; 内置支持英语、俄语和捷克语词干分析器;法语、西班牙语、葡萄牙语、意大利语、罗马尼亚语、德语、荷兰语、瑞典语、挪威语、丹麦语、芬兰语、匈牙利语的词干分析器可通过构建第三方libstemer库获得; 本机支持MySQL,支持所有类型的表,包括MyISAM、InnoDB、NDB、Archive等; 本机支持PostgreSQL; 本机支持ODBC兼容数据库MS SQL、Oracle等; …具有此处未列出的50多个其他功能,请参阅API和配置手册!
我发现Lucene.net的性能令人难以置信,所以听到有人说他们的性能有问题,真是令人惊讶!顺便说一句,Lucene有一个非常好的API用于自定义评分等,我对Lucene的性能没有任何问题,但是自定义排名非常困难。