Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/cplusplus/138.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C++ C/C+中的文本索引库+;_C++_Indexing_Information Retrieval - Fatal编程技术网

C++ C/C+中的文本索引库+;

C++ C/C+中的文本索引库+;,c++,indexing,information-retrieval,C++,Indexing,Information Retrieval,我正在开发一个Windows桌面产品,它需要C/C++中的文本索引库。我想给它一系列的单词和一个需要根据这些单词存储的记录。搜索这些单词应该可以快速返回一条或多条记录。数据将存储在磁盘上 我搜索了这个论坛,找到了Lucene。但它基本上是Java。还有CulcEnC++端口也有。但我不确定它是否适合(重量轻?)一个小型Windows桌面产品 我找到了其他.NET的库,但不是轻量级的,C++的。 你能帮忙吗?你考虑过了吗?RDBMS可能有点重,但我相信它在一些web浏览器中用于实现HTML5“本地

我正在开发一个Windows桌面产品,它需要C/C++中的文本索引库。我想给它一系列的单词和一个需要根据这些单词存储的记录。搜索这些单词应该可以快速返回一条或多条记录。数据将存储在磁盘上

我搜索了这个论坛,找到了Lucene。但它基本上是Java。还有CulcEnC++端口也有。但我不确定它是否适合(重量轻?)一个小型Windows桌面产品

我找到了其他.NET的库,但不是轻量级的,C++的。


你能帮忙吗?

你考虑过了吗?RDBMS可能有点重,但我相信它在一些web浏览器中用于实现HTML5“本地数据库”。

我认为,您需要的是trie。你可以继续学习。那里有一些指向
C++
实现的链接。有多少个单词?记录?单词集是动态的吗?您是否会添加或删除任何新词?是否需要对新词进行部分匹配?如果我搜索“帽子”,“聊天”会回来吗?@Tom Kerr:这是一个文件搜索工具。这些记录将与普通计算机上的文件一样多。唯一的单词将少于记录,因为新单词将被添加和删除,现在我们允许单词匹配。如果搜索空间不大,或者他们不需要进行部分匹配,这肯定会起作用。