如何处理OpenSearchServer/Lucene中的特殊字符,如(#)?

如何处理OpenSearchServer/Lucene中的特殊字符,如(#)?,lucene,search-engine,Lucene,Search Engine,我使用的是OpenSearchServer(社区版)v1.2.4-rc3-stable-rev1474-build802。我在C语言和C++编程网站上爬行。现在,当我搜索C或C++时,软件会把一些特殊的字符像是α,+。软件返回的结果并不准确。如何处理OpenSearchServer/Lucene中的特殊字符,如(#)?谁能给我提个建议吗?提前感谢 < P>你需要改变你的索引策略,使用自定义或半定制记录器保留你需要的特殊字符来代表C和C++代码项。您可以在索引和搜索期间使用此标记器 一开始,我会看

我使用的是OpenSearchServer(社区版)v1.2.4-rc3-stable-rev1474-build802。我在C语言和C++编程网站上爬行。现在,当我搜索C或C++时,软件会把一些特殊的字符像是α,+。软件返回的结果并不准确。如何处理OpenSearchServer/Lucene中的特殊字符,如(#)?谁能给我提个建议吗?提前感谢

< P>你需要改变你的索引策略,使用自定义或半定制记录器保留你需要的特殊字符来代表C和C++代码项。您可以在索引和搜索期间使用此标记器


一开始,我会看看org.apache.lucene.analysis.standardorg.apache.lucene.wikipedia.analysis,了解如何构造标记器(可能需要使用JFlex等标记器(词法分析器)生成器,而不是手工编码标记器)

您需要更改索引策略,使用自定义或半定制记录器保留您需要的特殊字符来表示C和C++代码项。您可以在索引和搜索期间使用此标记器

一开始,我会看看org.apache.lucene.analysis.standardorg.apache.lucene.wikipedia.analysis,了解如何构造标记器(可能需要使用JFlex等标记器(词法分析器)生成器,而不是手工编码标记器)