Apache Solr字符串字段还是文本字段?

Apache Solr字符串字段还是文本字段?,solr,Solr,在ApacheSolr中,如果字符串字段和文本字段都能解决问题,为什么我们总是需要选择字符串字段而不是文本字段 字符串或文本如何影响索引大小、索引读取和索引创建等参数 solr模式中定义的默认字段有很大不同 String将单词/句子存储为精确的字符串,而不执行标记化等。通常用于存储精确匹配,例如,用于刻面 Text通常执行标记化和二次处理(如小写等)。当我们想匹配句子的一部分时,这对所有场景都很有用 如果以下示例“”这是一个示例句子“”被索引到这两个字段,我们必须准确搜索文本这是一个示例句子,以

在ApacheSolr中,如果字符串字段和文本字段都能解决问题,为什么我们总是需要选择字符串字段而不是文本字段


字符串或文本如何影响索引大小、索引读取和索引创建等参数

solr模式中定义的默认字段有很大不同

String
将单词/句子存储为精确的字符串,而不执行标记化等。通常用于存储精确匹配,例如,用于刻面

Text
通常执行标记化和二次处理(如小写等)。当我们想匹配句子的一部分时,这对所有场景都很有用


如果以下示例“
”这是一个示例句子“
”被索引到这两个字段,我们必须准确搜索文本
这是一个示例句子
,以从
字符串
字段中获得点击,而搜索
示例
(甚至是启用词干的
示例
)就足够了从
文本
字段中点击

给约翰·斯约伯格一个好答案:


您可以对
字符串
进行排序,但不能对
文本
进行排序

您还可以对索引大小、索引读取、索引创建进行评论吗?标记化时,索引大小会变大,大小取决于您的处理链。索引创建也会稍微慢一些,因为有更多的工作要做。无论是哪种方式,读取/创建索引都会很好,所以不要担心它,除非接近数百万个文档。我正在阅读数百万个文档。希望这不是问题。所以我选择字符串字段,因为它在所有情况下都很有效,并且我不需要标记器/全文search@JohanSjöberg正如你所解释的,我理解字符串和文本之间的区别,但是,如果我需要获得
*tence
的点击率,该怎么办呢。如果字段类型选择正确怎么办?