非停止字符的MongoDB全文索引字符（标记化分隔符）_Mongodb_Indexing_Full Text Indexing

非停止字符的MongoDB全文索引字符（标记化分隔符）

mongodb indexing

非停止字符的MongoDB全文索引字符（标记化分隔符）,mongodb,indexing,full-text-indexing,Mongodb,Indexing,Full Text Indexing,假设我希望在文本字段上有一个“文本索引”，如下所示，用于部分搜索和高级搜索： “supertext:“a111=Salvador a111=Salv a111=Salvad a111=Salvad a111=Salvad a113=Hernandez a113=Hern a113=Herna a113=Hernan a113=Hernan a113=Hernand” 等号似乎是解析器的标记化分隔符（停止字符）之一。这是指unicode 8.0字符数据库道具列表中的unicode字符：破折号、连字

假设我希望在文本字段上有一个“文本索引”，如下所示，用于部分搜索和高级搜索：

“supertext:“a111=Salvador a111=Salv a111=Salvad a111=Salvad a111=Salvad a113=Hernandez a113=Hern a113=Herna a113=Hernan a113=Hernan a113=Hernand”

等号似乎是解析器的标记化分隔符（停止字符）之一。这是指unicode 8.0字符数据库道具列表中的unicode字符：破折号、连字符、模式语法、引号、终端标点和空格：

我想知道的恰恰相反。我可以使用哪些非标记化分隔符的特殊字符

我想在文本字段中找到“a111=Salvador”。现在，搜索“a111=Salvador”和“Salvador”返回相同或相似的分数

例如，在存储数据时，我还可以使用什么，例如：

a111#Salvador
a111@Salvador
a111`Salvador

似乎有人有过这样的经验，而不是我花几个小时在Unicode页面上搜索不存在的字符

或者我需要更长的字母字符序列，还是不需要字符

a111valueSalvador
a111Salvador

从当前主分隔符可以看出：

delim_properties = [
    "White_Space", "Dash", "Hyphen", "Quotation_Mark", "Terminal_Punctuation", "Pattern_Syntax",
    "STerm"
]

这让你有很多其他的符号可供选择。尝试中间点，例如：

00B7          ; Other_ID_Continue # Po       MIDDLE DOT
0387          ; Other_ID_Continue # Po       GREEK ANO TELEIA

用U+00B7测试-

a111·Salvador

完成了这项工作，看起来很整洁

用python术语来说：

separator = '\u00B7'
sample = "a111" + separator + "Salvador"
print(sample)

我想试试表情符号。