Marklogic 标记逻辑中的汉字处理

Marklogic 标记逻辑中的汉字处理,marklogic,marklogic-8,Marklogic,Marklogic 8,我正在搜索一个包含汉字的文档。启用的索引包括单词搜索、3字符搜索和快速短语搜索。重新编制索引之前,代码会给出正确的结果,但重新编制索引之后,代码不会给出预期的输出 XML: 我希望上述XML出现在结果集中,但在重新索引后,它不在结果集中 对于MarkLogic中“英语”以外的其他语言,索引是否有所不同?请注意以下关于v9中语言的内容: 在我这方面效果不错,但我使用的是9.0-7。如果你还没有运行最新版本的补丁,你能用最新版本的补丁运行测试吗?谢谢你的回复。在9.0-5档也能正常工作。但是我的环

我正在搜索一个包含汉字的文档。启用的索引包括单词搜索、3字符搜索和快速短语搜索。重新编制索引之前,代码会给出正确的结果,但重新编制索引之后,代码不会给出预期的输出

XML:

我希望上述XML出现在结果集中,但在重新索引后,它不在结果集中


对于MarkLogic中“英语”以外的其他语言,索引是否有所不同?

请注意以下关于v9中语言的内容:


在我这方面效果不错,但我使用的是9.0-7。如果你还没有运行最新版本的补丁,你能用最新版本的补丁运行测试吗?谢谢你的回复。在9.0-5档也能正常工作。但是我的环境中的版本是8.0-5。我无法理解两个版本在中文字符语言支持方面的行为差异。看起来在9版本中有很多与语言相关的错误修复。这可能就是原因。您可以尝试升级到ML8的最新补丁版本(当前为8.0-9.1),但可能必须升级到ML9。。
<root>
  <name xml:lang="en">Propylene</name>
  <name xml:lang="zh">丙烯</name>
</root>
cts:search(collection('live'),
  cts:element-query(xs:QName('name'), 
    cts:word-query('丙烯', ("wildcarded", "whitespace-insensitive", "lang=zh"), 1)))