Indexing 我们如何创建自定义solr索引和自定义lucen索引以在alfresco中搜索文档?

Indexing 我们如何创建自定义solr索引和自定义lucen索引以在alfresco中搜索文档?,indexing,solr,lucene,alfresco,alfresco-share,Indexing,Solr,Lucene,Alfresco,Alfresco Share,实际上,我参加了一些关于alfresco的采访,但我经常会遇到这样一个问题:如何创建自定义索引以及如何重新索引文档 我在谷歌上搜索了一下,但没有找到任何有用的答案,或者我仍然无法理解它到底是什么以及如何做 任何人都可以帮助我理解这一点,我们必须为自定义索引进行必要的配置吗 提前感谢1/我们承认您创建了自己的模型,并希望选择如何自定义字段索引 我的解释将基于本页,尤其是本部分: 数据字典选项 可以在内容中设置每个属性的索引行为 模型默认情况下,它们是原子索引的。属性值为 不存储在索引中,并且当属性

实际上,我参加了一些关于alfresco的采访,但我经常会遇到这样一个问题:如何创建自定义索引以及如何重新索引文档

我在谷歌上搜索了一下,但没有找到任何有用的答案,或者我仍然无法理解它到底是什么以及如何做

任何人都可以帮助我理解这一点,我们必须为自定义索引进行必要的配置吗


提前感谢

1/我们承认您创建了自己的模型,并希望选择如何自定义字段索引

我的解释将基于本页,尤其是本部分:

数据字典选项

可以在内容中设置每个属性的索引行为 模型默认情况下,它们是原子索引的。属性值为 不存储在索引中,并且当属性 索引。下面的示例显示了如何控制索引

Enabled=“false” 如果为false,则索引中将没有此属性的条目

原子=“真” 如果为true,则在事务中为属性编制索引,否则在后台为属性编制索引

facetable=“true” 如果为true,则该属性将用于镶嵌面,如果为false,则不能将其用于镶嵌面

标记化=“真” 如果为“true”,则在索引之前对属性的字符串值进行标记。 如果为“false”,则将其作为单个字符串按“原样”索引。 如果为“两者”,则索引中包含两种指定形式

基本上,如果启用了,则表示该字段可以搜索

如果标记化为true,则意味着(简而言之)如果只查看部分字段,将返回正在索引的字段:

如果出现以下情况,将返回值为“Blue cat”的字段

  • 它被标记化,并查询单词“cat”或“blue”
  • 它没有标记,将询问确切的句子“Blue cat”。 通常,文档内容是标记化的,这就是为什么您不能通过文档内容找到文档,而只能通过几个单词
2/我们承认您想更改数据类型分析器:

对于每种数据类型,选择一个分析仪来处理相应的字段。您可以在此处查看配置文件:

在默认配置文件(dataTypeAnalyzers.properties)中,您可以看到(例如)文本字段由AlfreStatandAnalyzer处理。 现在,由于我使用法语区域设置配置了Alfresco,因此我的Alfresco将使用dataTypeAnalyzers_fr.properties文件覆盖此行为,因此文本字段将由FrenchAnalyzer处理。 这个分析器更适合我,因为它处理了一些法国的特殊情况。如果需要,您可以使用雪球式分析仪覆盖此分析仪(具有不同的行为)

3/我们承认您有技术需求,您想定制您的Solr配置

我的解释仍将基于本页:

Solr 4索引属性

solr.host=localhost Solr实例所在的主机名

解决方案端口=8080 Solr实例正在其上运行的端口号

solr.port.ssl=8443 正在运行Solr SSL支持的端口号

solr.solrUser=solr Solr用户名

solr.solrPassword=solr Solr密码

solr.secureComms=https HTTPS连接

solr.SolrConnectionTimeout=5000 Solr连接超时(毫秒)

solr.solrPingCronExpression=0 0/5**** cron表达式定义Solr Admin客户端(由JMX使用)在Solr 4离开时ping它的频率

如果需要,可以更改一些Solr参数。我不会再进一步了,因为我觉得这不是你想要的

4/对于reindex部分,我将不太具体,因为Gagravarr已经向您提供了文档链接: 请记住索引是可重新计算的,所以您可以通过删除索引文件夹来开始重新索引


最后我要说的是,我只讨论了索引主题的一小部分。由于这是一个巨大的领域,我们真的需要您指定您的需求,以便为您提供正确的答案。

我不确定您所说的前者是什么意思-通常您让Alfresco为您处理定制数据类型的所有SOLR内容!对于后者,如果发生了什么?是的,自定义索引是什么意思?索引特定字段、全文索引、数据类型分析器?@akah可能是我用错误的方式回答了这些问题。。你能给我解释一下你提到的这些术语吗??为特定字段编制索引、全文索引和数据类型分析器……让我再次编辑我的问题,以便您能够以适当的方式回答……@Akah请您探究您在上述评论中所说的术语。这对我真的很有帮助。。。。。。。。。。。。