SOLR Tika:将文件文本添加到现有记录(ExtractingRequestHandler)
我在SOLR中用“名称”、“标题”和“描述”字段为帖子编制索引。我希望以后能够使用Tika/ExtractingRequestHandler添加文件(如Word文档或PDF) 我知道我可以像这样添加文档:(或通过其他接口) 卷曲 “post1&commit=true” -F“myfile=@tutorial.html” 但这将替换正确的post(上面的post1)——是否有一个参数可以传递,以便只将其添加到记录中 在Solr(版本<4.0)中,您不能修改文档中的字段。您只能删除或添加/替换整个文档。因此,在将文件“附加”到Solr文档时,您必须根据其当前值(使用SOLR Tika:将文件文本添加到现有记录(ExtractingRequestHandler),solr,full-text-search,apache-tika,solr-cell,Solr,Full Text Search,Apache Tika,Solr Cell,我在SOLR中用“名称”、“标题”和“描述”字段为帖子编制索引。我希望以后能够使用Tika/ExtractingRequestHandler添加文件(如Word文档或PDF) 我知道我可以像这样添加文档:(或通过其他接口) 卷曲 “post1&commit=true” -F“myfile=@tutorial.html” 但这将替换正确的post(上面的post1)——是否有一个参数可以传递,以便只将其添加到记录中 在Solr(版本
literal
)重建文档,即查询文档,然后:
http://localhost:8983/solr/update/extract?literal.id=post1&literal.name=myName&literal.title=myTitle&literal.description=myDescription&commit=true
在Solr(版本<4.0)中,不能修改文档中的字段。您只能删除或添加/替换整个文档。因此,在将文件“附加”到Solr文档时,您必须根据其当前值(使用literal
)重建文档,即查询文档,然后:
http://localhost:8983/solr/update/extract?literal.id=post1&literal.name=myName&literal.title=myTitle&literal.description=myDescription&commit=true
这个curl请求可能太长(可能有许多字段值需要和文件内容一起追加)。有没有办法获取文件的内容,然后将其添加到solr文档中,然后提交整个文档?@ptokya这是一个关于
curl
而不是solr的问题。您应该为此创建一个新的特定问题。@Mauricoscheffer:这是我完整的特定问题:此curl请求可能太长(可能有许多字段值需要与文件内容一起附加)。有没有办法获取文件的内容,然后将其添加到solr文档中,然后提交整个文档?@ptokya这是一个关于curl
而不是solr的问题。你应该提出一个新的、具体的问题。@MauricioScheffer:这是我的全部具体问题: