Java 如何将html提交到Solr而不是通过http

Java 如何将html提交到Solr而不是通过http,java,solr,indexing,Java,Solr,Indexing,我使用Solr4.6进行索引,现在我有大量存储的html文件。 我试图通过http或curl将这些文件添加到SOLR中,但这需要很多时间 有人知道如何将用于索引的文件直接提交给SOLR吗?我在运行SOLR的服务器上有这些文件。您可以使用来索引所有文件。如果您希望清理内容,还可以使用HTMLStripTransformer,虽然Okke Klein提供的答案很好,但它非常复杂 对于通过http提交文件的问题,我找到了最简单的解决方案,但是选择了stream.file=local\u file\u

我使用Solr4.6进行索引,现在我有大量存储的html文件。 我试图通过http或curl将这些文件添加到SOLR中,但这需要很多时间


有人知道如何将用于索引的文件直接提交给SOLR吗?我在运行SOLR的服务器上有这些文件。

您可以使用来索引所有文件。如果您希望清理内容,还可以使用HTMLStripTransformer,

虽然Okke Klein提供的答案很好,但它非常复杂

对于通过http提交文件的问题,我找到了最简单的解决方案,但是选择了stream.file=local\u file\u path

例如:-

curl http://localhost:8080/solr/update/extract?stream.file="+file.getPath()+"&literal.id="+id+"&commit=true

这是更复杂的实现我发现简单的方法解释如下