solr从多个数据源实体导入文件
我正在尝试从多个文件夹导入文件 Mysolr从多个数据源实体导入文件,solr,data-import,Solr,Data Import,我正在尝试从多个文件夹导入文件 Mysolrconfig.xml调用以下文件将其与org.apache.solr.handler.dataimport.DataImportHandler一起使用 <dataConfig> <dataSource type="BinFileDataSource" /> <document> <entity name="files1"
solrconfig.xml
调用以下文件将其与org.apache.solr.handler.dataimport.DataImportHandler
一起使用
<dataConfig>
<dataSource type="BinFileDataSource" />
<document>
<entity name="files1"
dataSource="null"
rootEntity="false"
processor="FileListEntityProcessor"
baseDir="/w/PDF/"
fileName=".*\.(pdf)|(doc)|(docx)|(ppt)|(pptx)|(xls)|(xlsx)|(odf)|(txt)|(rtf)|(html)|(htm)|(jpg)"
onError="skip"
recursive="true">
<field column="fileAbsolutePath" name="id" />
<field column="fileSize" name="size" />
<field column="fileLastModified" name="lastModified" />
<field column="file" name="fileName"/>
<entity
name="documentImport1"
processor="TikaEntityProcessor"
url="${files.fileAbsolutePath}"
format="text">
<field column="file" name="fileName"/>
<field column="Author" name="author" meta="true"/>
<field column="title" name="title" meta="true"/>
<field column="text" name="text"/>
<copyField source="content" dest="text"/>
</entity>
</entity>
<entity name="files2"
dataSource="null"
rootEntity="false"
processor="FileListEntityProcessor"
baseDir="/w/KNOW-HOW/"
fileName=".*\.(pdf)|(doc)|(docx)|(ppt)|(pptx)|(xls)|(xlsx)|(odf)|(txt)|(rtf)|(html)|(htm)|(jpg)"
onError="skip"
recursive="true">
<field column="fileAbsolutePath" name="id" />
<field column="fileSize" name="size" />
<field column="fileLastModified" name="lastModified" />
<field column="file" name="fileName"/>
<entity
name="documentImport2"
processor="TikaEntityProcessor"
url="${files.fileAbsolutePath}"
format="text">
<field column="file" name="fileName"/>
<field column="Author" name="author" meta="true"/>
<field column="title" name="title" meta="true"/>
<field column="text" name="text"/>
<copyField source="content" dest="text"/>
</entity>
</entity>
</document>
</dataConfig>
在导入过程中,我得到一个FileNotFoundException
我缺少什么?只需将第二个实体中的代码更改为:
${files.fileAbsolutePath}
到${files2.fileAbsolutePath}