使用solr line实体处理器读取文件内容时获取异常
我需要在使用Solr数据导入处理程序的文件内容中进行搜索。响应应显示搜索词出现的内容行。所以对于逐行处理,我使用的是行实体处理器。我的数据配置文件是使用solr line实体处理器读取文件内容时获取异常,solr,Solr,我需要在使用Solr数据导入处理程序的文件内容中进行搜索。响应应显示搜索词出现的内容行。所以对于逐行处理,我使用的是行实体处理器。我的数据配置文件是 <dataConfig> <dataSource type="BinFileDataSource" name = "fds"/> <document> <entity name="filelist" processor="FileListEntityProcessor" fileName="sample.d
<dataConfig>
<dataSource type="BinFileDataSource" name = "fds"/>
<document>
<entity name="filelist" processor="FileListEntityProcessor" fileName="sample.docx"
rootEntity="false" baseDir="C:\SampleDocuments" >
<entity name="fileline" processor="LineEntityProcessor"
url="${filelist.fileAbsolutePath}" format="text">
<field column="linecontent" name="rawLine"/>
</entity>
</entity>
</document>
schema.xml具有条目或原始行
<field name="rawLine" type="text" indexed="true" stored="true"/>
但是当我运行命令进行完全导入时,它会抛出一个异常
DataImportHandlerException:java.lang.ClassCastException:java.io.FileInputStream无法强制转换为java.io.Reader
请帮我解决这个问题,因为我已经花了几天时间解决这个问题。在使用InputStream时工作。您可以尝试使用FileDataSource来检查强制转换问题
<dataSource type="FileDataSource" name = "fds"/>
谢谢Jayendra。当我进行上述更改时,我可以完全导入。但是,即使文档中只有3行,它创建了大约52个文档,即使我正在搜索文档中已经存在的内容,响应id仍然为0。请在这方面帮助我,因为我无法在联机实体处理器上找到太多信息。