Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/maven/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Solr 从HDFS中搜索并查找文档_Solr_Hdfs_Cloudera - Fatal编程技术网

Solr 从HDFS中搜索并查找文档

Solr 从HDFS中搜索并查找文档,solr,hdfs,cloudera,Solr,Hdfs,Cloudera,我已经使用hadoop fs-put命令将数据(丰富的文档,如pdf、doc和txt)加载到HDFS中。我应该能够搜索并找到文档。我如何才能做到这一点?我不在乎它所保存的数据类型,只在乎文档。在HDFS中搜索任何文件时使用此URL http://localhost:50075/webhdfs/v1/home/HDFSPATH/"+rich_document.pdf+"?op=OPEN") 您希望如何准确地搜索它?通过命令行还是通过脚本?您可以使用shell命令来浏览HDFSI,需要创建应用程

我已经使用hadoop fs-put命令将数据(丰富的文档,如pdf、doc和txt)加载到HDFS中。我应该能够搜索并找到文档。我如何才能做到这一点?我不在乎它所保存的数据类型,只在乎文档。

在HDFS中搜索任何文件时使用此URL

 http://localhost:50075/webhdfs/v1/home/HDFSPATH/"+rich_document.pdf+"?op=OPEN")

您希望如何准确地搜索它?通过命令行还是通过脚本?您可以使用shell命令来浏览HDFSI,需要创建应用程序来搜索它。。。我想如果是命令行,我会尝试让应用程序运行命令。@ko2r我遇到了HDFSFindTool。我试着用它来搜索。它工作正常,但速度足够快,可以处理大量数据。有没有更好的方法将数据上传到HDFS而不是hadoop-put命令?我一直使用CLI进行这些操作,但如果您想自动化上载过程,您可以编写一个bash脚本,为您完成这项工作。@Ko2r好的,什么是CLI,使用HDFSFindTool从HDFS搜索是否有效?请不要撤消对您的帖子的改进。仅代码使用4个空格。请看4个空格!谁知道呢,泰·布拉索菲洛