基于HDFS的Marklogic查询

基于HDFS的Marklogic查询,marklogic,Marklogic,是否可以在不将数据导入Marklogic server数据库的情况下从Marklogic server搜索和查询hdfs上的数据??我已经能够将数据导入Marklogic server数据库。但无法找到有关如何在不导入的情况下查询数据的任何详细信息。如果有方法,请提供有关如何执行此操作的帮助???我不确定您所说的“查询”是什么意思。要以任何有意义的方式查询数据,数据需要位于数据库中。但HDFS不是一个数据库 如果希望在HDFS上保留林,可以这样做:请参阅 如果希望将HDFS视为本地文件系统,那么

是否可以在不将数据导入Marklogic server数据库的情况下从Marklogic server搜索和查询hdfs上的数据??我已经能够将数据导入Marklogic server数据库。但无法找到有关如何在不导入的情况下查询数据的任何详细信息。如果有方法,请提供有关如何执行此操作的帮助???

我不确定您所说的“查询”是什么意思。要以任何有意义的方式查询数据,数据需要位于数据库中。但HDFS不是一个数据库

如果希望在HDFS上保留林,可以这样做:请参阅

如果希望将HDFS视为本地文件系统,那么像
xdmp:filesystem directory
xdmp:filesystem get
这样的内置函数似乎可以接受
HDFS://
URL。请注意,您需要将MarkLogic配置为HDFS客户端,如中所述。否则,以这种方式访问HDFS的任何尝试都将抛出
SVC-HDFSNOT


或者,如果您可以在HDFS上设置或构建HTTP REST ish接口,则可以使用
xdmp:HTTP get
和相关函数。

可以从Marklogic使用连接器,但您需要使用密钥、值对构建序列文件