基于HDFS的Marklogic查询
是否可以在不将数据导入Marklogic server数据库的情况下从Marklogic server搜索和查询hdfs上的数据??我已经能够将数据导入Marklogic server数据库。但无法找到有关如何在不导入的情况下查询数据的任何详细信息。如果有方法,请提供有关如何执行此操作的帮助???我不确定您所说的“查询”是什么意思。要以任何有意义的方式查询数据,数据需要位于数据库中。但HDFS不是一个数据库 如果希望在HDFS上保留林,可以这样做:请参阅 如果希望将HDFS视为本地文件系统,那么像基于HDFS的Marklogic查询,marklogic,Marklogic,是否可以在不将数据导入Marklogic server数据库的情况下从Marklogic server搜索和查询hdfs上的数据??我已经能够将数据导入Marklogic server数据库。但无法找到有关如何在不导入的情况下查询数据的任何详细信息。如果有方法,请提供有关如何执行此操作的帮助???我不确定您所说的“查询”是什么意思。要以任何有意义的方式查询数据,数据需要位于数据库中。但HDFS不是一个数据库 如果希望在HDFS上保留林,可以这样做:请参阅 如果希望将HDFS视为本地文件系统,那么
xdmp:filesystem directory
和xdmp:filesystem get
这样的内置函数似乎可以接受HDFS://
URL。请注意,您需要将MarkLogic配置为HDFS客户端,如中所述。否则,以这种方式访问HDFS的任何尝试都将抛出SVC-HDFSNOT
或者,如果您可以在HDFS上设置或构建HTTP REST ish接口,则可以使用
xdmp:HTTP get
和相关函数。可以从Marklogic使用连接器,但您需要使用密钥、值对构建序列文件