Hadoop 如何通过nutch查看存储在hbase中的hbase数据

Hadoop 如何通过nutch查看存储在hbase中的hbase数据,hadoop,hbase,hdfs,nutch,Hadoop,Hbase,Hdfs,Nutch,我使用ApacheNutch在使用hdfs作为文件系统的hbase中存储数据。我想知道它存储在hbase中的哪些文档等。如何从hbase中读取数据,例如某些pdf存储在hbase中。我想读它。我将如何做 请指导我?网页和文档以行的形式存储。若你们知道你们的文档链接,你们可以在hbase外壳或其他工具(HivePig等)上得到它。Nutch将URL存储为反向URL 例如,“变成”com.foo.bar:8983:http/to/index.html?a=b“ 有关Hbase外壳的信息是否有一些工具

我使用ApacheNutch在使用hdfs作为文件系统的hbase中存储数据。我想知道它存储在hbase中的哪些文档等。如何从hbase中读取数据,例如某些pdf存储在hbase中。我想读它。我将如何做


请指导我?

网页和文档以行的形式存储。若你们知道你们的文档链接,你们可以在hbase外壳或其他工具(HivePig等)上得到它。Nutch将URL存储为反向URL

例如,“变成”com.foo.bar:8983:http/to/index.html?a=b“


有关Hbase外壳的信息

是否有一些工具可以在Web服务器上查看Hbase数据,例如Apache?您可以使用HUE()或HBASEExplorer()