Morphlines命令extractHBaseCells不';不支持hbase中的avro对象,是否有解决方法?

Morphlines命令extractHBaseCells不';不支持hbase中的avro对象,是否有解决方法?,hbase,cloudera,avro,solrcloud,morphline,Hbase,Cloudera,Avro,Solrcloud,Morphline,我正在使用CDH4.4。我目前正在运行一个应用程序,它通过avro将记录序列化到hbase中的一列中。我正在将此表的当前solr索引移动到solrcloud中,因此我正在测试MapReduceIndexerTool,以便对整个表进行批量索引。我有一个非常简单的morphlines文件,它当前使用“extractHBaseCells”从HBase读取记录 我设置了一个跟踪程序概念验证,只对rowkey=>id进行索引,并将avro blob填充到另一个字段中,只是为了验证我是否可以将HBase中的

我正在使用CDH4.4。我目前正在运行一个应用程序,它通过avro将记录序列化到hbase中的一列中。我正在将此表的当前solr索引移动到solrcloud中,因此我正在测试MapReduceIndexerTool,以便对整个表进行批量索引。我有一个非常简单的morphlines文件,它当前使用“extractHBaseCells”从HBase读取记录

我设置了一个跟踪程序概念验证,只对rowkey=>id进行索引,并将avro blob填充到另一个字段中,只是为了验证我是否可以将HBase中的数据转移到SolrCloud中的我的集合中,这是有效的。但我想先解析avro,然后将这些值粘贴到solrdocuments上自己的字段中,然后再将它们提交给solrcloud。但“提取细胞”的性质似乎阻止了这一点。如果有一个hbase reader命令发出更一般的输出,然后可以流入morphline中的avro命令,我相信我可以解决我自己的问题


是否有任何已知的用于解析已存储在HBase中的avro的解决方法,或者可能有更多的morphlines命令可以解决此问题?

您是否能够仅读取avro列和extractAvroPaths来解析avro


或者最糟糕的情况是,一个java操作将hbase avro列强制转换为avro对象。

user1842757的链接将我置于正确的路径上。我的问题是我的solr模式。在我的模式中没有定义“\u attachment\u body”字段或“\u attachment\u mimetype”字段。这些是ExtractAvropath工作所必需的,但我发现支持morphlines或hbase mr indexer的任何教程、示例或pdf手册中都没有明确说明这一点