在HBase/Hadoop中支持自定义压缩算法

在HBase/Hadoop中支持自定义压缩算法,hadoop,compression,hbase,Hadoop,Compression,Hbase,我正在Hadoop/HBase上进行压缩试验,并想为HBase中的块压缩添加我自己的压缩例程。我发现HBase支持以下开箱即用的压缩类型: create 'mytable', {NAME=>'colfam:', COMPRESSION=>'gz'} 其中“gz”可以替换为“lzo”(liv zempel)、“snappy”或“none” 我的问题是,是否可以编写自己的压缩例程/编解码器,并将其用于上面的列族?比如: create 'mytable', {NAME=>'colf

我正在Hadoop/HBase上进行压缩试验,并想为HBase中的块压缩添加我自己的压缩例程。我发现HBase支持以下开箱即用的压缩类型:

create 'mytable', {NAME=>'colfam:', COMPRESSION=>'gz'}
其中“gz”可以替换为“lzo”(liv zempel)、“snappy”或“none”

我的问题是,是否可以编写自己的压缩例程/编解码器,并将其用于上面的列族?比如:

create 'mytable', {NAME=>'colfam:', COMPRESSION=>'myCompressionRoutine'} 
这样做需要什么

我还注意到一些Java文档中有一条奇怪的注释。在这里可以找到以下评论:

“压缩算法。这些算法的顺序无法更改,否则您可能会破坏所有现有的HFiles。即使是未压缩的文件!(它们使用无算法)”