Indexing 为HDFS序列文件编制索引

Indexing 为HDFS序列文件编制索引,indexing,hadoop,sequence,hdfs,Indexing,Hadoop,Sequence,Hdfs,索引一个非常大的序列文件(数百万个键/值对,其中每个值可以具有不同的长度,因此您不能使用随机访问方案)的最佳库/方法是什么?您是否考虑过将数据存储在HBase中?它是为这种事情而建的

索引一个非常大的序列文件(数百万个键/值对,其中每个值可以具有不同的长度,因此您不能使用随机访问方案)的最佳库/方法是什么?

您是否考虑过将数据存储在HBase中?它是为这种事情而建的