hadoop-从非常大的序列文件中获取数据的最佳方法是什么?
我在hdfs中有一个非常大的hadoop序列文件。 从中获取数据的最佳方法是什么?例如,选择记录等 可以用蜂箱做吗? 如何从序列文件在配置单元中创建表hadoop-从非常大的序列文件中获取数据的最佳方法是什么?,hadoop,hive,bigdata,Hadoop,Hive,Bigdata,我在hdfs中有一个非常大的hadoop序列文件。 从中获取数据的最佳方法是什么?例如,选择记录等 可以用蜂箱做吗? 如何从序列文件在配置单元中创建表 谢谢< P>如果你需要“快速”访问数据,你应该考虑将数据加载到某种数据存储(DB或NoSQL存储,如HBase,SeCo)。 另一个选择(如果您可以重新写入数据)是研究使用-这将为序列文件中的键创建索引,并提供比完整文件扫描更快的数据访问 否则,如果您想使用Hive,Hive邮件列表上会有一条关于此主题的线索: 您查看过外部表格吗?我关注的不
谢谢
< P>如果你需要“快速”访问数据,你应该考虑将数据加载到某种数据存储(DB或NoSQL存储,如HBase,SeCo)。 另一个选择(如果您可以重新写入数据)是研究使用-这将为序列文件中的键创建索引,并提供比完整文件扫描更快的数据访问 否则,如果您想使用Hive,Hive邮件列表上会有一条关于此主题的线索:HFileOutputFormat
,然后进行批量加载。