Hadoop HBase写入:哪一个在性能、批处理或put(列表<;put>;)方面更好?

Hadoop HBase写入:哪一个在性能、批处理或put(列表<;put>;)方面更好?,hadoop,hbase,batch-processing,Hadoop,Hbase,Batch Processing,我开始学习HBase来编写数据流。我使用HTableInterface,但性能有问题。只插入500行花了很多时间,我插入的每个批次列表大约500000毫秒 是否有使用HTableInterface批量写入HTable的示例或建议? 我使用的是HBase 0.94 感谢它们本质上是一样的:batch(列出scala中的任何示例?我在翻译Java示例时遇到了问题。您更喜欢哪一个,batch还是put?从未使用过scala,但请看一看。因为将put与其他类型的操作混合使用并不常见,所以我倾向于使用pu

我开始学习HBase来编写数据流。我使用HTableInterface,但性能有问题。只插入500行花了很多时间,我插入的每个批次列表大约500000毫秒

是否有使用HTableInterface批量写入HTable的示例或建议? 我使用的是HBase 0.94


感谢它们本质上是一样的:
batch(列出scala中的任何示例?我在翻译Java示例时遇到了问题。您更喜欢哪一个,batch还是put?从未使用过scala,但请看一看。因为将put与其他类型的操作混合使用并不常见,所以我倾向于使用
put(列出put)
用于批处理put,但我敢打赌它们之间的性能没有差异。您的问题一定与其他任何问题有关:配置、网络……无论如何,请注意,独立和伪分布式版本的性能将比使用适当的Hadoop+HBase群集的性能差得多。好的,谢谢,我很想尝试put(列表).对于网络配置或区域服务器/zookeeper问题,您是否有任何阅读或学习的建议?