Hadoop 特定hbase区域服务器中的数据插入

Hadoop 特定hbase区域服务器中的数据插入,hadoop,hbase,Hadoop,Hbase,我想在特定的datanode\regionserver中插入数据 为此需要进行哪些配置更改 假设有4个数据节点A、B、C、D主机名。4个线程正在运行。一个线程仅在datanode A和B上插入记录。另一个线程在datanode C中插入\访问记录。第四个线程在C和D中插入记录 对于这种类型的插入,我可以做什么配置?哪个hbase\hadoop API将用于编程插入\访问 还有一件事,我们可以指定客户端java应用程序和hbase db及hadoop集群中使用的相同字符格式(UTF8)吗 问候,,

我想在特定的datanode\regionserver中插入数据

为此需要进行哪些配置更改

假设有4个数据节点A、B、C、D主机名。4个线程正在运行。一个线程仅在datanode A和B上插入记录。另一个线程在datanode C中插入\访问记录。第四个线程在C和D中插入记录

对于这种类型的插入,我可以做什么配置?哪个hbase\hadoop API将用于编程插入\访问

还有一件事,我们可以指定客户端java应用程序和hbase db及hadoop集群中使用的相同字符格式(UTF8)吗

问候,,
rashmi

使用hbase,您无法真正针对特定的数据节点或区域服务器。我想您可以针对一个特定的区域,如果您确保每个regionserver只有一个区域,那么它与您要查找的区域非常接近。我可以说这不是hbase的典型使用模式,所以我会确保这是您真正想要的

要管理区域,您需要通过将hbase.hregion.max.filesize设置为100GB并手动预拆分表来禁用拆分。可以使用HBaseAdmin类预拆分表

就字符格式而言,hbase没有数据类型或字符集—所有内容都存储为字节—因此使用utf8应该没有问题

如果您使用java,则可以使用。对于其他语言,您可以选择Thrift、Avro和REST接口,尽管它们都不如使用JavaAPI快