Hadoop HBase截断表

Hadoop HBase截断表,hadoop,hbase,hdfs,Hadoop,Hbase,Hdfs,如果我将从HBase截断表,那么 1) 它是否也从底层HDFS系统中删除数据,还是只使用删除标记标记数据? 2) 如何确保/验证数据也已从底层HDFS系统中删除?目前无法确保从底层文件系统中完全删除HBase表数据。HBase表的文件可能会从HDFS中删除,但这仍然意味着它们会被移动到垃圾箱文件夹。HBase逻辑删除表中的数据,因此扫描/获取行不会返回它们,也无法读取它们。 在表上运行主压缩时,所有删除的数据都将从Hbase和HDFS(本机文件系统)中删除,并释放磁盘空间 “从底层HDFS中删除

如果我将从HBase截断表,那么 1) 它是否也从底层HDFS系统中删除数据,还是只使用删除标记标记数据?
2) 如何确保/验证数据也已从底层HDFS系统中删除?

目前无法确保从底层文件系统中完全删除HBase表数据。HBase表的文件可能会从HDFS中删除,但这仍然意味着它们会被移动到垃圾箱文件夹。

HBase逻辑删除表中的数据,因此扫描/获取行不会返回它们,也无法读取它们。
在表上运行主压缩时,所有删除的数据都将从Hbase和HDFS(本机文件系统)中删除,并释放磁盘空间

“从底层HDFS中删除”是指从磁盘中删除吗?或者只是从NameNode中的HDFS文件表中删除?很抱歉,我只是想确保回答正确-从磁盘删除是指从本机文件系统中删除还是用零覆盖?也就是说,您正试图缓解什么样的安全威胁—对驱动器具有读取权限的人读取数据,或者有人带着驱动器离开,然后在空闲时读取数据?我的意思是,数据应该从磁盘中删除,因此也应该从本机文件系统中删除。在这里,我想确保没有人可以再次读取/复制数据。当表被截断时,逻辑删除不适用。截断是表的删除/重新创建,这意味着为表创建新的HDFS文件。哦,对了,我忽略了截断部分,我的答案是行删除,谢谢更正。