Hive SELECT查询是否像RDBMS中那样以随机顺序返回数据?

Hive SELECT查询是否像RDBMS中那样以随机顺序返回数据?,hive,Hive,我在配置单元中使用文本文件加载了一个表。如果我从表中选择*, 我将获得数据的顺序,因为它存储在文件中,或者它可能是随机的。我不使用任何订单 它是否与RDBMS中相同,在RDBMS中,如果我们需要所需格式的输出,则必须使用ORDERBY 谢谢你试过这个吗?它以所需的顺序存储的可能性有多大?在没有过滤器的简单SELECT*情况下,如果您有一个小于1个HDFS块的文本文件,那么Hive将按顺序读取它。RDBMS也一样,只是大小限制要小得多,例如SQL Server的8KB页面。但是,只要你能以不同的顺

我在配置单元中使用文本文件加载了一个表。如果我从表中选择*, 我将获得数据的顺序,因为它存储在文件中,或者它可能是随机的。我不使用任何订单

它是否与RDBMS中相同,在RDBMS中,如果我们需要所需格式的输出,则必须使用ORDERBY


谢谢

你试过这个吗?它以所需的顺序存储的可能性有多大?在没有过滤器的简单SELECT*情况下,如果您有一个小于1个HDFS块的文本文件,那么Hive将按顺序读取它。RDBMS也一样,只是大小限制要小得多,例如SQL Server的8KB页面。但是,只要你能以不同的顺序读取块/页,或者使用不同的路径(例如通过索引),或者必须等待锁被释放,那么它就不再是确定性的了。@SamsonScharfrichter这可能是一个答案。