Hadoop 如何在ORC表中创建行序列号

Hadoop 如何在ORC表中创建行序列号,hadoop,hive,azure-hdinsight,Hadoop,Hive,Azure Hdinsight,我想添加行编号或行序列ID列,这将自动增加行ID值。可以使用Hive UDF UDFRowSequence,但它在单个减速器中运行。我想知道最新的hive 0.14中是否有其他功能可以在oRC中自动增加行序列。您可能希望在覆盖整个集合的窗口中查看row_NUMBER()函数。它依赖于被排序的数据,但因此应该允许并行分区处理 你好,西蒙,你能给我提供第()行的样品吗?我找不到样品。我使用的是Row_序列,但问题是标识值仅从1开始。我希望配置单元列的行为类似于数据库中的标识列

我想添加行编号或行序列ID列,这将自动增加行ID值。可以使用Hive UDF UDFRowSequence,但它在单个减速器中运行。我想知道最新的hive 0.14中是否有其他功能可以在oRC中自动增加行序列。

您可能希望在覆盖整个集合的窗口中查看row_NUMBER()函数。它依赖于被排序的数据,但因此应该允许并行分区处理

你好,西蒙,你能给我提供第()行的样品吗?我找不到样品。我使用的是Row_序列,但问题是标识值仅从1开始。我希望配置单元列的行为类似于数据库中的标识列