Hive 配置单元中的行号()问题

Hive 配置单元中的行号()问题,hive,indexoutofboundsexception,row-number,Hive,Indexoutofboundsexception,Row Number,我正在尝试在配置单元(版本0.13)中使用ROW_NUMBER()函数。我是按一个唯一的数字进行分区的,但排序是基于交易金额和客户名称进行的 虽然这段代码适用于最多4k行的非唯一条件(其中unique key和ordering key相同),但在某些情况下,我得到的是具有相同非唯一条件的162k行。我得到一个ArrayIndexOutofBound异常。虽然我可以过滤掉所有这些情况,但由于所有这些数字都是具有空字符串值的名称,这并不能解决业务规则实现的目的 我如何在代码中处理这个问题,而不是过滤

我正在尝试在配置单元(版本0.13)中使用ROW_NUMBER()函数。我是按一个唯一的数字进行分区的,但排序是基于交易金额和客户名称进行的

虽然这段代码适用于最多4k行的非唯一条件(其中unique key和ordering key相同),但在某些情况下,我得到的是具有相同非唯一条件的162k行。我得到一个ArrayIndexOutofBound异常。虽然我可以过滤掉所有这些情况,但由于所有这些数字都是具有空字符串值的名称,这并不能解决业务规则实现的目的

我如何在代码中处理这个问题,而不是过滤掉

这是我正在使用的一段代码:

    ROW_NUMBER() OVER (PARTITION BY CASE_NUMBER ORDER BY CREDIT_AMT DESC, NAME ASC) AS CREDIT_PARTY_NO
    ROW_NUMBER() OVER (PARTITION BY CASE_NUMBER ORDER BY DEBIT_AMT DESC,  NAME ASC) AS DEBIT_PARTY_NO
快速搜索我生成的计数:

COUNT : 162344  CREDIT_AMT : 0  DEBIT_AMT : 2070596 NAME : BLANK    case_number:12345*************

您应该使用您正在使用的查询和您正在获得的结果的示例(可能还有用于生成这些结果的数据)编辑您的问题
ROW_NUMBER()
没有任何被描述为“条件”的参数,因此不清楚您试图解释什么。只是添加了代码和所传递条件的计数。是因为数量太多吗?你的问题根本没有意义。如果按唯一的数字进行分区,则
row\u number()
将始终返回1。