Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/reporting-services/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache pig Apache Pig连接错误2087“;在多个LocalReaginate运算符中找到索引:0;_Apache Pig - Fatal编程技术网

Apache pig Apache Pig连接错误2087“;在多个LocalReaginate运算符中找到索引:0;

Apache pig Apache Pig连接错误2087“;在多个LocalReaginate运算符中找到索引:0;,apache-pig,Apache Pig,所以我有两个关系: 页面视图按GUID和URL计数pv\u计数 使用相同GUID和url的事件ev\u计数 我试图用joined_counts=按ev_site_guid加入ev_计数,按pv_site_guid加入pv_计数,但我一直收到此错误: 错误2087:优化过程中出现意外问题。在多个LocalReagrance运算符中找到索引:0 我试过使用Pig 10和Pig 11,但都返回相同的错误 我已经在谷歌上搜索过了,但我主要只是想得到猪的源代码,而不是解释它是什么或它的意思。我已尝试确

所以我有两个关系:

  • 页面视图按GUID和URL计数
    pv\u计数
  • 使用相同GUID和url的事件
    ev\u计数
我试图用
joined_counts=按ev_site_guid加入ev_计数,按pv_site_guid加入pv_计数,但我一直收到此错误:

错误2087:优化过程中出现意外问题。在多个LocalReagrance运算符中找到索引:0

我试过使用Pig 10和Pig 11,但都返回相同的错误

我已经在谷歌上搜索过了,但我主要只是想得到猪的源代码,而不是解释它是什么或它的意思。我已尝试确保键中没有任何null或空字符串

有人知道我做错了什么吗

以下是模式和一些示例数据:

pv_计数

描述pv_计数
{group::pv_site_guid:chararray,group::pv_主机名:chararray,pv_count:long}

转储pv_计数

(bSAw-mF-0r4Q-4acwqm_6r,示例url.com,10)
(bSAw-mF-0r4Q-4acwqm_6r,体育。示例url.com,10)
(bSAw-mF-0r4Q-4acwqm_6r,观点。示例url.com,10)
(bSAw-mF-0r4Q-4acwqm_6r,newsinfo.example url.com,10)
(bSAw-mF-0r4Q-4acwqm_6r,生活方式。示例url.com,10)
.... 页面浏览量比事件多得多……
(dZiLDGjsGr3O3zacn9QLBk,example-url2.com.com,10)
(dZiLDGjsGr3O3zacn9QLBk,example-url3.com,10)

ev_计数

描述ev\u计数
{group::ev_site_guid:chararray,group::ee_主机名:chararray,ev1count:long,ev2count:long,ev3count:long,ev4count:long,ev5count:long}

dump ev_计数

(bSAw-mF-0r4Q-4acwqm_6r,示例url.com,29,0,0,0)
(bSAw-mF-0r4Q-4acwqm_6r,体育。示例url.com,7,0,0,0)
(bSAw-mF-0r4Q-4acwqm_6r,生活方式。示例url.com,2,0,0,0)
.... 事件不如页面浏览量多……
(dZiLDGjsGr3O3zacn9QLBk,example-url2.com.com,0,0,37,0,0)
(dZiLDGjsGr3O3zacn9QLBk,example-url3.com,0,0,1,0,0)

我可以用猪和咕噜把关系处理得很好

当我添加下面的join语句时,它就结束了,并且消失了:

JOIN_counts=按ev_site_guid加入ev_计数,按pv_site_guid加入pv_计数
dump-joined\u计数

它将抛出“错误2087:优化过程中出现意外问题。在多个LocalReaginate运算符中找到索引:0”。错误和难看的堆栈跟踪。我对pig比较陌生,所以我从来没有深入研究过它的内部结构


如果有人有什么建议或东西可以尝试,我很乐意尝试。我们在Cloudera的CDH3U3(0.20.2)上运行。

加载数据集后,您是如何获得
ev_计数
pv_计数
的?你能提供完整的查询吗?我无法通过对您提到的字段进行简单的分组来重现非Cloudera 0.10.1上的错误。