Hadoop 用like算子连接蜂巢

Hadoop 用like算子连接蜂巢,hadoop,hive,apache-tez,Hadoop,Hive,Apache Tez,我有两个表,它们使用ORC压缩,我使用TEZ作为执行引擎。表a包含超过900k条记录,表b包含1700万条记录。此查询耗时较长我已等待了2天,但查询执行未完成。我在这个问题上做错了什么 select min(up.id) as comp002uniqueid, min(cp.product_id) as p_id from (select * from table_a where u_id is null) up , table_b cp where cp.title like con

我有两个表,它们使用ORC压缩,我使用TEZ作为执行引擎。表a包含超过900k条记录,表b包含1700万条记录。此查询耗时较长我已等待了2天,但查询执行未完成。我在这个问题上做错了什么

select min(up.id) as comp002uniqueid, min(cp.product_id) as p_id 
from 
(select * from table_a where u_id is null) up ,  table_b cp 
where  cp.title like concat('% ',up.productname,' %') 
group by up.productname;

欢迎来到StackOverflow
Lac
Crore
是仅在印度使用的数字-如果您使用数千、数百万或数十亿的记录数量,以便更多的观众能够了解您的问题,这将非常有用。此外,一些日志也会很有用。你对Map Reduce执行引擎也有同样的问题吗?可能是重复的是,我已经尝试了该解决方案,但它对我不起作用。欢迎使用StackOverflow
Lac
Crore
是仅在印度使用的数字-如果您使用数千、数百万或数十亿的记录数量,以便更多的观众能够了解您的问题,这将非常有用。此外,一些日志也会很有用。你对Map Reduce执行引擎有相同的问题吗?是的,我尝试过该解决方案,但它对我不起作用。。