Hive 配置单元QL除外子句

Hive 配置单元QL除外子句,hive,Hive,如何在HiveQL中执行EXCEPT子句(如SQL) 我有两个表,每个表都是一列唯一的ID 我想找到仅在表1中而不在表2中的ID列表 表1 apple orange pear 表2 apple orange 在SQL中,可以使用EXCEPT子句(),但在Hive QL中不能使用EXCEPT子句。我认为没有任何内置方法可以做到这一点,但使用左外部联接应该可以做到这一点 这将从表1中选择表2中不存在的所有ID: SELECT t1.id FROM table1 t1 LEFT OUTER JOI

如何在HiveQL中执行
EXCEPT
子句(如SQL)

我有两个表,每个表都是一列唯一的ID

我想找到仅在表1中而不在表2中的ID列表

表1

apple
orange
pear
表2

apple
orange

在SQL中,可以使用EXCEPT子句(),但在Hive QL中不能使用EXCEPT子句。我认为没有任何内置方法可以做到这一点,但使用
左外部联接应该可以做到这一点

这将从
表1
中选择
表2
中不存在的所有ID:

SELECT t1.id FROM table1 t1 LEFT OUTER JOIN table2 t2 ON (t1.id=t2.id) WHERE t2.id IS NULL;

我们可以在Hive中使用notexists子句作为等价项

SELECT t1.id FROM t1 WHERE NOT EXISTS (SELECT 1 from t2 WHERE t2.id = t1.id);