使用csv文件进行配置单元搜索

使用csv文件进行配置单元搜索,csv,search,hive,Csv,Search,Hive,我对蜂巢还比较陌生,所以我甚至不确定使用什么合适的术语,所以这个问题可能已经解决了。如果有,就道歉 这是我的设想;我们有一个用于数千台设备的大型数据表,由序列号键入。我需要查找设备的特定变量,通常一次查找几百个。我知道我可以搜索包含“SN=001或SN=002或SN=003..”的数百个条目,但这既麻烦又耗时。我想做的是拥有一个包含序列号列表的csv文件,并执行一个搜索,该搜索显示“给我这个csv文件中所有设备所需的变量”。有可能吗?如果有,我该怎么做?谢谢 如果你的CSV文件是HDFS格式的,

我对蜂巢还比较陌生,所以我甚至不确定使用什么合适的术语,所以这个问题可能已经解决了。如果有,就道歉


这是我的设想;我们有一个用于数千台设备的大型数据表,由序列号键入。我需要查找设备的特定变量,通常一次查找几百个。我知道我可以搜索包含“SN=001或SN=002或SN=003..”的数百个条目,但这既麻烦又耗时。我想做的是拥有一个包含序列号列表的csv文件,并执行一个搜索,该搜索显示“给我这个csv文件中所有设备所需的变量”。有可能吗?如果有,我该怎么做?谢谢

如果你的CSV文件是HDFS格式的,你可以在上面做一个表格。(我们称之为csv_表)

然后,您可以按如下方式编写查询:

select *
from my_table
where specific_column in (
  select *
  from csv_table)
;
文件中的
演示

bash

cat>/tmp/myfile.txt
111
123
222
333
789
蜂巢

create table mytable (mycol string);
insert into mytable values (123),(456),(789);



:此处如何使用in_文件?你能提到声明where子句的通用语法吗?@keshavpradepramanath-我不知道你的意思,这是一个完整的工作示例,在你的示例中,_文件中有什么意思?它类似于列吗?\u文件中的@keshavpradepramanath-
是一个函数。
select  *
from    mytable
where   in_file  (mycol,'/tmp/myfile.txt')
;
+-------+
| mycol |
+-------+
|  123  |
|  789  |
+-------+