使用csv文件进行配置单元搜索
我对蜂巢还比较陌生,所以我甚至不确定使用什么合适的术语,所以这个问题可能已经解决了。如果有,就道歉使用csv文件进行配置单元搜索,csv,search,hive,Csv,Search,Hive,我对蜂巢还比较陌生,所以我甚至不确定使用什么合适的术语,所以这个问题可能已经解决了。如果有,就道歉 这是我的设想;我们有一个用于数千台设备的大型数据表,由序列号键入。我需要查找设备的特定变量,通常一次查找几百个。我知道我可以搜索包含“SN=001或SN=002或SN=003..”的数百个条目,但这既麻烦又耗时。我想做的是拥有一个包含序列号列表的csv文件,并执行一个搜索,该搜索显示“给我这个csv文件中所有设备所需的变量”。有可能吗?如果有,我该怎么做?谢谢 如果你的CSV文件是HDFS格式的,
这是我的设想;我们有一个用于数千台设备的大型数据表,由序列号键入。我需要查找设备的特定变量,通常一次查找几百个。我知道我可以搜索包含“SN=001或SN=002或SN=003..”的数百个条目,但这既麻烦又耗时。我想做的是拥有一个包含序列号列表的csv文件,并执行一个搜索,该搜索显示“给我这个csv文件中所有设备所需的变量”。有可能吗?如果有,我该怎么做?谢谢 如果你的CSV文件是HDFS格式的,你可以在上面做一个表格。(我们称之为csv_表) 然后,您可以按如下方式编写查询:
select *
from my_table
where specific_column in (
select *
from csv_table)
;
文件中的
演示
bash
cat>/tmp/myfile.txt
111
123
222
333
789
蜂巢
create table mytable (mycol string);
insert into mytable values (123),(456),(789);
:此处如何使用in_文件?你能提到声明where子句的通用语法吗?@keshavpradepramanath-我不知道你的意思,这是一个完整的工作示例,在你的示例中,_文件中有什么意思?它类似于列吗?\u文件中的@keshavpradepramanath-
是一个函数。
select *
from mytable
where in_file (mycol,'/tmp/myfile.txt')
;
+-------+
| mycol |
+-------+
| 123 |
| 789 |
+-------+