使用csv文件进行配置单元搜索_Csv_Search_Hive

使用csv文件进行配置单元搜索

csv search hive

使用csv文件进行配置单元搜索,csv,search,hive,Csv,Search,Hive,我对蜂巢还比较陌生，所以我甚至不确定使用什么合适的术语，所以这个问题可能已经解决了。如果有，就道歉这是我的设想；我们有一个用于数千台设备的大型数据表，由序列号键入。我需要查找设备的特定变量，通常一次查找几百个。我知道我可以搜索包含“SN=001或SN=002或SN=003..”的数百个条目，但这既麻烦又耗时。我想做的是拥有一个包含序列号列表的csv文件，并执行一个搜索，该搜索显示“给我这个csv文件中所有设备所需的变量”。有可能吗？如果有，我该怎么做？谢谢如果你的CSV文件是HDFS格式的，

我对蜂巢还比较陌生，所以我甚至不确定使用什么合适的术语，所以这个问题可能已经解决了。如果有，就道歉

这是我的设想；我们有一个用于数千台设备的大型数据表，由序列号键入。我需要查找设备的特定变量，通常一次查找几百个。我知道我可以搜索包含“SN=001或SN=002或SN=003..”的数百个条目，但这既麻烦又耗时。我想做的是拥有一个包含序列号列表的csv文件，并执行一个搜索，该搜索显示“给我这个csv文件中所有设备所需的变量”。有可能吗？如果有，我该怎么做？谢谢

如果你的CSV文件是HDFS格式的，你可以在上面做一个表格。（我们称之为csv_表）

然后，您可以按如下方式编写查询：

select *
from my_table
where specific_column in (
  select *
  from csv_table)
;

文件中的

演示

bash

cat>/tmp/myfile.txt
111
123
222
333
789

蜂巢

create table mytable (mycol string);
insert into mytable values (123),(456),(789);

：此处如何使用in_文件？你能提到声明where子句的通用语法吗？@keshavpradepramanath-我不知道你的意思，这是一个完整的工作示例，在你的示例中，_文件中有什么意思？它类似于列吗？\u文件中的@keshavpradepramanath-

是一个函数。
select  *
from    mytable
where   in_file  (mycol,'/tmp/myfile.txt')
;

+-------+
| mycol |
+-------+
|  123  |
|  789  |
+-------+