Hadoop 有足够的选择性,只考虑文件中的几个值 在蜂箱中,我们可以有足够的选择性,只考虑文件上的几个值吗?

Hadoop 有足够的选择性,只考虑文件中的几个值 在蜂箱中,我们可以有足够的选择性,只考虑文件上的几个值吗?,hadoop,hive,Hadoop,Hive,例如:- 输入文件:- 汤姆,3654,它,300$ 阿尔伯特,3454,制造业,600$ 哈里,2332岁,运动员,700岁$ 我需要创建一个外部表,我只需要考虑几个字段。请找到下面我需要考虑的领域。 3654300$ 3454,600$ 2332700$ 我的外部表应仅包含上述值,其他值应忽略。它能通过蜂巢实现吗 请帮助……没有OOTB功能允许这样做,好吧。作为一种解决方法,您可以创建两个表,将输入文件加载到第一个表中,从中选择所需的字段并将其插入到第二个表中。大概是这样的: 配置单元>创建

例如:-

输入文件:-

汤姆,3654,它,300$ 阿尔伯特,3454,制造业,600$ 哈里,2332岁,运动员,700岁$

我需要创建一个外部表,我只需要考虑几个字段。请找到下面我需要考虑的领域。

3654300$ 3454,600$ 2332700$

我的外部表应仅包含上述值,其他值应忽略。它能通过蜂巢实现吗


请帮助……

没有OOTB功能允许这样做,好吧。作为一种解决方法,您可以创建两个表,将输入文件加载到第一个表中,从中选择所需的字段并将其插入到第二个表中。大概是这样的:

配置单元>创建外部表t1(c1字符串、c2字符串、c3字符串、c4 串,c5串,c6串,c7串,c8串,c9串,c10串 字符串)以“,”位置结尾的行格式分隔字段 “/输入”

配置单元>创建表t2(c1字符串、c2字符串、c3字符串、c4字符串)

蜂巢>插入到表t2中选择c2,concat_ws(“”),拆分(c4,' [0],c5),concat_ws(“”,split(c7,)[0],c8),c10从t1开始

蜂巢>从t2中选择*


你能澄清一下什么和什么之间的区别吗?哦,对不起!!!!是一个打字错误……这些行“行格式分隔”字段以“”结尾,行以“”结尾,有什么意义。。“字段终止于”表示行字段之间的分隔符,“行终止于”表示行分隔符。例如,逗号可以用作字段分隔符,\n也可以用作行分隔符。