Hadoop 如何从.tsv文件加载Pig中的数据?

Hadoop 如何从.tsv文件加载Pig中的数据?,hadoop,apache-pig,Hadoop,Apache Pig,我有一个.TSV文件,其中包含HDFS中的数据,无法将其加载到Pig中。 我使用的命令是“ 返回错误:找不到别名A的运算符 像这样做 A=使用PigStorage('\t')作为加载'path/of/file'(名称:chararray,年龄:int,gpa:float) B=每个A生成名称、年龄 垃圾场B ps:我不认为您的命令有任何错误。因为tab(\t)是pig的默认分隔符。我用您的命令得到了正确的输出。您能给我发送您终端的日志或屏幕截图吗。这样做吗 A=使用PigStorage('\t'

我有一个.TSV文件,其中包含HDFS中的数据,无法将其加载到Pig中。 我使用的命令是“

返回错误:找不到别名A的运算符

像这样做

A=使用PigStorage('\t')作为加载'path/of/file'(名称:chararray,年龄:int,gpa:float)

B=每个A生成名称、年龄

垃圾场B

ps:我不认为您的命令有任何错误。因为tab(\t)是pig的默认分隔符。我用您的命令得到了正确的输出。您能给我发送您终端的日志或屏幕截图吗。

这样做吗

A=使用PigStorage('\t')作为加载'path/of/file'(名称:chararray,年龄:int,gpa:float)

B=每个A生成名称、年龄

垃圾场B


ps:我认为您的命令没有任何错误。作为选项卡(\t)是pig的默认分隔符。我正在使用您的命令获得正确的输出。请将您终端的日志或屏幕截图发送给我。

如果不指定分隔符,pig将使用默认“,”作为加载文件的分隔符。因此,您的load语句失败。您必须显式指定分隔符“\t”

A = LOAD 'file_location' USING PigStorage('\t') AS (name:chararray, age:int, gpa:float);

如果未指定分隔符,PIG将使用默认的“,”作为加载文件的分隔符。因此,load语句失败。必须显式指定分隔符“\t”

A = LOAD 'file_location' USING PigStorage('\t') AS (name:chararray, age:int, gpa:float);

pig的默认分隔符为“\t”。您可以自己尝试。pig的默认分隔符为“\t”。您可以自己尝试。