如何在PIG中将XLSX文件转换为CSV文件?

如何在PIG中将XLSX文件转换为CSV文件?,csv,hadoop,apache-pig,xlsx,apache-pig-grunt,Csv,Hadoop,Apache Pig,Xlsx,Apache Pig Grunt,我们如何使用PIG脚本将xlsx文件转换为csv文件。 我发现有一个CSVExcelStorage可以将alredy转换的xlsx存储为csv文件 STORE x INTO '<destFileName>' USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]); Eg: STORE res INT

我们如何使用PIG脚本
将xlsx
文件转换为
csv
文件。 我发现有一个CSVExcelStorage可以将alredy转换的xlsx存储为csv文件

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]);
Eg:

STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');
将x存储到“”
使用CSVExcelStorage([“”[,{'YES_MULTILINE'|'NO_MULTILINE'}[,{'UNIX'|'WINDOWS'|'UNCHANGED'}]]);
如:
将res存储到“/tmp/result.csv”中
使用CSVExcelStorage(',','NO_MULTILINE','WINDOWS');
我认为在此之前,我们需要将xlsx文件转换为csv

所以,我们怎样才能用猪来做呢

任何帮助。

请参阅:

用法:

STORE x INTO '<destFileName>'
USING CSVExcelStorage(['<delimiter>' [,{'YES_MULTILINE' | 'NO_MULTILINE'} [,{'UNIX' | 'WINDOWS' | 'UNCHANGED'}]]]);

其中,CRLF是换行字符(0x0d 0x0a:\r\n),逗号是字段分隔符。

我认为它可能重复用于存储csv文件。但在此之前,我们必须将xlsx文件转换为csv。我想使用pig将xlsx文件转换为csv文件。就像使用pig将xml文件转换为csv一样…[link]想将xlsx文件转换为csv文件。任何建议这确实不会将xlsx转换为csv。从添加的链接中可以看到,它加载了一个CSV(使用excel制作CSV时使用的格式标准)。正如我链接的问题中所述,pig无法直接读取xlsx文件。
STORE res INTO '/tmp/result.csv'
USING CSVExcelStorage(',', 'NO_MULTILINE', 'WINDOWS');