Apache pig 将xlsx文件加载到Pig中

Apache pig 将xlsx文件加载到Pig中,apache-pig,Apache Pig,有没有办法将.xlsx文件加载到Pig中?我需要在PIG中使用excel文件[.xlsx]作为输入执行操作,但我找不到任何可用于此目的的内置函数 实现这一目标的任何帮助都是可观的 谢谢,没有,但是如果您的excel只有一张工作表,那么您可以尝试使用CSVExcelStorage 如何使用?检查以下链接中的清管器示例 试试这个 首先将xlsx文件转换为csv,然后执行以下操作: REGISTER Location\to\piggybank.jar Data = load 'Location\to

有没有办法将.xlsx文件加载到Pig中?我需要在PIG中使用excel文件[.xlsx]作为输入执行操作,但我找不到任何可用于此目的的内置函数

实现这一目标的任何帮助都是可观的


谢谢,

没有,但是如果您的excel只有一张工作表,那么您可以尝试使用CSVExcelStorage

如何使用?检查以下链接中的清管器示例

试试这个

首先将xlsx文件转换为csv,然后执行以下操作:

REGISTER Location\to\piggybank.jar

Data = load 'Location\to\csv\file' using org.apache.pig.piggybank.storage.CSVExcelStorage(',', 'NO_MULTILINE', 'NOCHANGE', 'SKIP_INPUT_HEADER') as (col1,col2,..);

它(CSVExcelStorage)对我有用。希望它能工作。

CSVExcelStorage不适用于.xlsx文件格式。我使用了下面的代码REGISTER/usr/lib/pig/piggybank.jar;a=使用org.apache.pig.piggybank.storage.CSVExcelStorage('\t')加载'/path/to/file.xlsx';b=FOREACH a生成$1;垃圾场b;但是它没有像预期的那样转储结果。xlsx文件有什么功能,如果CSVExcelStorage处理程序不工作,那么您应该实现一个存储处理程序。这是我在Pig的javadoc中看到的最接近的存储处理程序,可以使用关于如何将xlsx转换为csv的说明。请注意,我认为这是不可能与猪直接。