在Hadoop文件系统中跨多个LZ4压缩文件执行Grep

在Hadoop文件系统中跨多个LZ4压缩文件执行Grep,hadoop,hdfs,Hadoop,Hdfs,我的问题很类似于 然而,在我的例子中,所有的文件都是LZ4压缩的 $hadoop fs -ls /output /output/a.lz4 /output/b.lz4 ....... 特定字符串alice出现在/output中0次或更多次。我想看看alice出现在哪个文件中

我的问题很类似于

然而,在我的例子中,所有的文件都是LZ4压缩的

$hadoop fs -ls /output

/output/a.lz4
/output/b.lz4
.......
特定字符串
alice
出现在
/output
中0次或更多次。我想看看alice出现在哪个文件中