Hadoop 如何处理NiFi中的小文件问题

Hadoop 如何处理NiFi中的小文件问题,hadoop,hive,apache-nifi,Hadoop,Hive,Apache Nifi,我指的是下面这篇文章 我试图在nifi中创建管道,而数据来自基于实时流的数据,例如kafka,当数据放在分区位置的hdfs中时,它可能会以许多小文件结束,同时查询im面临性能滞后问题;您能否提供一些方法来解决nifi中使用orc文件格式的小文件问题

我指的是下面这篇文章

我试图在nifi中创建管道,而数据来自基于实时流的数据,例如kafka,当数据放在分区位置的hdfs中时,它可能会以许多小文件结束,同时查询im面临性能滞后问题;您能否提供一些方法来解决nifi中使用orc文件格式的小文件问题