Ubuntu 将包含许多文本文件的文件夹摄取到Hadoop中

Ubuntu 将包含许多文本文件的文件夹摄取到Hadoop中,ubuntu,hadoop,Ubuntu,Hadoop,我的桌面上有一个文件夹,里面有3000多个小的.txt文件。如何将该文件夹与所有.txt文件一起放入Hadoop中,而不是单独上载每个文件 我将Ubuntu操作系统与Hadoop 3.1.2结合使用,HDFS并不是用来存储任何类型的“小文件”。例如,您应该将它们压缩到BZ2存档中,然后将其上载到HDFS 大多数Hadoop库都可以读取Bzip存档。以多种方式将文件加载到HDFS中。这个有详细的解释

我的桌面上有一个文件夹,里面有3000多个小的.txt文件。如何将该文件夹与所有.txt文件一起放入Hadoop中,而不是单独上载每个文件


我将Ubuntu操作系统与Hadoop 3.1.2结合使用,HDFS并不是用来存储任何类型的“小文件”。例如,您应该将它们压缩到BZ2存档中,然后将其上载到HDFS


大多数Hadoop库都可以读取Bzip存档。

以多种方式将文件加载到HDFS中。这个有详细的解释