Java 使用多线程从本地传输到hadoop hdfs
我正在尝试将大量文件从本地传输到hadoop hdfs。 在我的java代码中,我只有一个到hadoop的连接。但是我打电话Java 使用多线程从本地传输到hadoop hdfs,java,hadoop,hdfs,Java,Hadoop,Hdfs,我正在尝试将大量文件从本地传输到hadoop hdfs。 在我的java代码中,我只有一个到hadoop的连接。但是我打电话 fileSystem.transferFromLocal 在50个线程中同步 我认为这可能不是一个好方法,因为它真的很慢 有人能给我一些建议吗?非常感谢。您需要找出导致传输缓慢的瓶颈,可能是任何原因。仅仅增加线程数量并不能按比例增加HDFS写入。如果不深入了解Hadoop集群的细节,就很难诊断问题 以下是一些需要考虑的事情 检查本地计算机和Hadoop群集之间的网络
fileSystem.transferFromLocal
在50个线程中同步
我认为这可能不是一个好方法,因为它真的很慢
有人能给我一些建议吗?非常感谢。您需要找出导致传输缓慢的瓶颈,可能是任何原因。仅仅增加线程数量并不能按比例增加HDFS写入。如果不深入了解Hadoop集群的细节,就很难诊断问题 以下是一些需要考虑的事情