Java 如何改进日志文件的数据处理

Java 如何改进日志文件的数据处理,java,logging,Java,Logging,我需要对日志文件进行一些数据处理,例如带有时间戳的行。 运行1MB数据需要1秒的时间。如何在10秒内对1TB数据文件执行此处理?您可以使用线程并行化,同时处理日志文件的不同部分 这是假设对日志的处理是可并行的,并且不需要顺序读取日志。它还假设您有足够快的硬盘驱动器(一些旋转硬盘无法读取100MB/s,这是1TB/10s所需的速度)。您能否再解释一下,您是如何处理文件的,您在做什么处理?“相当直接”将1 TB的文件划分为小文件并进行并行处理这些数据只是文本,所以不重要。如何将文件划分为更小的文件并

我需要对日志文件进行一些数据处理,例如带有时间戳的行。
运行1MB数据需要1秒的时间。如何在10秒内对1TB数据文件执行此处理?

您可以使用线程并行化,同时处理日志文件的不同部分


这是假设对日志的处理是可并行的,并且不需要顺序读取日志。它还假设您有足够快的硬盘驱动器(一些旋转硬盘无法读取100MB/s,这是1TB/10s所需的速度)。

您能否再解释一下,您是如何处理文件的,您在做什么处理?“相当直接”将1 TB的文件划分为小文件并进行并行处理这些数据只是文本,所以不重要。如何将文件划分为更小的文件并引入parralel处理?在生成这些文件时,是否可以处理这些文件?再解释一下,这样我就能了解问题的背景了?您可以将一个文件划分为多个小文件,并使用线程或可扩展的微服务同时处理不同的文件