Multithreading 使用Map Reduce或多线程/多处理的小文件

Multithreading 使用Map Reduce或多线程/多处理的小文件,multithreading,mapreduce,elastic-map-reduce,Multithreading,Mapreduce,Elastic Map Reduce,我有一批500个文件,每个大约45 kb。每个文件需要进行大约87840次计算(ARIMA回归问题)。每个计算本身都是独立的 鉴于此,为此类问题制定解决方案的最佳方法是什么 “弹性映射”是否减少了前进的道路,还是我应该使用使用使用多处理和多线程的多核机器?如果每个计算都是独立的,那么多线程将是一个坏主意,因为您会遇到与此相关的共享堆和序列化问题。所以弹性贴图减少或者如果您只能访问多核机器,则使用多处理 如果采用EMR方法,您能告诉我们在这种情况下映射器和还原器的外观吗?我希望以尽可能并行的方式处

我有一批500个文件,每个大约45 kb。每个文件需要进行大约87840次计算(ARIMA回归问题)。每个计算本身都是独立的

鉴于此,为此类问题制定解决方案的最佳方法是什么


“弹性映射”是否减少了前进的道路,还是我应该使用使用使用多处理和多线程的多核机器?

如果每个计算都是独立的,那么多线程将是一个坏主意,因为您会遇到与此相关的共享堆和序列化问题。所以弹性贴图减少或者如果您只能访问多核机器,则使用多处理

如果采用EMR方法,您能告诉我们在这种情况下映射器和还原器的外观吗?我希望以尽可能并行的方式处理500个文件。正如我在问题中提到的,每个文件还有87840个独立的计算。