并行处理-Python
我在一个项目中工作,其中一些过程需要很长时间才能完成(总时间>2小时),而且一些过程显然可以并行化。例如:并行处理-Python,python,multithreading,multiprocessing,Python,Multithreading,Multiprocessing,我在一个项目中工作,其中一些过程需要很长时间才能完成(总时间>2小时),而且一些过程显然可以并行化。例如: for n in range(images): entry = ImD.ImageData(width, height) entry.interpolate_points(seeds) entries.append(entry) def interpolate_points(self, seeds): points = [] f = []
for n in range(images):
entry = ImD.ImageData(width, height)
entry.interpolate_points(seeds)
entries.append(entry)
def interpolate_points(self, seeds):
points = []
f = []
for i in range(seeds):
# Generate a cell position
pos_x = random.randrange(self.width)
pos_y = random.randrange(self.height)
# Save the f(x,y) data
x = Utils.translate_range(pos_x, 0, self.width, self.range_min, self.range_max)
y = Utils.translate_range(pos_y, 0, self.height, self.range_min, self.range_max)
z = Utils.function(x, y)
points.append([x, y])
f.append(z)
for x in range(self.width):
xt = (Utils.translate_range(x, 0, self.width, self.range_min, self.range_max))
for y in range(self.height):
yt = (Utils.translate_range(y, 0, self.height, self.range_min, self.range_max))
self.data[x][y] = Utils.shepard_euclidian(points, f, [xt, yt], 3)
插值点方法需要一段相关的时间才能得出结论,因为我称之为40多次,我相信我可以让一些调用并行运行
def generate_pixel_histogram(self, images, bins):
"""
Generate a histogram of the image for each pixel, counting
the values assumed for each pixel in a specified bins
"""
max_value = 0.0
min_value = 0.0
for i in range(len(images)):
image = images[i]
max_entry = max(max(p[1:]) for p in image.data)
min_entry = min(min(p[1:]) for p in image.data)
if max_entry > max_value:
max_value = max_entry
if min_entry < min_value:
min_value = min_entry
interval_size = (math.fabs(min_value) + math.fabs(max_value))/bins
for x in range(self.width):
for y in range(self.height):
pixel_histogram = {}
for i in range(bins+1):
key = round(min_value+(i*interval_size), 2)
print key
pixel_histogram[key] = 0.0
for i in range(len(images)):
image = images[i]
value = round(Utils.get_bin(image.data[x][y], interval_size), 2)
pixel_histogram[value] += 1.0/len(images)
self.data[x][y] = pixel_histogram
但它不起作用,因为我是和班级一起工作的
任何帮助都将不胜感激。
提前感谢。您可以从多进程中尝试并行映射。这是一种“队列”模型,在这种模型中,你要做大量的任务,你要提出一些工作流程,他们要处理这些流程 示例(取自该页): 这将带来5个工作流程,他们将从您传递给map的列表中获取他们的工作
请注意,不保证处理订单。谢谢@geekazoid。这似乎适用于我的第一个问题(我将尝试这个),但我想我应该使用另一种方法来解决第二个问题。你知道我如何将第二个例子并行化吗?非常感谢。我不太明白这个问题,但是假设那个双人房间有问题。您可以使用笛卡尔乘积将双for转换为单个列表。itertools.product提供两个迭代器(或列表)的笛卡尔乘积,并返回一个迭代器,而不是另一个长列表;)我不知道如何用你的例子来解决我的问题。我有三行代码必须为一个实例执行。在使用您的示例@geekazoid?@pceccon之前,我必须为它创建一个方法。很抱歉,延迟了。是的,您必须创建一个单独的函数。告诉我你能不能做到。是的,我做到了。但不知何故,它比没有多重处理要慢得多!面向对象
p = Pool(5)
for n in range(images):
entry = ImD.ImageData(width, height)
entries.append(entry)
p.map(ImD.interpolate_points, entries)
from multiprocessing import Pool
p = Pool(5)
def f(x):
return x*x
p.map(f, range(50))