在regionprops python中仅计算特定属性
我正在使用scikit图像中提供的measure.regionprops方法来测量连接组件的属性。它计算一组属性()。但是,我只需要每个连接组件的面积。有没有一种方法可以只计算一个属性并节省计算量?我找到了一种方法,当我们只需要连接组件的面积时,可以避免使用regionprops并计算所有属性。当使用label命令对连接的组件进行标记时,我们可以通过计算具有给定标签的像素数来计算每个组件的大小。所以,基本上在regionprops python中仅计算特定属性,python,image-processing,scikit-image,connected-components,Python,Image Processing,Scikit Image,Connected Components,我正在使用scikit图像中提供的measure.regionprops方法来测量连接组件的属性。它计算一组属性()。但是,我只需要每个连接组件的面积。有没有一种方法可以只计算一个属性并节省计算量?我找到了一种方法,当我们只需要连接组件的面积时,可以避免使用regionprops并计算所有属性。当使用label命令对连接的组件进行标记时,我们可以通过计算具有给定标签的像素数来计算每个组件的大小。所以,基本上 labels,num=label(image, return_num=True) for
labels,num=label(image, return_num=True)
for i in range(num):
area[i]=size(np.where(labels==i)[1])
将计算每个连接组件中的像素数。使用
regionprops
和cache=False
似乎有一种更直接的方法来做同样的事情。我使用skimage.segmentation.slic和n_segments=10000
生成标签。然后:
rps = regionprops(labels, cache=False)
[r.area for r in rps]
我对的理解是,设置cache=False
意味着在调用属性之前不会计算属性。根据Jupyter笔记本中的%%time
,使用cache=False
运行上述代码需要166ms,而使用cache=True
则需要247ms,因此这似乎是可行的
我尝试了另一个答案,发现速度慢了很多
%%time
ard = np.empty(10000, dtype=int)
for i in range(10000):
ard[i] = size(np.where(labels==0)[1])
这花了34.3秒
下面是一个完整的工作示例,使用slic分割生成的宇航员样本图像和标签,比较两种方法:
import numpy as np
import skimage
from skimage.segmentation import slic
from skimage.data import astronaut
img = astronaut()
# `+ 1` is added to avoid a region with the label of `0`
# zero is considered unlabeled so isn't counted by regionprops
# but would be counted by the other method.
segments = slic(img, n_segments=1000, compactness=10) + 1
# This is just to make it more like the original poster's
# question.
labels, num = skimage.measure.label(segments, return_num=True)
使用OP建议的方法计算面积,调整索引值以避免标签为零:
%%time
area = {}
for i in range(1,num + 1):
area[i + 1] = np.size(np.where(labels==i)[1])
CPU时间:用户512毫秒,系统:0纳秒,总计:512毫秒
墙壁时间:506毫秒
使用regionprops进行相同的计算:
%%time
rps = skimage.measure.regionprops(labels, cache=False)
area2 = [r.area for r in rps]
CPU时间:用户16.6毫秒,系统0纳秒,总计16.6毫秒
墙壁时间:16.2毫秒
验证结果在元素方面是否都相等:
np.equal(area.values(), area2).all()
True
因此,只要考虑到零标签和索引差异,这两种方法都会给出相同的结果,但不带缓存的regionprops速度更快。@optimist
你的非regionprops方法对我来说有些低效。它拾取了一些不必要的噪音,并错误地计算了其中一个形状
import numpy as np
from skimage.measure import label, regionprops
import matplotlib.pyplot as plt
arr = np.array([[1,0,1,0,0,0,1],
[1,1,1,0,0,0,1],
[0,1,1,0,0,0,1],
[0,1,1,0,0,1,1],
[0,0,0,0,1,1,1],
[0,0,0,1,1,1,1],
[1,0,0,1,1,1,1],
[1,0,0,1,1,1,1],
[1,0,0,1,1,1,1]])
area = {}
labels, num = label(arr, return_num=True)
for i in range(num):
print(i)
area[i]=np.size(np.where(labels==i)[1])
print(area[i])
plt.imshow(labels)
plt.show();
只要考虑零标签,结果是相同的。我添加了一个带有结果比较的扩展示例。干杯。这个答案不正确;缓存只是确定一旦请求属性,它是否保留在内存中。无论标志的值如何,都不会预先计算属性。请查看我的答案
rps = regionprops(labels, cache=False)
[r.area for r in rps]
Out: [9, 24, 3]