Optimization 是否有可能优化此Matlab代码，以便从k-均值中使用质心进行矢量量化？_Optimization_Matlab_Vector_K Means_Quantization

Optimization 是否有可能优化此Matlab代码，以便从k-均值中使用质心进行矢量量化？

optimization matlab vector

Optimization 是否有可能优化此Matlab代码，以便从k-均值中使用质心进行矢量量化？,optimization,matlab,vector,k-means,quantization,Optimization,Matlab,Vector,K Means,Quantization,我已经用大小为4000x300的k-means（4000个质心，每个质心有300个特征）创建了一个代码本。使用代码本，我想标记一个输入向量（为了以后的装箱）。输入向量的大小为Nx300，其中N是我接收的输入实例总数为了计算标签，我计算每个输入向量的最近质心。为此，我将每个输入向量与所有质心进行比较，并选择距离最小的质心。然后，标签就是该质心的索引我当前的Matlab代码如下所示： function labels = assign_labels(centroids, X) labels = z

我已经用大小为4000x300的k-means（4000个质心，每个质心有300个特征）创建了一个代码本。使用代码本，我想标记一个输入向量（为了以后的装箱）。输入向量的大小为Nx300，其中N是我接收的输入实例总数

为了计算标签，我计算每个输入向量的最近质心。为此，我将每个输入向量与所有质心进行比较，并选择距离最小的质心。然后，标签就是该质心的索引

我当前的Matlab代码如下所示：

function labels = assign_labels(centroids, X)
labels = zeros(size(X, 1), 1);

% for each X, calculate the distance from each centroid
for i = 1:size(X, 1)
    % distance of X_i from all j centroids is: sum((X_i - centroid_j)^2)
    % note: we leave off the sqrt as an optimization
    distances = sum(bsxfun(@minus, centroids, X(i, :)) .^ 2, 2);
    [value, label] = min(distances);
    labels(i) = label;
end

然而，这段代码仍然相当慢（出于我的目的），我希望有一种方法可以进一步优化代码

一个明显的问题是存在for循环，这是Matlab良好性能的祸根。我一直在想办法摆脱它，但运气不好（我考虑过将arrayfun与bsxfun结合使用，但还没有成功）。或者，如果有人知道任何其他加快速度的方法，我将不胜感激

更新

在做了一些搜索之后，我无法使用Matlab找到一个很好的解决方案，因此我决定看看Python的scikits.learn包中使用的“欧几里得距离”（简称“euclidean_distance”）：

它使用了欧几里德距离的二项式形式（（x-y）^2->x^2+y^2-2xy），根据我所读的，它通常运行得更快。我完全未经测试的Matlab翻译是：

 XX = sum(data .* data, 2);
 YY = sum(center .^ 2, 2);
 [val, ~] = max(XX + YY - 2*data*center');

您可以通过转换为单元格并使用以下命令将其矢量化：

说明：

我们将
```
X
```
的每一行分配给第二行中自己的单元格
这段
```
@（x）（sum（bsxfun（@减号，质心，x）。^2,2））
```
是一个匿名函数，它与
```
距离=…
```
行相同，我们使用
```
cell2mat
```
，将其应用于
```
x
```
的每一行
然后，标签是沿每列的最小行的索引

  P2 = kron(centroids, ones(size(X,1),1));
  Q2 = kron(ones(size(centroids,1),1), X);

  distances = reshape(sum((Q2-P2).^2,2), size(X,1), size(centroids,1));

注意

function D=getSim(A,B)
    Qa=repmat(dot(A,A,2),1,size(B,1));
    Qb=repmat(dot(B,B,2),1,size(A,1));
    D=Qa+Qb'-2*A*B';

bsxfun

cellfun

cellfun

cellfun

  P2 = kron(centroids, ones(size(X,1),1));
  Q2 = kron(ones(size(centroids,1),1), X);

  distances = reshape(sum((Q2-P2).^2,2), size(X,1), size(centroids,1));

function D=getSim(A,B)
    Qa=repmat(dot(A,A,2),1,size(B,1));
    Qb=repmat(dot(B,B,2),1,size(A,1));
    D=Qa+Qb'-2*A*B';