Arrays 使用Matlab查找和索引数组中的重复元素
我有一个数组Arrays 使用Matlab查找和索引数组中的重复元素,arrays,matlab,Arrays,Matlab,我有一个数组A=[10203001050] 是否有任何聪明的方法来查找和定位此数组的重复元素 i、 e 我尝试使用unique,但失败了…这里有一个解决方案: % input array A = [10 20 20 30 40 10 50]; % find unique elements (vals), and map values of A to indices (valsIdx) [vals,~,valsIdx] = unique(A); % group element location
A=[10203001050]代码>
是否有任何聪明的方法来查找和定位此数组的重复元素
i、 e
我尝试使用unique
,但失败了…这里有一个解决方案:
% input array
A = [10 20 20 30 40 10 50];
% find unique elements (vals), and map values of A to indices (valsIdx)
[vals,~,valsIdx] = unique(A);
% group element locations by the above indices mapping
locs = accumarray(valsIdx, 1:numel(valsIdx), [], @(x){sort(x)});
% keep only values that are repeated
idx = cellfun(@numel, locs) > 1;
vals = vals(idx);
locs = locs(idx);
结果是:
vals =
10 20
locs =
[2x1 double]
[2x1 double]
>> celldisp(locs)
locs{1} =
1
6
locs{2} =
2
3
这里有一个解决方案:
% input array
A = [10 20 20 30 40 10 50];
% find unique elements (vals), and map values of A to indices (valsIdx)
[vals,~,valsIdx] = unique(A);
% group element locations by the above indices mapping
locs = accumarray(valsIdx, 1:numel(valsIdx), [], @(x){sort(x)});
% keep only values that are repeated
idx = cellfun(@numel, locs) > 1;
vals = vals(idx);
locs = locs(idx);
结果是:
vals =
10 20
locs =
[2x1 double]
[2x1 double]
>> celldisp(locs)
locs{1} =
1
6
locs{2} =
2
3
下面是另一个:
>> A = [10 20 20 30 40 10 50];
>> S = sort(A);
>> S = arrayfun(@(x) [x find(x==A)], unique(S(diff(S)==0)), 'UniformOutput', false);
>> S{:}
ans =
10 1 6
ans =
20 2 3
如果您没有或想要使用arrayfun
,可以使用普通循环:
A = [10 20 20 20 30 40 10 50];
S = sort(A);
S = unique(S(diff(S)==0));
R = cell(size(S'));
for ii = 1:numel(S)
R{ii} = [S(ii) find(A==S(ii))]; end
下面是另一个:
>> A = [10 20 20 30 40 10 50];
>> S = sort(A);
>> S = arrayfun(@(x) [x find(x==A)], unique(S(diff(S)==0)), 'UniformOutput', false);
>> S{:}
ans =
10 1 6
ans =
20 2 3
如果您没有或想要使用arrayfun
,可以使用普通循环:
A = [10 20 20 20 30 40 10 50];
S = sort(A);
S = unique(S(diff(S)==0));
R = cell(size(S'));
for ii = 1:numel(S)
R{ii} = [S(ii) find(A==S(ii))]; end
此解决方案仅返回值,而不返回值的索引(位置)。
%Your Data
A=[10 20 20 30 40 10 50];
%sorted Data
A_sorted=sort(A);
%find the duplicates
idx=find(diff(A_sorted)==0);
% the unique is needed when there are more than two duplicates.
result=unique(A_sorted(idx));
此解决方案仅返回值,而不返回值的索引(位置)。
%Your Data
A=[10 20 20 30 40 10 50];
%sorted Data
A_sorted=sort(A);
%find the duplicates
idx=find(diff(A_sorted)==0);
% the unique is needed when there are more than two duplicates.
result=unique(A_sorted(idx));
使用bsxfun
和arrayfun
:
comp = tril(bsxfun(@eq, A(:), A(:).')); %'// compare all pairs of values
ind = find(sum(comp)>1); %// find repeated values
values = A(ind);
positions = arrayfun(@(n) find(comp(:,n).'.*(1:numel(A))), ind, 'uni', 0);
这使得:
>> values
values =
10 20
>> positions{:}
ans =
1 6
ans =
2 3
使用bsxfun
和arrayfun
:
comp = tril(bsxfun(@eq, A(:), A(:).')); %'// compare all pairs of values
ind = find(sum(comp)>1); %// find repeated values
values = A(ind);
positions = arrayfun(@(n) find(comp(:,n).'.*(1:numel(A))), ind, 'uni', 0);
这使得:
>> values
values =
10 20
>> positions{:}
ans =
1 6
ans =
2 3
您是如何使用unique
?您是如何使用unique
?它可以检测重复值,但我还需要初始数组的索引(即A(1)和A(6)、A(2)和A(3)。其他解决方案也可以这样做。我可以实现“它们的”我的解决方案,但这不是真正有用的,是吗?它检测重复值,但我还需要初始数组的索引(即A(1)和A(6),A(2)和A(3)。其他解决方案也这样做。我可以实现“它们的”我的解决方案,但这不是真正有用的,是吗?我使用的是旧版本的Matlab。arrayfun不是supported@user3270686:然后使用普通循环:)@user3270686:…你会感到惊讶。@user3270686:例如,阅读。@TheMinion:我认为最重要的一点是,即使对于N
非常大,所有方法的计算时间都在十分之一秒或更少的数量级。除非在某些超高级数字运算算法的内核中需要此功能,否则at被用来预测未来100年的准确气候(如此大的数据+非常频繁的调用;在这种情况下,我建议使用一种完全不同的语言),我会说它“足够快”,我们在这里真正讨论的是微观优化:)我使用的是旧版本的Matlab。arrayfun不是supported@user3270686:然后使用一个简单的循环:)@user3270686:…您会感到惊讶。@user3270686:例如,阅读。@TheMinion:我认为最重要的一点是,即使对于N
非常大,所有方法的计算时间都在十分之一秒或更少的数量级。除非在某些超级先进的数字运算算法的内核中需要这种功能,这些算法被用来预测未来100年的准确气候(如此大的数据+非常频繁的调用;在这种情况下,我建议使用一种完全不同的语言),否则我会说它“足够快”,我们在这里真正讨论的是微观优化:)您的解决方案运行良好。我不明白的是:loc
中元素的顺序是如何定义的?我在30 40
之间插入了另一个20
,而loc{2}
的结果是:3 5 2
索引是正确的,但它没有以我理解的任何方式排序。通常,我会怀疑它是排序的还是反向排序的。介意稍微解释一下你的代码吗?@TheMinion:done,我添加了一些注释并修复了要始终排序的位置。(旁注:accumarray的顺序有点奇怪,如果你想了解更多,请阅读这篇文章:)你的解决方案运行良好。我不明白的是:loc
中元素的顺序是如何定义的?我在30 40
之间插入了另一个20
,而loc{2}
的结果是:3 5 2
索引是正确的,但它没有以我理解的任何方式排序。通常,我会怀疑它是排序的还是反向排序的。介意稍微解释一下你的代码吗?@TheMinion:done,我添加了一些注释并修复了要始终排序的位置。(旁注:accumarray的订单有点奇怪,如果你想了解更多,请阅读这篇文章:)