Python Numpy阵列-删除重复项_Python_Numpy_Duplicates

Python Numpy阵列-删除重复项

python numpy

Python Numpy阵列-删除重复项,python,numpy,duplicates,Python,Numpy,Duplicates,我将数据集和标签设置为两个不同的csv文件。条目作为列读入两个不同的变量。我想将它们合并到一个二维数组中并删除重复项，但保留顺序。请建议。使用set或unique无效 data = np.loadtxt('raw_data.csv',delimiter=',',usecols=range(0,112),skiprows=0) label = np.loadtxt('labels.csv',delimiter=',',usecols=range(0,112),skiprows=0) feature

我将数据集和标签设置为两个不同的csv文件。条目作为列读入两个不同的变量。我想将它们合并到一个二维数组中并删除重复项，但保留顺序。请建议。使用set或unique无效

data = np.loadtxt('raw_data.csv',delimiter=',',usecols=range(0,112),skiprows=0)
label = np.loadtxt('labels.csv',delimiter=',',usecols=range(0,112),skiprows=0)
features1 = data[:,0] ##channel 0
features1 = features1.reshape(-1,1)
labels1 = label[:,0]

我想标签上可能有重复的？您可以使用np.unique并返回唯一索引，并根据它们过滤数据值

import numpy as np

labels = np.array(['a', 'b', 'c', 'b', 'd', 'c', 'a', 'e'])
vals = np.array([1, 2, 3, 4, 5, 6, 7, 8])

unique, unique_idx = np.unique(labels, return_index=True)
filtered_vals = vals[unique_idx]
combined = np.vstack((unique, filtered_vals))
print combined

输出

[['a' 'b' 'c' 'd' 'e']
 ['1' '2' '3' '5' '8']]

你能给我一个例子吗？我有一组“n”个通道的测量能级的数据，在“m”个实例的时间内测量。我需要检查通道1在时间实例1到m是否被占用。但测量的能级是重复的。我正在尝试使用scikit来学习。上面提到的示例是通道0的验证。是的，标签可以有重复项。非常感谢。这很有帮助，很乐意帮忙。如果答案解决了问题，请考虑通过点击绿色复选标记将其标记为“接受”。