粗糙集：Python中的快速约简/特征选择_Python_Python 3.x_Machine Learning_Feature Selection_Fuzzy

粗糙集：Python中的快速约简/特征选择

python python-3.x machine-learning

粗糙集：Python中的快速约简/特征选择,python,python-3.x,machine-learning,feature-selection,fuzzy,Python,Python 3.x,Machine Learning,Feature Selection,Fuzzy,我需要实现基于粗糙集的特征选择快速约简算法，因为我使用了癌症乳腺数据集，我得到了一些错误，即使代码运行结果是错误的（与R相比）有人有什么建议吗？我刚刚解决了这个问题：每个特性的依赖性等于0，所以我只添加了一个函数来处理两个特性之间的最大依赖性。因此，python脚本可以很好地与其他数据集配合使用 import numpy as np import pandas as pd #_______________________ File selection box filename = 'bre

我需要实现基于粗糙集的特征选择快速约简算法，因为我使用了癌症乳腺数据集，我得到了一些错误，即使代码运行结果是错误的（与R相比）

有人有什么建议吗？

我刚刚解决了这个问题：每个特性的依赖性等于0，所以我只添加了一个函数来处理两个特性之间的最大依赖性。因此，python脚本可以很好地与其他数据集配合使用

import numpy as np
import pandas as pd
#_______________________ File selection box
filename = 'breast10D.csv' # show an "Open" dialog box and return the path to the selected file
#Cfilename ='breast10.csv'
#_______________________ Converting csv file to list
df = pd.read_csv(filename)#,index_col=True)
U = df.values.tolist()
U = [[index] + value for index , value in enumerate(U) ]
#________________________ Equivalence partition function
def equivalence_partition( iterable , index ):
    classes = []
    dclasses = {}
    for o in iterable: # for each object
        # find the class it is in
        found = False
        for c in classes:
            indice_ele = next(iter(c))
            element = [iterable[indice_ele][ind] == o[ind] for ind in index]
            if all(element): # is it equivalent to this class?
                c.add( o[0])
                dclasses[o[0]] = c
                found = True
                break
        if not found: # it is in a new class
            classes.append( set([o[0]]))
            dclasses[o[0]] = classes[-1]
    return classes,dclasses
#_________________________ Finding lower approximation and positif region
def lower_appr(B):
    ind_B = equivalence_partition( U , B )[1]
    ind_d = equivalence_partition( U , D )[1]
    lower_appr_set = set()
    for x,ele in enumerate(U):
        if ind_B[x].issubset(ind_d[x]):
            lower_appr_set.add(x)
    return lower_appr_set
#________________________ Finding dependencey of features
def gamma(B):
    return float(len(lower_appr(B)))/float(len(U))
#_________________________ Rough set feature selection quickreduct algorithm
def qreduct(C):
    R = set()
    while True:
        T = R
        for x in C-R:
             if gamma(R.union(set([x]))) > gamma(T):
                T = R.union(set([x]))

        R = T
        if gamma(R) == gamma(C):
                break
    return R
#_________________________ Main fuction
decision=len(df.columns)#_________ defining le decision index
D = [decision]           
B = set([ i for i in range(1,decision)]) #__________ defining condition index
Features= qreduct(B)