Python 3.x 从功能上定义分离“;“善”;高维空间
我有存在于高维空间中的二进制分类数据,但我有大量的选项,我使用精确的子空间来表示数据。如何计算二进制数据在给定高维空间中的聚集程度 这里是一个使用t-sne将一个特定高维表示简化为2D的示例(为了可视化目的,数据保持在高维空间中)Python 3.x 从功能上定义分离“;“善”;高维空间,python-3.x,machine-learning,Python 3.x,Machine Learning,我有存在于高维空间中的二进制分类数据,但我有大量的选项,我使用精确的子空间来表示数据。如何计算二进制数据在给定高维空间中的聚集程度 这里是一个使用t-sne将一个特定高维表示简化为2D的示例(为了可视化目的,数据保持在高维空间中) 我想用一种功能性的方式说“这个空间是x善于分离True和False数据”,这样数据的这个空间表示可以与其他一些空间表示进行比较。还没有实现它,但我认为这会起作用: 使用k-means聚类定义数据聚类 计算abs(0.5-numTrue/(numTrue+numFa
我想用一种功能性的方式说“这个空间是
x
善于分离True
和False
数据”,这样数据的这个空间表示可以与其他一些空间表示进行比较。还没有实现它,但我认为这会起作用:
- 使用k-means聚类定义数据聚类
- 计算
以获得特定集群在分离abs(0.5-numTrue/(numTrue+numFalse))*2
和True
数据方面的性能Flase
- 根据点数标准化每个簇的所有“优点”
- 将所有标准化的“好”相加,这将是一个空间有多好