Machine learning 需要一个标签（输出基数）多于特征（输入基数）的数据集_Machine Learning_Dataset_Bigdata_Multilabel Classification

Machine learning 需要一个标签（输出基数）多于特征（输入基数）的数据集

machine-learning

Machine learning 需要一个标签（输出基数）多于特征（输入基数）的数据集,machine-learning,dataset,bigdata,multilabel-classification,Machine Learning,Dataset,Bigdata,Multilabel Classification,对于分类或回归问题，如果 “X”是大小为m X n的输入矩阵和 “Y”是大小为m X k的预期输出/标签矩阵然后我需要一个数据集，其中k>=n。（如有可能，“Y”应为高密度标签）此时，标签/输出的数量超过了输入要素空间。你能给我推荐一个这样的数据集吗在这方面，是许多多标签数据集，其中一个有500个标称属性和983个标签。您还可以获取其他数据集并删除某些特征（随机或通过特征选择），使其计数小于标签。上有许多这样的数据集。它包含许多分类、回归、多标签和字符串数据集。许多来自UCI、S

对于分类或回归问题，如果

“X”是大小为m X n的输入矩阵和 “Y”是大小为m X k的预期输出/标签矩阵

然后我需要一个数据集，其中k>=n。（如有可能，“Y”应为高密度标签）

此时，标签/输出的数量超过了输入要素空间。你能给我推荐一个这样的数据集吗

在这方面，

是许多多标签数据集，其中一个有500个标称属性和983个标签。

您还可以获取其他数据集并删除某些特征（随机或通过特征选择），使其计数小于标签。

上有许多这样的数据集。

它包含许多分类、回归、多标签和字符串数据集。许多来自UCI、Statlog、StatLib和其他集合。

为什么需要这样的数据集？