Machine learning 需要一个标签(输出基数)多于特征(输入基数)的数据集

Machine learning 需要一个标签(输出基数)多于特征(输入基数)的数据集,machine-learning,dataset,bigdata,multilabel-classification,Machine Learning,Dataset,Bigdata,Multilabel Classification,对于分类或回归问题,如果 “X”是大小为m X n的输入矩阵 和 “Y”是大小为m X k的预期输出/标签矩阵 然后我需要一个数据集,其中k>=n。 (如有可能,“Y”应为高密度标签) 此时,标签/输出的数量超过了输入要素空间。 你能给我推荐一个这样的数据集吗 在这方面,是许多多标签数据集,其中一个有500个标称属性和983个标签。 您还可以获取其他数据集并删除某些特征(随机或通过特征选择),使其计数小于标签。上有许多这样的数据集。 它包含许多分类、回归、多标签和字符串数据集。许多来自UCI、S

对于分类或回归问题,如果

“X”是大小为m X n的输入矩阵 和 “Y”是大小为m X k的预期输出/标签矩阵

然后我需要一个数据集,其中k>=n。 (如有可能,“Y”应为高密度标签)

此时,标签/输出的数量超过了输入要素空间。 你能给我推荐一个这样的数据集吗

在这方面,

是许多多标签数据集,其中一个有500个标称属性和983个标签。
您还可以获取其他数据集并删除某些特征(随机或通过特征选择),使其计数小于标签。

上有许多这样的数据集。
它包含许多分类、回归、多标签和字符串数据集。许多来自UCI、Statlog、StatLib和其他集合。

为什么需要这样的数据集?