r语言中的低内存特征选择

r语言中的低内存特征选择,r,memory,feature-selection,R,Memory,Feature Selection,我正在一个大型语料库上建立一个文本分类模型,但是,由于我在模型中使用了超过15k的特征,所以拟合模型需要很长时间。所以我想通过特征选择来减少这一点。大多数普通的功能选择,如findCorrelation()和rfeControl会导致内存问题。你们知道不需要大量内存的特征选择方法吗 注: -这已经是完整语料库中的一小部分,因此,进一步细分并不理想。 -我已经在开发最强大的工作空间。您是否考虑过对您的特征进行子集设置,而不是对语料库进行子集设置?是否使用稀疏特征矩阵?您的绝大多数功能可能都是高度稀

我正在一个大型语料库上建立一个文本分类模型,但是,由于我在模型中使用了超过15k的特征,所以拟合模型需要很长时间。所以我想通过特征选择来减少这一点。大多数普通的功能选择,如
findCorrelation()
rfeControl
会导致内存问题。你们知道不需要大量内存的特征选择方法吗

注: -这已经是完整语料库中的一小部分,因此,进一步细分并不理想。
-我已经在开发最强大的工作空间。

您是否考虑过对您的特征进行子集设置,而不是对语料库进行子集设置?是否使用稀疏特征矩阵?您的绝大多数功能可能都是高度稀疏的: