Machine learning 如何将两种(或多种)特征组合为一个最终特征来构建分类模型?

Machine learning 如何将两种(或多种)特征组合为一个最终特征来构建分类模型?,machine-learning,classification,feature-extraction,feature-selection,Machine Learning,Classification,Feature Extraction,Feature Selection,目前,我遇到了这样一个问题:如何将两种(或多种)特征组合为一种最终特征来构建分类模型 例如,我想做一个分类模型来预测药物-靶相互作用,这里对于每种药物我可以得到500个特征,每个靶我可以得到800个特征(这两种特征是相互独立的)。众所周知,一种简单的方法是将这两种特征组合在一起,这两种特征加在一起(即每个药物靶对的500+800=1300特征) 有人知道其他方法来做这类事情,并使用组合特征来建立分类模型吗?有很多方法,即使有这么多的特征,也应该可以很好地工作,比如SVM 此外,还有大量关于这方面

目前,我遇到了这样一个问题:如何将两种(或多种)特征组合为一种最终特征来构建分类模型

例如,我想做一个分类模型来预测药物-靶相互作用,这里对于每种药物我可以得到500个特征,每个靶我可以得到800个特征(这两种特征是相互独立的)。众所周知,一种简单的方法是将这两种特征组合在一起,这两种特征加在一起(即每个药物靶对的500+800=1300特征)


有人知道其他方法来做这类事情,并使用组合特征来建立分类模型吗?

有很多方法,即使有这么多的特征,也应该可以很好地工作,比如SVM


此外,还有大量关于这方面的文献,包括SVD、PCA、MDS、特征选择、特征变换。。。您必须仔细阅读这些内容,我们无法在没有数据的情况下为您从所有这些内容中找出您的灵丹妙药。

Random Forest使用信息增益为您的分类任务选择最佳功能。分类器适用于多种特征源和类型。例如,可以组合连续属性和离散属性

训练时间稍长一些,因为您必须多次迭代所有特征,但内存性能和分类速度很慢
很好

谢谢你,Anony Mouse。我对PCA、SVD等方法有一点了解。另一种方法,如论文中使用的核方法:“蛋白质-配体相互作用预测:一种改进的化学基因组学方法”。药物靶点对的核
K=K_靶点kronecker K_药物
。然后采用基于Commo核的方法建立模型。但是计算和存储成本是巨大的,我想知道,是否有一些本地人为药物靶点对构建这样的内核,或者有一些方法结合不同的领域特征。谢谢你,你有多少人的记录?内核函数本身可以很好地伸缩。试试线性支持向量机。对于目标,我有664条记录,对于药物,我有445条记录。因此,对于计算K_靶点kronecker K_药物,它是K_664*664 kronecker K_445*445。最终矩阵太大,无法保存到内存中。