R中的核岭回归(用于药物-靶点相互作用)

R中的核岭回归(用于药物-靶点相互作用),r,machine-learning,kernel,regression,R,Machine Learning,Kernel,Regression,很难找到关于实现KRR的任何信息,因此任何微小的输入都将受到高度赞赏 我想在我计算过的一组内核上运行内核岭回归,但我不知道如何在R中实现。我从CVST包中找到了ConstructorKrlerLearner函数,但手册一点也不清楚,特别是对于我这个机器学习的完全初学者来说。这个函数需要x和y,但我不知道在那里输入什么,因为我只有一个数据帧,它的成对内核被计算为药物和蛋白质之间的kronecker乘积 如何在R中执行内核岭回归任务 理想情况下,我还希望可视化我的数据点,然后在绘图上显示回归线!例如

很难找到关于实现KRR的任何信息,因此任何微小的输入都将受到高度赞赏

我想在我计算过的一组内核上运行内核岭回归,但我不知道如何在R中实现。我从CVST包中找到了ConstructorKrlerLearner函数,但手册一点也不清楚,特别是对于我这个机器学习的完全初学者来说。这个函数需要x和y,但我不知道在那里输入什么,因为我只有一个数据帧,它的成对内核被计算为药物和蛋白质之间的kronecker乘积

如何在R中执行内核岭回归任务

理想情况下,我还希望可视化我的数据点,然后在绘图上显示回归线!例如:

关于我的数据集的更多信息

我有一个药物靶点相互作用(DTI)数据集。数据集包括100种药物化合物(行)和100种蛋白激酶靶点(列)。此数据集中存在一些NAN(缺少值)。此数据集中的值反映化合物与目标结合的紧密程度

我有毒品的微笑和化学药品

我有蛋白质的(目标)序列和UNIPROT ID

对于药物[100种药物]:我将药物微笑转换为SDFset,然后使用OpenBabel计算每种药物的指纹。根据这些指纹,我计算了所有可能的药物组合的谷本核。(使用“fpSim”功能),例如,药物1与药物2、3、4。。。10然后药物2和药物1,3,4。。。100,依此类推,直到药物99与药物100。我把这种碱粒命名为药粒

对于蛋白质:我有蛋白质序列,所以我计算了所有蛋白质对组合的史密斯-沃特曼分数;e、 g.蛋白质1与蛋白质2、3、。。。100,然后是蛋白质2和蛋白质1,3,4。。。100等等,直到蛋白质99与蛋白质100结合。我把这个碱基叫做蛋白质

然后我计算了碱-药物-蛋白质-核之间的克朗内克系数,这给了我一个100000000个元素的矩阵。我把这个矩阵命名为KRONECKER_产品

我希望在矩阵KRONECKER_产品上运行内核岭回归