R 尺度LDA决策边界

R 尺度LDA决策边界,r,classification,lda,linear-discriminant,R,Classification,Lda,Linear Discriminant,我有一个相当非传统的问题,很难找到解决办法。非常感谢你的帮助 我有4个基因(特征),这里我的分类是二进制的(0和1)。经过反复的讨论,我最终决定使用LDA进行分类。我对同两个班级进行了不同的研究,并在每项研究中使用这4个基因训练了我的模型 我想以点图的形式将LDA分数可视化。如下所示,每个部分代表不同的研究/数据集。X轴上该数据集的样本和我使用- lda\u模型=lda(公式=class~,数据=train) 在Y轴上预测(lda_模型,列车) 因为我在每个数据集上训练了不同的模型,所以我们可

我有一个相当非传统的问题,很难找到解决办法。非常感谢你的帮助

我有4个基因(特征),这里我的分类是二进制的(0和1)。经过反复的讨论,我最终决定使用LDA进行分类。我对同两个班级进行了不同的研究,并在每项研究中使用这4个基因训练了我的模型

我想以点图的形式将LDA分数可视化。如下所示,每个部分代表不同的研究/数据集。X轴上该数据集的样本和我使用-
lda\u模型=lda(公式=class~,数据=train)
在Y轴上预测(lda_模型,列车)

因为我在每个数据集上训练了不同的模型,所以我们可以清楚地看到每个数据集的决策边界(我假设是黑线)是不同的,并且具有不同的规模。但是,我想缩放Y轴上的值,这样我的所有数据集都在同一个比例上,我可以用一个决策边界来表示这个图(同样,我可以在图上清楚地画一些东西,比如红线)

这里的LD1值是-a(GeneA)+b(GeneB)+c(GeneC)+d(GeneD)-平均值(a(GeneA)+b(GeneB)+c(GeneC)+d(GeneD))。这是针对每个数据集单独完成的。然而,这并不完全等于我们可以用logistic回归得到的(a(GeneA)+b(GeneB)+c(GeneC)+d(GeneD)+截距)。我试图找到那个值或某种方法,可以使用LDA在所有数据集上缩放Y轴


谢谢你的帮助

我做了一个“最小-最大”缩放,看起来效果不错。它在所有数据集中缩放我的所有数据点,决策边界为零