Machine learning 我的半监督线性判别分析根本不起作用

Machine learning 我的半监督线性判别分析根本不起作用,machine-learning,classification,data-mining,static-methods,linear-discriminant,Machine Learning,Classification,Data Mining,Static Methods,Linear Discriminant,我正在研究LDA(线性判别分析),你可以参考 我关于半监督LDA的想法:我可以使用R^{d\times N}$中的标记数据$X\N来计算$S_w$和$S_b$中的所有术语。现在,我还有未标记的数据$Y\in R^{d\times M}$,这样的数据可以额外用于估计协方差矩阵$XX^T$in$S_w$乘以$\frac{N}{N+M}(XX^T+YY^T)$,直观地得到更好的协方差估计 不同LDA的实现:我还为所有比较方法的$S_w$添加了一个缩放单位矩阵,缩放参数应在不同方法中进行调整。我将训练

我正在研究LDA(线性判别分析),你可以参考

我关于半监督LDA的想法:我可以使用R^{d\times N}$中的标记数据$X\N来计算$S_w$和$S_b$中的所有术语。现在,我还有未标记的数据$Y\in R^{d\times M}$,这样的数据可以额外用于估计协方差矩阵$XX^T$in$S_w$乘以$\frac{N}{N+M}(XX^T+YY^T)$,直观地得到更好的协方差估计

不同LDA的实现:我还为所有比较方法的$S_w$添加了一个缩放单位矩阵,缩放参数应在不同方法中进行调整。我将训练数据分为两部分:在R^{d\times N}$中标记为$X\N,在R^{d\times M}$中标记为$Y\N,其中$N/M$从$0.5$到$0.05$。我在三种真实数据集上运行我的半监督LDA

如何进行分类:将$S_w^{-1}S_b$的特征向量用作转换矩阵$\Phi$,然后

实验结果:1)在测试数据中,我在$X$和$Y$数据上训练的半监督LDA的分类精度总是比仅在$X$数据上训练的标准LDA稍差。2) 此外,在一个实际数据中,这两种方法的最佳缩放参数可能会非常不同,以达到最佳分类精度


你能告诉我原因并给我建议让我的半监督LDA工作吗?我的密码已经查过了。非常感谢。

我使用图像数据MNIST以及其他数据集UCI Ioslet和UCI-HAR。对于一个特定的数据集,我假设它的子集Y和X具有相同的分布。他们在不同阶层中所占的比例大致相同。我的一个猜测是,平均向量(每类的经验质心)对LDA的分类有很大的影响,但是,我的半监督LDA不能利用Y来计算平均向量。我的半监督LDA只是遵循常识,即更多的数据可以得到更好的协方差矩阵估计,这有助于在协方差矩阵中获得更好的学习模型性能。你能分享你的数据样本和代码吗?@SandipanDeyS