Testing 半监督学习&x27；s测试数据_Testing_Machine Learning_Training Data

Testing 半监督学习&x27；s测试数据

testing machine-learning

Testing 半监督学习&x27；s测试数据,testing,machine-learning,training-data,Testing,Machine Learning,Training Data,半监督学习使用一组标记数据（L）训练模型预测一组未标记数据（U），然后将新标记数据（L'）和原始标记数据（L）分组为完整的标记数据我想问一下如何提取测试数据我应该从（L’）中提取测试数据我应该从（L）中提取测试数据哪一个是对的如果测试数据是从（L union L'）中提取的，则结果没有意义，因为L'中的答案可能是错误的 ====================================================================================

半监督学习使用一组标记数据（L）训练模型预测一组未标记数据（U），然后将新标记数据（L'）和原始标记数据（L）分组为完整的标记数据

我想问一下如何提取测试数据

我应该从（L’）中提取测试数据

我应该从（L）中提取测试数据

哪一个是对的

如果测试数据是从（L union L'）中提取的，则结果没有意义，因为L'中的答案可能是错误的

========================================================================================================================编辑新内容

我有另一个想法

三,。我应该在开始时将标记数据（L）拆分为训练数据（L_-train）和测试数据（L_-test）

然后使用L_序列训练模型，并使用它预测一组未标记数据（U），然后将预测结果（L’）和L_序列分组

并且，使用（L_train union L'）训练模型，以便在L_测试上进行测试

1,2,3中哪一个是对的？

感谢您的回复。

您将在

上培训分类器。您可以首先执行交叉验证以适合某些方法参数

。使用参数

可以从标记的数据

构建模型

。然后使用模型

标记未标记的数据

。您可以使用

加入

中的示例（在指定的类中信心最高）。然后重复该过程，直到所有示例都被分类

-编辑-

我认为最合适的方法是第三种。但我可能不太明白，所以就这样吧

您将

拆分为

L\u列

和

L\u测试

。您可以使用

L\U train

训练分类器，还可以使用该分类器对

进行分类（按照我上面介绍的方法）。从标记的

和

L\U序列的并集

构建一个新的分类器，并用它对

L\U测试进行分类。这些分类的差异可用于评估措施（分类准确度等）。
如果我想评估绩效，我应该怎么做？我只是想问一下如何获得测试数据。。。从半监督学习前的标记数据（L）或半监督学习后的完整标记数据（L’）？非常感谢你。我明白了。你的问题不清楚。听起来L'是测试数据。