Testing 半监督学习&x27;s测试数据

Testing 半监督学习&x27;s测试数据,testing,machine-learning,training-data,Testing,Machine Learning,Training Data,半监督学习使用一组标记数据(L)训练模型预测一组未标记数据(U),然后将新标记数据(L')和原始标记数据(L)分组为完整的标记数据 我想问一下如何提取测试数据 我应该从(L’)中提取测试数据 我应该从(L)中提取测试数据 哪一个是对的 如果测试数据是从(L union L')中提取的,则结果没有意义,因为L'中的答案可能是错误的 ====================================================================================

半监督学习使用一组标记数据(L)训练模型预测一组未标记数据(U),然后将新标记数据(L')和原始标记数据(L)分组为完整的标记数据

我想问一下如何提取测试数据

  • 我应该从(L’)中提取测试数据
  • 我应该从(L)中提取测试数据
  • 哪一个是对的

    如果测试数据是从(L union L')中提取的,则结果没有意义,因为L'中的答案可能是错误的

    ========================================================================================================================编辑新内容

    我有另一个想法

    三,。 我应该在开始时将标记数据(L)拆分为训练数据(L_-train)和测试数据(L_-test)

    然后使用L_序列训练模型,并使用它预测一组未标记数据(U),然后将预测结果(L’)和L_序列分组

    并且,使用(L_train union L')训练模型,以便在L_测试上进行测试

    1,2,3中哪一个是对的?
    感谢您的回复。

    您将在
    L
    上培训分类器。您可以首先执行交叉验证以适合某些方法参数
    P
    。使用参数
    P
    可以从标记的数据
    L
    构建模型
    M
    。然后使用模型
    M
    标记未标记的数据
    U
    。您可以使用
    L
    加入
    U
    中的示例(在指定的类中信心最高)。然后重复该过程,直到所有示例都被分类

    -编辑-

    我认为最合适的方法是第三种。但我可能不太明白,所以就这样吧


    您将
    L
    拆分为
    L\u列
    L\u测试
    。您可以使用
    L\U train
    训练分类器,还可以使用该分类器对
    U
    进行分类(按照我上面介绍的方法)。从标记的
    U
    L\U序列的并集
    构建一个新的分类器,并用它对
    L\U测试进行分类。这些分类的差异可用于评估措施(分类准确度等)。

    如果我想评估绩效,我应该怎么做?我只是想问一下如何获得测试数据。。。从半监督学习前的标记数据(L)或半监督学习后的完整标记数据(L’)?非常感谢你。我明白了。你的问题不清楚。听起来L'是测试数据。