Python 机器学习-使用算法检查文档是否有效

Python 机器学习-使用算法检查文档是否有效,python,machine-learning,Python,Machine Learning,我是机器学习新手。我需要预测文件是否有效。这里我只有10000份有效文件(没有任何无效文件)。我看到了一些ex算法:NaiveByes、SVM等。。这里的概念是训练模型,我们必须提供两种类型的文档(有效和无效),然后它只能通过比较两种训练文档来预测文档 是否有任何流程或算法,使用此流程或算法,我们可以通过仅使用有效文档来表示文档有效或无效(可能以百分比表示,例如:40%有效和60%无效)?一种方法是使用一类分类。在机器学习中,一类分类(OCC)尝试 通过从中学习来识别特定类的对象 仅包含该类对象

我是机器学习新手。我需要预测文件是否有效。这里我只有10000份有效文件(没有任何无效文件)。我看到了一些ex算法:NaiveByes、SVM等。。这里的概念是训练模型,我们必须提供两种类型的文档(有效和无效),然后它只能通过比较两种训练文档来预测文档


是否有任何流程或算法,使用此流程或算法,我们可以通过仅使用有效文档来表示文档有效或无效(可能以百分比表示,例如:40%有效和60%无效)?

一种方法是使用一类分类。在机器学习中,一类分类(OCC)尝试 通过从中学习来识别特定类的对象 仅包含该类对象的训练集。这个 OCC中的任务是围绕 正(目标)类,以便它接受尽可能多的对象 可能来自积极类,同时最小化机会 接受负面(离群值)对象的方法。这是一对一
分类,其余部分在培训期间未观察到。在您的情况下,模型将学习对有效文档进行分类和标识,其余为无效文档。

您应该在此处提出问题: