C# Mallet作为二值分类器在文档分类中的应用
我使用Mallet实现了一个文档分类工具,它将文档的每一页分类为特定的类别。我也试过Weka,但在这方面Mallet比Weka聪明。我的做法如下:C# Mallet作为二值分类器在文档分类中的应用,c#,machine-learning,classification,document-classification,mallet,C#,Machine Learning,Classification,Document Classification,Mallet,我使用Mallet实现了一个文档分类工具,它将文档的每一页分类为特定的类别。我也试过Weka,但在这方面Mallet比Weka聪明。我的做法如下: 将文档的页面训练到已知类别 测试一些示例文档,看Mallet是否识别某个类别的页面。这里,木槌与已知类别的测试集相匹配 若测试成功并且令人满意,那个么使用分类器和mallet文件在巨大的文档库上运行 该部分已经实现,成功率很高 对于我没有训练过且与已知类别不同的文本文档,应该作为不匹配返回,Mallet正在尝试从训练集中为Mallet未知的文档查找匹
NA
谢谢你的建议。我已经在使用你提到的第一点。我已保持阈值,即60%,低于我放弃的60%置信度。需要通过scikit学习工具和算法。