Java 使用Lingpipe实现单词级语言模型

Java 使用Lingpipe实现单词级语言模型,java,nlp,classification,document-classification,Java,Nlp,Classification,Document Classification,我一直在尝试在lingpipe上使用一个单词级语言模型。我遇到的所有示例和教程都显示了character-n-gram模型。如何使用lingpipe来训练单词级模型,然后使用该模型在其他文档上进行测试 此外,我注意到TokenizedLM是不可序列化的。我是否无法保存它并在以后加载,而不必每次都进行重新训练 最后,还有没有其他框架/工具可以让我不用编写任何代码就可以做到这一点呢?我不知道Java,但如果你不一定要使用这种编程语言,那就是Python,它有很多功能。还有一个可以用作介绍和概述的 我

我一直在尝试在lingpipe上使用一个单词级语言模型。我遇到的所有示例和教程都显示了character-n-gram模型。如何使用lingpipe来训练单词级模型,然后使用该模型在其他文档上进行测试

此外,我注意到TokenizedLM是不可序列化的。我是否无法保存它并在以后加载,而不必每次都进行重新训练


最后,还有没有其他框架/工具可以让我不用编写任何代码就可以做到这一点呢?

我不知道Java,但如果你不一定要使用这种编程语言,那就是Python,它有很多功能。还有一个可以用作介绍和概述的

我知道NLTK,而且我也不以任何方式绑定到Java。这是一个“因为它存在”的问题。我发现这个包对语言模型非常有用。这些链接无法使用-它们指的是需要登录的服务器。如果您希望您的答案有帮助,请将其替换为指向可公开访问的文档的链接(假设这就是您想要链接的内容)。