Java 如何在OpenNLP中使用自定义拆分字符扩展SentenceDetector?

Java 如何在OpenNLP中使用自定义拆分字符扩展SentenceDetector?,java,nlp,opennlp,Java,Nlp,Opennlp,我试图在句子检测器模型(OpenNLP)中添加自定义功能。默认情况下,它根据这些字符进行检测!。我想添加一个新角色,以便我的模型将基于该角色进行检测 你能建议我如何实现吗?因为你可以使用语句检测器工厂。它的构造函数允许您注入自定义的句末(eos)字符(请参阅): SentenceDetectorFactory(字符串语言代码、布尔useTokenEnd、字典缩写字典、字符[]) 结合SentenceDetectorME我们在相应的 公共句子检测器(句子模型, 工厂(工厂) 不赞成。使用Sente

我试图在句子检测器模型(OpenNLP)中添加自定义功能。默认情况下,它根据这些字符进行检测!。我想添加一个新角色,以便我的模型将基于该角色进行检测

你能建议我如何实现吗?

因为你可以使用
语句检测器工厂。它的构造函数允许您注入自定义的句末(eos)字符(请参阅):

SentenceDetectorFactory(字符串语言代码、布尔useTokenEnd、字典缩写字典、字符[])

结合
SentenceDetectorME
我们在相应的

公共句子检测器(句子模型, 工厂(工厂)

不赞成。使用SentenceDetectorFactory扩展SentenceDetector功能

因此,您可以通过扩展
SentenceDetectorME
来实现自己的
SentenceDetectorFactory
实现,然后使用其他字符检测句子结尾

希望能有帮助