斯坦福大学corenlp,分句,缩写例外

斯坦福大学corenlp,分句,缩写例外,nlp,stanford-nlp,Nlp,Stanford Nlp,斯坦福Corenlp中是否有指定缩写的选项? 例如在句子中:原因pt。待在家里就是休息。pt是patient的缩写,corenlp错误地将其分成两句 我想知道如何将缩写列表传递给斯坦福的标记器。简短的回答是“不,目前没有办法指定自定义缩写”(据我所知)。较长的答案是,此代码位于*.flex文件中,您可以向其中添加自定义缩写。我想应该在ABBREV1的定义下这样做。我更改了文件并重新编译,但它不起作用。我在第641行的ABBREV1中添加了我的缩写。是否应以不同的方式编译.flex文件?是的,您可

斯坦福Corenlp中是否有指定缩写的选项? 例如在句子中:
原因pt。待在家里就是休息。
pt是patient的缩写,corenlp错误地将其分成两句


我想知道如何将缩写列表传递给斯坦福的标记器。

简短的回答是“不,目前没有办法指定自定义缩写”(据我所知)。较长的答案是,此代码位于
*.flex
文件中,您可以向其中添加自定义缩写。我想应该在ABBREV1的定义下这样做。

我更改了文件并重新编译,但它不起作用。我在第641行的ABBREV1中添加了我的缩写。是否应以不同的方式编译.flex文件?是的,您可能需要使用jflex编译该文件。您是否特别关注临床/医学语言?如果是这样,那么就不要使用斯坦福corenlp。切换到专门研究生物医学NLP的工具包。公平的警告是,对于NLP来说,这是一个非常困难的领域。