Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/360.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java NLP新手,关于注释的问题_Java_Annotations_Nlp - Fatal编程技术网

Java NLP新手,关于注释的问题

Java NLP新手,关于注释的问题,java,annotations,nlp,Java,Annotations,Nlp,我是NLP新手,我正在寻找一个起点,在一些教程、文档或示例代码方面。 我被告知要研究处理自然文本以从中提取结构化数据的可能性。 例如,我想从以下语句中提取(注释)身高和体重。 “他身高6英尺,体重200磅”或 “他的身高是6英尺,体重是200”等等。 我研究过UIMA,但它看起来像是一个没有培训功能的自创正则表达式词典。 简而言之,我可以使用什么Java框架来创建一个可以训练的注释引擎呢! 在此方面的任何帮助(指点)都将不胜感激。 谢谢你,因为你要的是指针:(上面已经提到)和 注意:如果Pyth

我是NLP新手,我正在寻找一个起点,在一些教程、文档或示例代码方面。 我被告知要研究处理自然文本以从中提取结构化数据的可能性。 例如,我想从以下语句中提取(注释)身高和体重。 “他身高6英尺,体重200磅”或 “他的身高是6英尺,体重是200”等等。 我研究过UIMA,但它看起来像是一个没有培训功能的自创正则表达式词典。 简而言之,我可以使用什么Java框架来创建一个可以训练的注释引擎呢! 在此方面的任何帮助(指点)都将不胜感激。
谢谢你,因为你要的是指针:(上面已经提到)和


注意:如果Python是一个选项,那么您可以使用。

如果您真的想使用机器学习来训练注释员,那么这可能是您最好的选择。请看一下他们指南中关于的章节。

我会使用NER。以下是我看到的输入文本的输出:

您可以在这里尝试:

@NLP如果你觉得Stompchick的答案有帮助的话,别忘了给它投票。+1,最好的开始是使用NLP编程框架,因为在这个阶段,初学者不需要浪费时间去了解解决方案的架构细节,比如GATE或apache UIMA。@Skarab我不同意,@NLP表示他想创建一个用于事实提取的注释引擎,而这正是GATE和UIMA的设计目的。上面提到的库将进行词汇和语法分析,但之后还有很多工作要做。@StompChicken最近我指导了一个学生项目,参与者决定使用ApacheUIMA。他们真的花了很多时间,才学会建造第一条真正的开采管道。就我个人而言,我使用UIMA,我可以推荐它,但在第一次体验lingpipe或自然语言工具包之后,@Skarab我不能否认UIMA非常重,而且很难开始使用。顺便说一句,我认为盖茨在这方面要容易得多。我只是认为这是必要的,以建立一个足够灵活的系统,以实际做一些有用的。顺便说一句。为了了解信息提取技术的起源,我建议阅读Sunita Sarawagi最近的一项调查-