Nlp 如何开始信息提取?

Nlp 如何开始信息提取?,nlp,information-extraction,Nlp,Information Extraction,在信息提取方面,我是个新手。在过去的几天里,我读了很多学术论文,并订购了一本关于NLP的书。我想知道如何构建一个类似FlipDog.com的系统(希望不是从头开始)。他们从60000多家公司的网站上提取职位空缺。我如何开始 我愿意学习任何编程语言。有人用过木槌/大门/小飞鸟或跑路者吗?理想情况下,我希望能够使用特定于我的领域的数据集来训练一个系统,并让它在此基础上提取信息。为此,您建议使用哪个平台 谢谢 提取工作机会的更快方法是使用(网站上的web服务)。您可以很容易地教dapper使用Visu

在信息提取方面,我是个新手。在过去的几天里,我读了很多学术论文,并订购了一本关于NLP的书。我想知道如何构建一个类似FlipDog.com的系统(希望不是从头开始)。他们从60000多家公司的网站上提取职位空缺。我如何开始

我愿意学习任何编程语言。有人用过木槌/大门/小飞鸟或跑路者吗?理想情况下,我希望能够使用特定于我的领域的数据集来训练一个系统,并让它在此基础上提取信息。为此,您建议使用哪个平台


谢谢

提取工作机会的更快方法是使用(网站上的web服务)。您可以很容易地教dapper使用VisualEditor提取数据。当你的目标网站上有表格时,它工作得非常好

要学习信息提取,我建议从。它是一个用于信息提取的java框架,因此您不需要学习框架的特定于体系结构的特性,例如Gate或ApacheUIMA。在lingpipe网站上,你会发现许多教程,这些教程将帮助你学习各种信息提取方法。之后我建议学习Gate和UIMA

如果您想实现这样一个网站,还需要学习如何使用web爬虫框架(例如)、web搜索引擎()和信息检索引擎(例如)在提取的数据之上提供搜索服务

更新:


对于python,最好从以下内容开始:

非常感谢!我将开始看短小精悍和短笛