Nlp 我应该使用LingPipe还是NLTK来提取名称和位置?

Nlp 我应该使用LingPipe还是NLTK来提取名称和位置?,nlp,nltk,lingpipe,Nlp,Nltk,Lingpipe,我正在寻找从非常短的文本中提取姓名和位置的例子 "cardinals vs jays in toronto" " Daniel Nestor and Nenad Zimonjic play Jonas Bjorkman w/ Kevin Ullyett, paris time to be announced" "jenson button - pole position, brawn-mercedes - monaco". “多伦多红雀队对松鸦队” “丹尼尔·内斯特和内纳德·齐蒙吉奇扮演乔纳斯

我正在寻找从非常短的文本中提取姓名和位置的例子

"cardinals vs jays in toronto" " Daniel Nestor and Nenad Zimonjic play Jonas Bjorkman w/ Kevin Ullyett, paris time to be announced" "jenson button - pole position, brawn-mercedes - monaco". “多伦多红雀队对松鸦队” “丹尼尔·内斯特和内纳德·齐蒙吉奇扮演乔纳斯·比约克曼和凯文·乌利耶特,巴黎时间待定” “简森-巴顿-杆位,布朗-梅赛德斯-摩纳哥”。 这些数据目前在MySQL数据库中,我(几乎)对每个运动员都有一个单独的记录,尽管名字有时拼写错误,等等

我想提取运动员和地点。 我通常在PHP中工作,但还没有找到一个用于实体提取的库(我可能想在将来更深入地了解一些)

从我的发现来看,这似乎是最受推荐的,但我不知道这两种方法是否真的适合我的目的,或者其他方法是否会更好

我没有用Java或Python编程,所以在开始学习新语言之前,我希望得到一些关于我应该遵循的路线的建议或其他建议。

您所描述的是。因此,如果你还没有看过,我建议你看看关于这个话题的另一个。看起来对我来说是最有用的答案

我无法评论NLTK或LingPipe是否最适合此任务,尽管从答案来看,似乎还有很多其他资源是用Java编写的


使用NLTK的一个优点是Python作为一种语言非常容易访问。另一个优点是(免费提供)同时提供了Python和NLTK的介绍,这对您很有用。

“…每个运动员都有一个单独的表格…”您是说每个运动员都有一个记录吗?(否则的话,那会有很多桌子……)耶!如果每个运动员都有一个单独的表格,那么语言/模块将是我的最小问题!谢谢你指出这一点。