使用Java从tweet文本中查找城市、国家和公司名称

使用Java从tweet文本中查找城市、国家和公司名称,java,text,twitter,nlp,Java,Text,Twitter,Nlp,我正在尝试构建一个示例应用程序,在该应用程序中,我希望解析一条推文并查找城市名称, 推特上的国家名称和公司名称 要做到这一点,最愚蠢的方法是维护列表 国家、城市和公司的名称,并在推文中找到这些名称,但是 每次我想添加新内容时,方法都需要更改 有没有一个库可以解析字符串并给我这些信息?或者你能给我建议一条我应该走的路吗 假设tweet都具有相同的结构,并且您想要的信息不是块文本,您可以编写一个简单的解析器来获取信息。您正在寻找命名实体识别。ApacheStanbol的组件为NER服务提供RESTf

我正在尝试构建一个示例应用程序,在该应用程序中,我希望解析一条推文并查找城市名称, 推特上的国家名称和公司名称

要做到这一点,最愚蠢的方法是维护列表 国家、城市和公司的名称,并在推文中找到这些名称,但是 每次我想添加新内容时,方法都需要更改


有没有一个库可以解析字符串并给我这些信息?或者你能给我建议一条我应该走的路吗

假设tweet都具有相同的结构,并且您想要的信息不是块文本,您可以编写一个简单的解析器来获取信息。

您正在寻找命名实体识别。

ApacheStanbol的组件为NER服务提供RESTful API。您只需将tweet内容提供给Stanbol,它就为您提供了增强功能,即人员、地点、组织作为增强功能

您可以尝试演示服务器:


您能给出几个您希望能够使用此方法解析的tweet示例吗?