Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/336.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在Python中,有没有一种方法可以在不保留先前词汇表的情况下识别文本中的城市?_Python_Nlp_Nltk - Fatal编程技术网

在Python中,有没有一种方法可以在不保留先前词汇表的情况下识别文本中的城市?

在Python中,有没有一种方法可以在不保留先前词汇表的情况下识别文本中的城市?,python,nlp,nltk,Python,Nlp,Nltk,我必须在文档中标识城市(只有字符),我不想维护整个词汇表,因为这不是一个实用的解决方案。我也没有Azure文本分析api帐户 我已经尝试过使用Spacy,我做过ner并确定了地理位置,然后将输出传递给spellchecker()以训练模型。但问题是ner需要句子,而我的输入有单词 我对这个领域比较陌生。有一个列表可以帮助你, 但从我的经验来看,没有一个完美的图书馆。如果你知道文本中可能出现的所有城市,那么词汇是最好的选择你可以去图书馆看看 一个句子的工作示例: 输出: ['Minsk', 'Mi

我必须在文档中标识城市(只有字符),我不想维护整个词汇表,因为这不是一个实用的解决方案。我也没有Azure文本分析api帐户

我已经尝试过使用Spacy,我做过ner并确定了地理位置,然后将输出传递给spellchecker()以训练模型。但问题是ner需要句子,而我的输入有单词

我对这个领域比较陌生。

有一个列表可以帮助你, 但从我的经验来看,没有一个完美的图书馆。如果你知道文本中可能出现的所有城市,那么词汇是最好的选择

你可以去图书馆看看

一个句子的工作示例: 输出:

['Minsk', 'Minsk', 'Kiev', 'Moscow']
['London']
['Vilnius']
['Delhi']
单词列表的工作示例: 输出:

['Minsk', 'Minsk', 'Kiev', 'Moscow']
['London']
['Vilnius']
['Delhi']


这是另一种选择。但是,我发现geotext很轻,因为外部依赖性较少。

查看斯坦福德的NERTagger@halfer我听到你说的话,会记住的。谢谢。我仍然面临识别子区域的困难,例如:Thane或Gansoli。你能帮我解决这个问题吗?Thane或Ghansoli不是城市,对吗?我提到的图书馆负责检查城市。对于子区域,可以尝试使用geograpy:或Python 3: