用python检测英文文本
嗯,我知道这个问题被问了很多次,但我仍然无法用“可用”的解决方案来解决它。希望得到更多关于如何检测我的句子的想法或概念,我的英语是python的。可用的解决方案:用python检测英文文本,python,api,python-2.7,nlp,Python,Api,Python 2.7,Nlp,嗯,我知道这个问题被问了很多次,但我仍然无法用“可用”的解决方案来解决它。希望得到更多关于如何检测我的句子的想法或概念,我的英语是python的。可用的解决方案: 语言检测器(ruby而非python:/) Google Translate API v2(不再免费,当我为学术目的做这个项目时,每月必须支付20美元。礼貌限制:0个字符/天) python语言标识(未找到源代码,链接如下。) (这不是为python 2.7准备的?我对python还不熟悉,有什么指南吗?我打赌这将是我需要的) NL
- 语言检测器(ruby而非python:/)
- Google Translate API v2(不再免费,当我为学术目的做这个项目时,每月必须支付20美元。礼貌限制:0个字符/天)
- python语言标识(未找到源代码,链接如下。)
- (这不是为python 2.7准备的?我对python还不熟悉,有什么指南吗?我打赌这将是我需要的)
- NLTK中的Wordnet(我不知道为什么缺少“Wordnet.Synset”,只有“Wordnet.Synset”可用。解决方案中的示例代码对我也不起作用,可能又出现版本控制问题了?)
- 将英语单词储存在列表中,比较单词是否存在(是的,这是一种不好的方法,而句子来自twitter和..你知道:P)
- Wiktionary API(使用Urllib2和simplejson对其进行解析。然后查找关键字是否为-1表示该单词不存在。否则它是英文的。当然,在twitter中使用时,必须将您的单词预处理为没有特殊字符,如@#,?!。有关如何查找关键字,请参阅此处。)
- Dogukan Tufekci的回答(勾选)(缺点:假设长度小于20个字符的句子必须安装PyEnchant,否则它将返回未知值。虽然PyEnchant不支持Python 2.7,但这意味着无法安装且无法使用长度小于20个字符的句子)