如何在Python中为波兰语nltk安装ipipan语料库?
我发现nltk包含一些用于加载如何在Python中为波兰语nltk安装ipipan语料库?,python,python-2.7,nlp,nltk,Python,Python 2.7,Nlp,Nltk,我发现nltk包含一些用于加载ipipan模块的模块,但我无法加载模块-它不是下载列表nltk.download() 如果波兰语已包含在nltk中,我如何为波兰语附加ipipan 我在谷歌上找不到太多 我尝试过这样的代码,但它产生异常,无法找到ipipan: from nltk import corpus print dir(corpus.ipipan) print corpus.ipipan.words() 我是从link下载数据的-看起来是针对Poliqarp的,但我尝试附加它-可
ipipan
模块的模块,但我无法加载模块-它不是下载列表nltk.download()
如果波兰语已包含在nltk中,我如何为波兰语附加ipipan
我在谷歌上找不到太多
我尝试过这样的代码,但它产生异常,无法找到ipipan:
from nltk import corpus
print dir(corpus.ipipan)
print corpus.ipipan.words()
我是从link下载数据的-看起来是针对
Poliqarp
的,但我尝试附加它-可能需要更多的实验-我还发现了一些很好的波兰语资源页面-无论什么ipippan
都足以满足许多用途。看到这一点,它看起来非常好:可能ipipan语料库无法通过nltk downloader获得,因为ipipan中存在许可证或官僚主义。所以你们应该手动下载它(从官方网站ofc)并把它放在你们的下载目录中。我向ipipan模块的作者询问了数据,但他不知道在哪里可以下载数据。这很奇怪,因为模块的作者应该知道如何下载数据。我会再问他关于文件的事,也许这不是死代码。我认为这不是许可证或版权的问题——它可能是科学计划的结束,现在不受支持或过时——下一个nltk将包含现代波兰语料库,无论谁知道何时-:)