Python 3.x nltk数据的替代源

Python 3.x nltk数据的替代源,python-3.x,nltk,Python 3.x,Nltk,我正试图通过文档中提到的这些命令安装nltk语料库- import nltk nltk.download() 然而,我是在我愚蠢的组织中这样做的,它阻止了github,这正是上面的下载功能试图连接的 是否有nltk数据的备用存储库,我可以从中尝试这一点?试图将github和相关网站列入白名单只会陷入繁文缛节 谢谢您可以尝试下载Arch Linux包for nltk,其中包含您需要的所有文件 使用右侧“软件包操作”框中的“从镜像下载”链接从下载软件包,也可以直接使用 解压缩该文件(它是一个xzi

我正试图通过文档中提到的这些命令安装nltk语料库-

import nltk
nltk.download()
然而,我是在我愚蠢的组织中这样做的,它阻止了github,这正是上面的下载功能试图连接的

是否有nltk数据的备用存储库,我可以从中尝试这一点?试图将github和相关网站列入白名单只会陷入繁文缛节


谢谢

您可以尝试下载Arch Linux包for nltk,其中包含您需要的所有文件

  • 使用右侧“软件包操作”框中的“从镜像下载”链接从下载软件包,也可以直接使用
  • 解压缩该文件(它是一个xzipped tar归档文件)。我在linux上使用了ark,不确定适合您的系统的软件是什么(在Windows7ZIP和winrar上应该能够处理这个问题)
  • 您可以在文件夹
    usr/share/nltk\u data
    中找到这些文件
  • nltk_data
    文件夹移动到计算机上的

  • 有一段时间,GitHub实际上阻止了对
    nltk_数据的所有获取,导致该数据仍然处于打开状态,并且包含许多解决方法,并计划避免依赖GitHub托管

    现任“官员”是:

    由于,我开始在openSUSE构建服务(OBS)存储库中构建RPM

    例如,对于
    punkt
    数据,
    .spec
    文件为。很容易将其复制到其他数据包中

    要从OBS在Fedora生皮上安装:

    dnf config-manager --add-repo http://download.opensuse.org/repositories/home:jayvdb:nltk_data/Fedora_Rawhide/home:jayvdb:nltk_data.repo
    dnf install nltk-data-punkt
    

    OBS提供了更多下载说明。

    nltk数据的布局非常简单。在有权访问github的计算机上运行
    nltk.download()
    ,下载您感兴趣的资源(如果您还不知道,我建议使用“book”捆绑包),然后找到生成的
    nltk_data
    文件夹,然后将层次结构复制到您的工作计算机上nltk可以找到它的位置。(例如,查看下载程序试图将其安装到何处)。

    如我所说,组织已阻止github,这就是为什么我正在寻找另一个数据源,希望它不会被阻止。我正在使用下面@m00am提供的解决方案-如果它有效,我将在周一更新。此外,我的工作计算机没有CD驱动器,没有USB端口,并且按照政策工作,如果他们没有使用/听说过某个站点,那么它肯定是色情的,让我休息一下。如果你真的无法将自己的一些数据复制到你的工作计算机上,请给你的IT人员带一个带有nltk文件夹的U盘,让他们将其复制到你的计算机上。这是解决我问题的正确答案。如果任何其他Linux发行版也有zip包,请在评论中提及同样的问题。你把它分类了吗?看看下面的解决方案。这也不起作用吗?另一个被阻止的源:(
    dnf config-manager --add-repo http://download.opensuse.org/repositories/home:jayvdb:nltk_data/Fedora_Rawhide/home:jayvdb:nltk_data.repo
    dnf install nltk-data-punkt