Scikit learn can'；t通过python代码下载20个新闻组数据_Scikit Learn

Scikit learn can'；t通过python代码下载20个新闻组数据

scikit-learn

Scikit learn can'；t通过python代码下载20个新闻组数据,scikit-learn,Scikit Learn,我正在尝试在20news group上运行分类演示，我在这里下载py文件（）并像往常一样运行python代码，但出现以下错误，即存在网络连接超时错误，我有点困惑，因为我可以从提供的URL（）下载数据文件，有人知道如何解决此问题吗？我是否可以使用手动下载的数据文件环境： Python 3.6 Ananconda 5.0.1引用自： sklearn.datasets.fetch_20newsgroups功能是一种数据获取/缓存功能，可从原始的20个新闻组网站下载数据存档，提取~/scikit\u

我正在尝试在20news group上运行分类演示，我在这里下载py文件（）并像往常一样运行python代码，但出现以下错误，即存在网络连接超时错误，我有点困惑，因为我可以从提供的URL（）下载数据文件，有人知道如何解决此问题吗？我是否可以使用手动下载的数据文件

环境： Python 3.6 Ananconda 5.0.1引用自：

sklearn.datasets.fetch_20newsgroups

功能是一种数据获取/缓存功能，可从原始的20个新闻组网站下载数据存档，提取~/scikit\u learn\u data/20news\u home文件夹中的存档内容，并调用

sklearn.datasets.load\u文件（位于训练集或测试集文件夹或两者上）
只需将手动下载的文件解压缩到指定文件夹，即可使用该文件


或者，在调用fetch\u 20newsgroups
函数时，可以通过传递data\u home='/path/to/data'
来指定数据文件夹。将函数调用更改为如下所示：
data_train = fetch_20newsgroups(data_home='/path/to/data',
                                subset='train', categories=categories,
                                shuffle=True, random_state=42,
                                remove=remove)

data_test = fetch_20newsgroups(data_home='/path/to/data',
                               subset='test', categories=categories,
                               shuffle=True, random_state=42,
                               remove=remove)

错误详细信息：do_open（self，http_类，req，**http_conn_args）1317 h.request（req.get_method（）中的TimeoutError回溯（最近一次调用）~\AppData\Local\Continuum\anaconda3\lib\urllib\request.py，req.selector，req.data，headers，->1318 encode_chunked=req.has_header（'Transfer-encoding'））1319除了OSError as err:#超时错误可能您正在使用代理和/或anaconda不允许访问它们。