Scikit learn can';t通过python代码下载20个新闻组数据

Scikit learn can';t通过python代码下载20个新闻组数据,scikit-learn,Scikit Learn,我正在尝试在20news group上运行分类演示,我在这里下载py文件()并像往常一样运行python代码,但出现以下错误,即存在网络连接超时错误,我有点困惑,因为我可以从提供的URL()下载数据文件,有人知道如何解决此问题吗?我是否可以使用手动下载的数据文件 环境: Python 3.6 Ananconda 5.0.1引用自: sklearn.datasets.fetch_20newsgroups功能是一种数据获取/缓存功能,可从原始的20个新闻组网站下载数据存档,提取~/scikit\u

我正在尝试在20news group上运行分类演示,我在这里下载py文件()并像往常一样运行python代码,但出现以下错误,即存在网络连接超时错误,我有点困惑,因为我可以从提供的URL()下载数据文件,有人知道如何解决此问题吗?我是否可以使用手动下载的数据文件

环境: Python 3.6 Ananconda 5.0.1引用自:

sklearn.datasets.fetch_20newsgroups
功能是一种数据获取/缓存功能,可从原始的20个新闻组网站下载数据存档,提取~/scikit\u learn\u data/20news\u home文件夹中的存档内容,并调用
sklearn.datasets.load\u文件(位于训练集或测试集文件夹或两者上)

只需将手动下载的文件解压缩到指定文件夹,即可使用该文件


或者,在调用
fetch\u 20newsgroups
函数时,可以通过传递
data\u home='/path/to/data'
来指定数据文件夹。将函数调用更改为如下所示:

data_train = fetch_20newsgroups(data_home='/path/to/data',
                                subset='train', categories=categories,
                                shuffle=True, random_state=42,
                                remove=remove)

data_test = fetch_20newsgroups(data_home='/path/to/data',
                               subset='test', categories=categories,
                               shuffle=True, random_state=42,
                               remove=remove)

错误详细信息:do_open(self,http_类,req,**http_conn_args)1317 h.request(req.get_method()中的TimeoutError回溯(最近一次调用)~\AppData\Local\Continuum\anaconda3\lib\urllib\request.py,req.selector,req.data,headers,->1318 encode_chunked=req.has_header('Transfer-encoding'))1319除了OSError as err:#超时错误可能您正在使用代理和/或anaconda不允许访问它们。