Scikit learn can';t通过python代码下载20个新闻组数据
我正在尝试在20news group上运行分类演示,我在这里下载py文件()并像往常一样运行python代码,但出现以下错误,即存在网络连接超时错误,我有点困惑,因为我可以从提供的URL()下载数据文件,有人知道如何解决此问题吗?我是否可以使用手动下载的数据文件 环境: Python 3.6 Ananconda 5.0.1引用自:Scikit learn can';t通过python代码下载20个新闻组数据,scikit-learn,Scikit Learn,我正在尝试在20news group上运行分类演示,我在这里下载py文件()并像往常一样运行python代码,但出现以下错误,即存在网络连接超时错误,我有点困惑,因为我可以从提供的URL()下载数据文件,有人知道如何解决此问题吗?我是否可以使用手动下载的数据文件 环境: Python 3.6 Ananconda 5.0.1引用自: sklearn.datasets.fetch_20newsgroups功能是一种数据获取/缓存功能,可从原始的20个新闻组网站下载数据存档,提取~/scikit\u
sklearn.datasets.fetch_20newsgroups
功能是一种数据获取/缓存功能,可从原始的20个新闻组网站下载数据存档,提取~/scikit\u learn\u data/20news\u home文件夹中的存档内容,并调用sklearn.datasets.load\u文件(位于训练集或测试集文件夹或两者上)
只需将手动下载的文件解压缩到指定文件夹,即可使用该文件
或者,在调用fetch\u 20newsgroups
函数时,可以通过传递data\u home='/path/to/data'
来指定数据文件夹。将函数调用更改为如下所示:
data_train = fetch_20newsgroups(data_home='/path/to/data',
subset='train', categories=categories,
shuffle=True, random_state=42,
remove=remove)
data_test = fetch_20newsgroups(data_home='/path/to/data',
subset='test', categories=categories,
shuffle=True, random_state=42,
remove=remove)
错误详细信息:do_open(self,http_类,req,**http_conn_args)1317 h.request(req.get_method()中的TimeoutError回溯(最近一次调用)~\AppData\Local\Continuum\anaconda3\lib\urllib\request.py,req.selector,req.data,headers,->1318 encode_chunked=req.has_header('Transfer-encoding'))1319除了OSError as err:#超时错误可能您正在使用代理和/或anaconda不允许访问它们。