Python 如何在Google Co lab中导入.dat文件
我第一次用python实现著名的虹膜分类问题。我有一个数据文件,即iris.data。我必须在python项目中导入此文件。我在谷歌Colab上试了试 样本数据 属性包括: 1.萼片长度以厘米为单位 2.萼片宽度(厘米) 3.花瓣长度(厘米) 4.花瓣宽度(厘米) 5.类别:Python 如何在Google Co lab中导入.dat文件,python,google-colaboratory,Python,Google Colaboratory,我第一次用python实现著名的虹膜分类问题。我有一个数据文件,即iris.data。我必须在python项目中导入此文件。我在谷歌Colab上试了试 样本数据 属性包括: 1.萼片长度以厘米为单位 2.萼片宽度(厘米) 3.花瓣长度(厘米) 4.花瓣宽度(厘米) 5.类别: 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa
4.6,3.4,1.4,0.3,Iris-setosa
5.0,3.4,1.5,0.2,Iris-setosa
我是麦汁
import torch
import numpy as np
import matplotlib.pyplot as plt
FILE_PATH = "E:\iris dataset"
MAIN_FILE_NAME = "iris.dat"
data = np.loadtxt(FILE_PATH+MAIN_FILE_NAME, delimiter=",")
但它并没有起作用,也没有克服错误
但当我在Linux中编写代码时,它起了作用。但目前我使用的是Windows10,它不起作用
提前感谢您的帮助。为
np.loadtxt
构造文件名时,缺少\
,因为文件路径+主文件名='E:\iris\u datasetiris.dat
。为了避免在文件路径
和主文件名
之间手动添加\
,您可以使用os.PATH.join
,它可以为您实现这一点
import os
import numpy as np
FILE_PATH = 'E:\iris dataset'
MAIN_FILE_NAME = 'iris.dat'
data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',') # not actually working due to last column of file
另一方面,我不知道它为什么能在Linux上工作,因为numpy无法将字符串“Iris setosa”转换为一个数字,而np.loadtxt正是试图这样做的。如果您只对数值感兴趣,可以使用np.loadtxt的usecols
关键字
data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',', usecols=(0, 1, 2, 3))
为np.loadtxt
构造文件名时,缺少\
,因为文件路径+主文件名='E:\iris\u datasetiris.dat
。为了避免在文件路径
和主文件名
之间手动添加\
,您可以使用os.PATH.join
,它可以为您实现这一点
import os
import numpy as np
FILE_PATH = 'E:\iris dataset'
MAIN_FILE_NAME = 'iris.dat'
data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',') # not actually working due to last column of file
另一方面,我不知道它为什么能在Linux上工作,因为numpy无法将字符串“Iris setosa”转换为一个数字,而np.loadtxt正是试图这样做的。如果您只对数值感兴趣,可以使用np.loadtxt的usecols
关键字
data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',', usecols=(0, 1, 2, 3))
OSError:E:\iris数据集/iris.dat未找到。我收到了这个错误。错误消息听起来像是你试图在Linux下运行上面的代码,而没有改变路径。您必须调整文件路径
以指向文件iris.dat
所在的Linux文件系统中的文件夹。在windows下,上面显示的代码片段对我来说是有效的,因此我不确定从windows 10.o运行时错误可能来自何处错误:E:\iris dataset/iris.dat not found。我收到了这个错误。错误消息听起来像是你试图在Linux下运行上面的代码,而没有改变路径。您必须调整文件路径
以指向文件iris.dat
所在的Linux文件系统中的文件夹。在windows下,上面显示的代码片段对我来说很有用,所以我不确定在windows 10中运行时错误可能来自何处。