Python 如何在Google Co lab中导入.dat文件

Python 如何在Google Co lab中导入.dat文件,python,google-colaboratory,Python,Google Colaboratory,我第一次用python实现著名的虹膜分类问题。我有一个数据文件,即iris.data。我必须在python项目中导入此文件。我在谷歌Colab上试了试 样本数据 属性包括: 1.萼片长度以厘米为单位 2.萼片宽度(厘米) 3.花瓣长度(厘米) 4.花瓣宽度(厘米) 5.类别: 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa

我第一次用python实现著名的虹膜分类问题。我有一个数据文件,即iris.data。我必须在python项目中导入此文件。我在谷歌Colab上试了试

样本数据

属性包括:

1.萼片长度以厘米为单位 2.萼片宽度(厘米) 3.花瓣长度(厘米) 4.花瓣宽度(厘米) 5.类别:

5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa
4.6,3.4,1.4,0.3,Iris-setosa
5.0,3.4,1.5,0.2,Iris-setosa
我是麦汁

import torch
import numpy as np
import matplotlib.pyplot as plt
FILE_PATH = "E:\iris dataset"
MAIN_FILE_NAME = "iris.dat"

data = np.loadtxt(FILE_PATH+MAIN_FILE_NAME, delimiter=",")
但它并没有起作用,也没有克服错误

但当我在Linux中编写代码时,它起了作用。但目前我使用的是Windows10,它不起作用


提前感谢您的帮助。

np.loadtxt
构造文件名时,缺少
\
,因为
文件路径+主文件名='E:\iris\u datasetiris.dat
。为了避免在
文件路径
主文件名
之间手动添加
\
,您可以使用
os.PATH.join
,它可以为您实现这一点

import os
import numpy as np

FILE_PATH = 'E:\iris dataset'
MAIN_FILE_NAME = 'iris.dat'

data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',')  # not actually working due to last column of file
另一方面,我不知道它为什么能在Linux上工作,因为numpy无法将字符串“Iris setosa”转换为一个数字,而np.loadtxt正是试图这样做的。如果您只对数值感兴趣,可以使用
np.loadtxt的
usecols
关键字

data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',', usecols=(0, 1, 2, 3))

np.loadtxt
构造文件名时,缺少
\
,因为
文件路径+主文件名='E:\iris\u datasetiris.dat
。为了避免在
文件路径
主文件名
之间手动添加
\
,您可以使用
os.PATH.join
,它可以为您实现这一点

import os
import numpy as np

FILE_PATH = 'E:\iris dataset'
MAIN_FILE_NAME = 'iris.dat'

data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',')  # not actually working due to last column of file
另一方面,我不知道它为什么能在Linux上工作,因为numpy无法将字符串“Iris setosa”转换为一个数字,而np.loadtxt正是试图这样做的。如果您只对数值感兴趣,可以使用
np.loadtxt的
usecols
关键字

data = np.loadtxt(os.path.join(FILE_PATH, MAIN_FILE_NAME), delimiter=',', usecols=(0, 1, 2, 3))

OSError:E:\iris数据集/iris.dat未找到。我收到了这个错误。错误消息听起来像是你试图在Linux下运行上面的代码,而没有改变路径。您必须调整
文件路径
以指向文件
iris.dat
所在的Linux文件系统中的文件夹。在windows下,上面显示的代码片段对我来说是有效的,因此我不确定从windows 10.o运行时错误可能来自何处错误:E:\iris dataset/iris.dat not found。我收到了这个错误。错误消息听起来像是你试图在Linux下运行上面的代码,而没有改变路径。您必须调整
文件路径
以指向文件
iris.dat
所在的Linux文件系统中的文件夹。在windows下,上面显示的代码片段对我来说很有用,所以我不确定在windows 10中运行时错误可能来自何处。