File 如何将.npy文件作为numpy数组加载到Google Colab上的虚拟机中

File 如何将.npy文件作为numpy数组加载到Google Colab上的虚拟机中,file,numpy,machine-learning,deep-learning,google-colaboratory,File,Numpy,Machine Learning,Deep Learning,Google Colaboratory,我有一些数据集和标签,它们基本上是numpy保存的文件,扩展名为.npy 我在谷歌硬盘中保存了train.npy和train_labels.npy 在使用GoogleColab时,我必须使用这些数据。我能够在我的驱动器中找到文件夹和数据文件的id。如何将这些数据文件加载到Google Colab使用的虚拟机内存中?解决了这个问题 首先,按照文档中的说明进行简单的身份验证 from pydrive.auth import GoogleAuth from pydrive.drive import G

我有一些数据集和标签,它们基本上是numpy保存的文件,扩展名为.npy

我在谷歌硬盘中保存了train.npy和train_labels.npy

在使用GoogleColab时,我必须使用这些数据。我能够在我的驱动器中找到文件夹和数据文件的id。如何将这些数据文件加载到Google Colab使用的虚拟机内存中?

解决了这个问题

首先,按照文档中的说明进行简单的身份验证

from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

# 1. Authenticate and create the PyDrive client.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)
我创建了一个助手函数,如果您知道文件在驱动器上的文件名和文件夹id,它将获取文件id。文件夹id是drive.google.com/./../folders中链接的最后一部分/

def get_file_from_drive(folder_id, file_name):
  file_list = drive.ListFile({'q': "'" + folder_id + "' in parents and 
trashed=false"}).GetList()
  for file in file_list:
    if file['title'] == file_name:
      return file['id']

def upload_file_to_drive(file_name, file_data):
  uploaded = drive.CreateFile({'title': file_name})
  uploaded.SetContentString(file_data)
  uploaded.Upload()
  print('Uploaded file with ID {}'.format(uploaded.get('id')))

drive_folder_id = '<Folder ID>'
中提琴!您的文件将上载到文件系统,并可以使用简单的python加载到内存中,就像在本地完成的那样。要进行验证,请在colab上运行此命令。你应该看看你的文件

import os
from os import listdir

for f in os.listdir('.'):
  if os.path.isfile(f):
    print(f)

现在将numpy文件作为np.load加载(文件系统中文件的路径)

谢谢您的代码片段。如果我使用的数据集不在我的本地计算机上怎么办。我可以在安装了驱动器的情况下使用colab下载数据集并将其保存在驱动器上的文件夹中吗?是的,您只需要一个简单的界面就可以与安装的外部驱动器进行交互。
import os
from os import listdir

for f in os.listdir('.'):
  if os.path.isfile(f):
    print(f)