Google sheets 将数据导入Google Colaboratory
将私人数据导入Google Colaboratory笔记本的常用方法是什么?是否可以导入非公开的Google工作表?无法读取系统文件。介绍性文档链接到,但这似乎有点。。。很多。这里提供了一个演示本地文件上传/下载以及与驱动器和工作表集成的官方示例笔记本: 共享文件的最简单方法是安装您的Google驱动器 要执行此操作,请在代码单元中运行以下操作:Google sheets 将数据导入Google Colaboratory,google-sheets,google-colaboratory,Google Sheets,Google Colaboratory,将私人数据导入Google Colaboratory笔记本的常用方法是什么?是否可以导入非公开的Google工作表?无法读取系统文件。介绍性文档链接到,但这似乎有点。。。很多。这里提供了一个演示本地文件上传/下载以及与驱动器和工作表集成的官方示例笔记本: 共享文件的最简单方法是安装您的Google驱动器 要执行此操作,请在代码单元中运行以下操作: from google.colab import drive drive.mount('/content/drive') 它会要求你访问一个链接,
from google.colab import drive
drive.mount('/content/drive')
它会要求你访问一个链接,允许“谷歌文件流”访问你的驱动器。之后,将显示需要输入Colab笔记本中的长字母数字身份验证代码
之后,将安装驱动器文件,您可以使用侧面板中的文件浏览器浏览它们
这里有一个我做的最简单的方法是:
到目前为止,我发现最简单的解决方案是:
pandas.read\u csv(URL)
这可能适用于逐行读取文本文件或二进制文件。从googledrive导入数据的简单方法-这样做可以节省人们的时间(不知道google为什么不一步一步地明确列出) 安装并验证PYDRIVE
!pip install -U -q PyDrive ## you will have install for every colab session
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials
# 1. Authenticate and create the PyDrive client.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)
上传
如果需要从本地驱动器上载数据:
from google.colab import files
uploaded = files.upload()
for fn in uploaded.keys():
print('User uploaded file "{name}" with length {length} bytes'.format(name=fn, length=len(uploaded[fn])))
执行后,将显示“选择文件”按钮-查找上载文件-单击“打开”
上传后会显示:
sample_file.json(text/plain) - 11733 bytes, last modified: x/xx/2018 - %100 done
User uploaded file "sample_file.json" with length 11733 bytes
为笔记本创建文件
如果数据文件已在gdrive中,则可以跳到此步骤
现在它在你的谷歌硬盘上。在谷歌硬盘中找到该文件,然后右键单击。单击获取“可共享链接”。您将获得一个包含以下内容的窗口:
https://drive.google.com/open?id=29PGh8XCts3mlMP6zRphvnIcbv27boawn
复制-'29PGh8XCts3mlMP6zRphvnIcbv27boawn'-这是文件ID
在您的笔记本中:
json_import = drive.CreateFile({'id':'29PGh8XCts3mlMP6zRphvnIcbv27boawn'})
json_import.GetContentFile('sample.json') - 'sample.json' is the file name that will be accessible in the notebook.
将数据导入笔记本
要将上载的数据导入笔记本(本例中为json文件-加载方式取决于文件/数据类型-.txt、.csv等),请执行以下操作:
现在,您可以打印以查看数据:
print(sample_uploaded_data)
快速方便地从Dropbox导入:
!pip install dropbox
import dropbox
access_token = 'YOUR_ACCESS_TOKEN_HERE' # https://www.dropbox.com/developers/apps
dbx = dropbox.Dropbox(access_token)
# response = dbx.files_list_folder("")
metadata, res = dbx.files_download('/dataframe.pickle2')
with open('dataframe.pickle2', "wb") as f:
f.write(res.content)
上传
from google.colab import files
files.upload()
files.download('filename')
下载
from google.colab import files
files.upload()
files.download('filename')
列出目录
files.os.listdir()
from google.colab import drive
drive.mount('/content/gdrive')
这允许你通过谷歌硬盘上传你的文件 运行下面的代码(以前在某个地方找到过这个,但我再也找不到源代码了-归功于编写它的人!): 如果您执行
!ls
现在,将有一个目录驱动器,如果您执行!ls drive
您可以查看Google drive的所有内容
因此,例如,如果我将名为
abc.txt
的文件保存在谷歌硬盘中名为ColabNotebooks
的文件夹中,我现在可以通过路径Drive/ColabNotebooks/abc.txt
访问它,问题已经解决,请在此处查找详细信息并使用以下功能:
下面是一种将文件从google drive导入笔记本电脑的方法 打开jupyter笔记本,运行下面的代码并完成身份验证过程 将文件从google drive导入笔记本电脑(例如:Colab_笔记本电脑/db.csv) 假设您的数据集文件位于Colab_笔记本文件夹中,其名称为db.csv
import pandas as pd
dataset=pd.read_csv("drive/Colab_Notebooks/db.csv")
我希望这有助于第1步-将您的谷歌硬盘安装到协作室
files.os.listdir()
from google.colab import drive
drive.mount('/content/gdrive')
第2步-现在您将在左窗格(文件浏览器)中看到您的Google Drive文件。右键单击需要导入的文件并选择çopy path。
然后使用此复制路径,像往常一样导入pandas。
import pandas as pd
df=pd.read_csv('gdrive/My Drive/data.csv')
完成了 在任何协作实验室的左栏上都有一个称为“文件”的部分。 上传你的文件并使用此路径
"/content/YourFileName.extension"
例如:
pd.read_csv('/content/Forbes2015.csv')代码>您还可以在google.colab和PyDrive上使用我的实现,这样做会更简单
!pip install - U - q PyDrive
import os
os.chdir('/content/')
!git clone https://github.com/ruelj2/Google_drive.git
from Google_drive.handle import Google_drive
Gd = Google_drive()
然后,如果您想加载Google驱动器目录中的所有文件,只需
Gd.load_all(local_dir, drive_dir_ID, force=False)
或者只是一个带有
Gd.load_file(local_dir, file_ID)
如果你想在没有代码的情况下完成这项工作,那就很容易了。
在我的情况下压缩你的文件夹
dataset.zip
然后在Colab中,右键单击要放置此文件的文件夹,然后按Upload并上载此zip文件。然后编写这个Linux命令
!unzip <your_zip_file_name>
!解压
您可以看到您的数据已成功上载。正如@Vivek Solanki所述,我还将我的文件上载到了colaboratory仪表板的“文件”部分。
只需记下文件上传的位置。为了我,
train\u data=pd.read\u csv('/fileName.csv')
工作正常 如果数据集大小小于25mb,则从GitHub存储库上载CSV文件是最简单的方法
单击存储库中的数据集
点击查看原始按钮
复制链接并将其存储在变量中
将变量加载到Pandas read_csv中以获取数据帧
例如:
import pandas as pd
url = 'copied_raw_data_link'
df1 = pd.read_csv(url)
df1.head()
在google colabs中
如果这是你第一次
from google.colab import drive
drive.mount('/content/drive')
运行这些代码并通过outputlink
然后经过传球,普拉斯走向禁区
当您复制时,您可以按如下方式复制:,
转到文件右键单击并复制路径
***不要忘记删除“/内容”
对于那些像我一样来自谷歌的关键词“上传文件colab”的人:
您可以通过运行以下命令装载到google drive
从google.colab导入驱动器
drive.mount('/content/drive')
之后,为了进行训练,将数据从gdrive复制到colab root
import pandas as pd
url = 'copied_raw_data_link'
df1 = pd.read_csv(url)
df1.head()
from google.colab import drive
drive.mount('/content/drive')
f = open("drive/My Drive/RES/dimeric_force_field/Test/python_read/cropped.pdb", "r")
from google.colab import files
uploaded = files.upload()
from google.colab import files
files=files.upload()