从github python下载和访问数据
大家好,我正在使用Python进行数据分析,我想分析他在书中使用的数据。在第9章中,他使用了以下数据。然而,一旦我将ipython笔记本中的数据下载到mac上的github应用程序中,我就很难理解如何利用它 股票数据如下: 我单击“打开”,在我的github应用程序上下载了一个大文件。它看起来像下图。如何在ipython笔记本中打开此数据 **看看其他stackoverflow问题,我知道我可以下载zip文件,我也在下载。知道如何高效地使用github应用程序将是一件很酷的事情 右键单击并保存csv文件似乎可以保存json/html文件从github python下载和访问数据,python,git,pandas,Python,Git,Pandas,大家好,我正在使用Python进行数据分析,我想分析他在书中使用的数据。在第9章中,他使用了以下数据。然而,一旦我将ipython笔记本中的数据下载到mac上的github应用程序中,我就很难理解如何利用它 股票数据如下: 我单击“打开”,在我的github应用程序上下载了一个大文件。它看起来像下图。如何在ipython笔记本中打开此数据 **看看其他stackoverflow问题,我知道我可以下载zip文件,我也在下载。知道如何高效地使用github应用程序将是一件很酷的事情 右键单击并保存c
您应该能够只使用原始版本的
url
(指向原始版本的链接是您提供的链接上的一个按钮),然后使用read\u csv
将其直接读取到数据帧中:
import pandas as pd
url = 'https://raw.githubusercontent.com/pydata/pydata-book/master/ch09/stock_px.csv'
df = pd.read_csv(url,index_col=0,parse_dates=[0])
print df.head(5)
AAPL MSFT XOM SPX
2003-01-02 7.40 21.11 29.22 909.03
2003-01-03 7.45 21.14 29.24 908.59
2003-01-06 7.45 21.52 29.96 929.01
2003-01-07 7.43 21.93 28.95 922.93
2003-01-08 7.28 21.31 28.83 909.93
编辑:关于我在文件中阅读的选项的简要说明:
df = pd.read_csv(url,index_col=0,parse_dates=[0])
第一列(column=0)是文件中日期的一列,因为它没有列名,所以看起来像是要作为索引
index\u col=0
将其作为索引和解析日期[0]告诉read\u csv将列=0(第一列)解析为日期。首先将github csv文件转换为原始数据,为了访问数据,请按照下面关于如何将csv文件转换为原始数据的注释中的链接进行操作
import pandas as pd
url_data = (r'https://raw.githubusercontent.com/oderofrancis/rona/main/Countries-Continents.csv')
data_csv = pd.read_csv(url_data)
data_csv.head()
非常感谢。在这一点上,你能帮我理解index_col=0的作用吗?Doc说“要用作数据框行标签的列”。将0放在其中是什么意思?与parse_dates=0相同?还有一件事:对于这个链接,我如何上传csv_mindex的数据和ipython_bug.py的代码?在我的回答中添加了关于
index\u col=0
和parse\u dates=[0]
的简要说明。非常感谢!如果您还可以回答有关获取csv_mindex数据的问题(因为没有原始url链接),那将非常感谢!:数据这里有一个原始文件:如何在github中将csv文件转换为原始文件