从github python下载和访问数据_Python_Git_Pandas

从github python下载和访问数据

python git pandas

从github python下载和访问数据,python,git,pandas,Python,Git,Pandas,大家好，我正在使用Python进行数据分析，我想分析他在书中使用的数据。在第9章中，他使用了以下数据。然而，一旦我将ipython笔记本中的数据下载到mac上的github应用程序中，我就很难理解如何利用它股票数据如下：我单击“打开”，在我的github应用程序上下载了一个大文件。它看起来像下图。如何在ipython笔记本中打开此数据 **看看其他stackoverflow问题，我知道我可以下载zip文件，我也在下载。知道如何高效地使用github应用程序将是一件很酷的事情右键单击并保存c

大家好，我正在使用Python进行数据分析，我想分析他在书中使用的数据。在第9章中，他使用了以下数据。然而，一旦我将ipython笔记本中的数据下载到mac上的github应用程序中，我就很难理解如何利用它

股票数据如下：

我单击“打开”，在我的github应用程序上下载了一个大文件。它看起来像下图。如何在ipython笔记本中打开此数据

**看看其他stackoverflow问题，我知道我可以下载zip文件，我也在下载。知道如何高效地使用github应用程序将是一件很酷的事情

右键单击并保存csv文件似乎可以保存json/html文件

您应该能够只使用原始版本的

url

（指向原始版本的链接是您提供的链接上的一个按钮），然后使用

read\u csv

将其直接读取到数据帧中：

import pandas as pd
url = 'https://raw.githubusercontent.com/pydata/pydata-book/master/ch09/stock_px.csv'
df = pd.read_csv(url,index_col=0,parse_dates=[0])

print df.head(5)

            AAPL   MSFT    XOM     SPX
2003-01-02  7.40  21.11  29.22  909.03
2003-01-03  7.45  21.14  29.24  908.59
2003-01-06  7.45  21.52  29.96  929.01
2003-01-07  7.43  21.93  28.95  922.93
2003-01-08  7.28  21.31  28.83  909.93

编辑：关于我在文件中阅读的选项的简要说明：

df = pd.read_csv(url,index_col=0,parse_dates=[0])

第一列（column=0）是文件中日期的一列，因为它没有列名，所以看起来像是要作为索引

index\u col=0

将其作为索引和解析日期[0]告诉read\u csv将列=0（第一列）解析为日期。

首先将github csv文件转换为原始数据，为了访问数据，请按照下面关于如何将csv文件转换为原始数据的注释中的链接进行操作

import pandas as pd

url_data = (r'https://raw.githubusercontent.com/oderofrancis/rona/main/Countries-Continents.csv')

data_csv = pd.read_csv(url_data)

data_csv.head()

非常感谢。在这一点上，你能帮我理解index_col=0的作用吗？Doc说“要用作数据框行标签的列”。将0放在其中是什么意思？与parse_dates=0相同？还有一件事：对于这个链接，我如何上传csv_mindex的数据和ipython_bug.py的代码？在我的回答中添加了关于

index\u col=0

和

parse\u dates=[0]

的简要说明。非常感谢！如果您还可以回答有关获取csv_mindex数据的问题（因为没有原始url链接），那将非常感谢！：数据这里有一个原始文件：如何在github中将csv文件转换为原始文件