Python中数据集中列之间的循环_Python_Pandas_Loops_Dataset

Python中数据集中列之间的循环

python pandas loops

Python中数据集中列之间的循环,python,pandas,loops,dataset,Python,Pandas,Loops,Dataset,首先，我使用的是一个公共数据库，可以通过以下代码（从GitHub）获得：该基数包含2020/01/22及以后的国家名称和新冠肺炎确诊病例数量。每个日期列都包含当天确认的病例数（例如，2020/01/22我有3例，2020/01/23我有4例，2020/01/23的病例数为7例。因此，它会继续并随着时间的推移不断添加病例）我想做的是：只获取一天内发生的病例数量，这意味着我必须做一个循环来减去过去的数字（例如，2020/04/06-2020/04/05为我提供了2020/04/06确认的病例数量

首先，我使用的是一个公共数据库，可以通过以下代码（从GitHub）获得：

该基数包含2020/01/22及以后的国家名称和新冠肺炎确诊病例数量。每个日期列都包含当天确认的病例数（例如，2020/01/22我有3例，2020/01/23我有4例，2020/01/23的病例数为7例。因此，它会继续并随着时间的推移不断添加病例）

我想做的是：只获取一天内发生的病例数量，这意味着我必须做一个循环来减去过去的数字（例如，2020/04/06-2020/04/05为我提供了2020/04/06确认的病例数量），并且我必须对数据集中的每个日期列执行该操作，直到2020/01/22

问题是，我不知道怎么做。有人能帮我吗？

您可以使用

diff（）

从每列中减去上一列中的值，请参阅

您想计算所有国家每一天的数据吗？要迭代列，只需创建一个列表cols=df.columns或cols=list（df）并将其作为列表元素进行迭代。请插入。将所有代码放入代码块

url = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'

df_globalcases = pd.read_csv(url, index_col=0)

import pandas as pd

url = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'

df = pd.read_csv(url, index_col=0)

df.iloc[:, 3:] = df.iloc[:, 3:].diff(axis=1)