Python中数据集中列之间的循环

Python中数据集中列之间的循环,python,pandas,loops,dataset,Python,Pandas,Loops,Dataset,首先,我使用的是一个公共数据库,可以通过以下代码(从GitHub)获得: 该基数包含2020/01/22及以后的国家名称和新冠肺炎确诊病例数量。每个日期列都包含当天确认的病例数(例如,2020/01/22我有3例,2020/01/23我有4例,2020/01/23的病例数为7例。因此,它会继续并随着时间的推移不断添加病例) 我想做的是:只获取一天内发生的病例数量,这意味着我必须做一个循环来减去过去的数字(例如,2020/04/06-2020/04/05为我提供了2020/04/06确认的病例数量

首先,我使用的是一个公共数据库,可以通过以下代码(从GitHub)获得:

该基数包含2020/01/22及以后的国家名称和新冠肺炎确诊病例数量。每个日期列都包含当天确认的病例数(例如,2020/01/22我有3例,2020/01/23我有4例,2020/01/23的病例数为7例。因此,它会继续并随着时间的推移不断添加病例)

我想做的是:只获取一天内发生的病例数量,这意味着我必须做一个循环来减去过去的数字(例如,2020/04/06-2020/04/05为我提供了2020/04/06确认的病例数量),并且我必须对数据集中的每个日期列执行该操作,直到2020/01/22

问题是,我不知道怎么做。有人能帮我吗?

您可以使用
diff()
从每列中减去上一列中的值,请参阅


您想计算所有国家每一天的数据吗?要迭代列,只需创建一个列表cols=df.columns或cols=list(df)并将其作为列表元素进行迭代。请插入。将所有代码放入代码块
url = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'

df_globalcases = pd.read_csv(url, index_col=0)
import pandas as pd

url = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'

df = pd.read_csv(url, index_col=0)

df.iloc[:, 3:] = df.iloc[:, 3:].diff(axis=1)