Python 3.x 如何更好地理解python数据帧

Python 3.x 如何更好地理解python数据帧,python-3.x,dataframe,Python 3.x,Dataframe,作为Python的初学者,我经常面临这个问题——假设我正在处理一个数据帧,并希望对其中一个列执行一个操作。它可以只是从值中删除小数点,或者我想从日期列中删除月份。但通常我会在网上找到解决方案-通常显示为单个值或数据点,如下所示: a = 11.0 int(a) 11 现在,如果我有一个数据帧或列,同样的解决方案就不能应用。如果我想用日期添加时间,请重复 d = date.today() d datetime.date(2018, 3, 30) datetime.combine(d, date

作为Python的初学者,我经常面临这个问题——假设我正在处理一个数据帧,并希望对其中一个列执行一个操作。它可以只是从值中删除小数点,或者我想从日期列中删除月份。但通常我会在网上找到解决方案-通常显示为单个值或数据点,如下所示:

a = 11.0
int(a)
11
现在,如果我有一个数据帧或列,同样的解决方案就不能应用。如果我想用日期添加时间,请重复

d = date.today()
d
datetime.date(2018, 3, 30)

datetime.combine(d, datetime.min.time())
datetime.datetime(2018, 3, 30, 0, 0)
同样,此解决方案不能用于数据帧。那将抛出一个错误。显然,我在这里缺乏知识,我无法使它在数据帧方面工作。你能给我指出一个主题吗?这个主题可能有助于我从数据帧的角度理解这些问题?或者可以展示一个如何操作的示例?

您应该查看pandas库以操作数据帧:

这是一个示例,用于为给定列的每个值应用函数:

import pandas as pd

def myFunction(a_string):
   return a_string.upper()

data = pd.read_csv('data.csv')

print(data)
data['City'] = data['City'].apply(myFunction)
print(data)
开始时的数据:

 Name     City    Age
 Robert   Paris   32
 Max      Dallas  24
 Raj      Delhi   27
以下日期后的数据:

 Name     City    Age
 Robert   PARIS   32
 Max      DALLAS  24
 Raj      DELHI   27
这里myFunction大写是字符串,但也可以用同样的方式用于其他类型的操作

希望有帮助