Python 3.x 如何更好地理解python数据帧
作为Python的初学者,我经常面临这个问题——假设我正在处理一个数据帧,并希望对其中一个列执行一个操作。它可以只是从值中删除小数点,或者我想从日期列中删除月份。但通常我会在网上找到解决方案-通常显示为单个值或数据点,如下所示:Python 3.x 如何更好地理解python数据帧,python-3.x,dataframe,Python 3.x,Dataframe,作为Python的初学者,我经常面临这个问题——假设我正在处理一个数据帧,并希望对其中一个列执行一个操作。它可以只是从值中删除小数点,或者我想从日期列中删除月份。但通常我会在网上找到解决方案-通常显示为单个值或数据点,如下所示: a = 11.0 int(a) 11 现在,如果我有一个数据帧或列,同样的解决方案就不能应用。如果我想用日期添加时间,请重复 d = date.today() d datetime.date(2018, 3, 30) datetime.combine(d, date
a = 11.0
int(a)
11
现在,如果我有一个数据帧或列,同样的解决方案就不能应用。如果我想用日期添加时间,请重复
d = date.today()
d
datetime.date(2018, 3, 30)
datetime.combine(d, datetime.min.time())
datetime.datetime(2018, 3, 30, 0, 0)
同样,此解决方案不能用于数据帧。那将抛出一个错误。显然,我在这里缺乏知识,我无法使它在数据帧方面工作。你能给我指出一个主题吗?这个主题可能有助于我从数据帧的角度理解这些问题?或者可以展示一个如何操作的示例?您应该查看pandas库以操作数据帧:
这是一个示例,用于为给定列的每个值应用函数:
import pandas as pd
def myFunction(a_string):
return a_string.upper()
data = pd.read_csv('data.csv')
print(data)
data['City'] = data['City'].apply(myFunction)
print(data)
开始时的数据:
Name City Age
Robert Paris 32
Max Dallas 24
Raj Delhi 27
以下日期后的数据:
Name City Age
Robert PARIS 32
Max DALLAS 24
Raj DELHI 27
这里myFunction大写是字符串,但也可以用同样的方式用于其他类型的操作
希望有帮助