Python 如何使用用户特定的日期格式对数据集进行属性分析
我有一个像这样的dataset.csv文件Python 如何使用用户特定的日期格式对数据集进行属性分析,python,date,pandas,dataframe,dataset,Python,Date,Pandas,Dataframe,Dataset,我有一个像这样的dataset.csv文件 time, cost,volume,valid Fri May 19 10:00:00 PDT 2017, 9.1,3.2,True Fri May 19 11:03:09 PDT 2017, 5.2,4.2,False 请帮助分析此数据集,使其数据类型为:column1:date、column2:float、column3:float、column4:boolean 谢谢 CG您可以与参数skipinitialspace和parse_dates一起
time, cost,volume,valid
Fri May 19 10:00:00 PDT 2017, 9.1,3.2,True
Fri May 19 11:03:09 PDT 2017, 5.2,4.2,False
请帮助分析此数据集,使其数据类型为:column1:date、column2:float、column3:float、column4:boolean
谢谢
CG您可以与参数skipinitialspace
和parse_dates
一起使用:
import pandas as pd
from pandas.compat import StringIO
temp=u"""time, cost,volume,valid
Fri May 19 10:00:00 PDT 2017, 9.1,3.2,True
Fri May 19 11:03:09 PDT 2017, 5.2,4.2,False"""
#after testing replace 'StringIO(temp)' to 'filename.csv'
df = pd.read_csv(StringIO(temp), skipinitialspace=True, parse_dates=[0])
print (df)
time cost volume valid
0 2017-05-19 10:00:00 9.1 3.2 True
1 2017-05-19 11:03:09 5.2 4.2 False
print (df.dtypes)
time datetime64[ns]
cost float64
volume float64
valid bool
dtype: object
好的,它和样品配合得很好。它也适用于真实数据?