Python 从熊猫到考拉再到CSV转换时,如何保留时区感知时间戳?
如何让考拉在时区感知时间戳中保存时区信息Python 从熊猫到考拉再到CSV转换时,如何保留时区感知时间戳?,python,pandas,datetime,spark-koalas,Python,Pandas,Datetime,Spark Koalas,如何让考拉在时区感知时间戳中保存时区信息 >>> import pandas as pd >>> pds = pd.Series([pd.Timestamp('2018-11-06T14:00:00+00:00')]) >>> pds 0 2018-11-06 14:00:00+00:00 dtype: datetime64[ns, UTC] 查看它如何在末尾包含+00:00,数据类型为datetime64[ns,UTC]。这就是我想
>>> import pandas as pd
>>> pds = pd.Series([pd.Timestamp('2018-11-06T14:00:00+00:00')])
>>> pds
0 2018-11-06 14:00:00+00:00
dtype: datetime64[ns, UTC]
查看它如何在末尾包含+00:00
,数据类型为datetime64[ns,UTC]
。这就是我想要的
现在我把它转换成考拉:
>>> import databricks.koalas as ks
>>> kss = ks.from_pandas(pds)
kss
0 2018-11-06 08:00:00
dtype: datetime64[ns]
它丢失了时区信息,并且减去了6小时。不知道为什么,因为我在美国CDT,你会认为它会增加5个小时,而不是第6部分。此外,现在当我将其写入CSV时:
>>> kss.to_csv('output.csv')
它通过添加-06:00
,再减去六个小时:
2018-11-06T08:00:00.000-06:00
所以从熊猫->考拉->CSV开始,我的时间戳已经丢失了12个完整的小时:最初的
2018-11-06 14:00:00+00:00
变成了2018-11-06T08:00:00.000-06:00
UTC-6上的8小时是UTC-14小时,所以我想你不会浪费时间。然而,这不应该发生;tz信息应该被保留。哦,是的,你是对的,我的大脑不工作了。。。但问题仍然在于如何在考拉中保存tz信息