Python 从熊猫到考拉再到CSV转换时，如何保留时区感知时间戳？_Python_Pandas_Datetime_Spark Koalas

Python 从熊猫到考拉再到CSV转换时，如何保留时区感知时间戳？

python pandas datetime

Python 从熊猫到考拉再到CSV转换时，如何保留时区感知时间戳？,python,pandas,datetime,spark-koalas,Python,Pandas,Datetime,Spark Koalas,如何让考拉在时区感知时间戳中保存时区信息 >>> import pandas as pd >>> pds = pd.Series([pd.Timestamp('2018-11-06T14:00:00+00:00')]) >>> pds 0 2018-11-06 14:00:00+00:00 dtype: datetime64[ns, UTC] 查看它如何在末尾包含+00:00，数据类型为datetime64[ns，UTC]。这就是我想

如何让考拉在时区感知时间戳中保存时区信息

>>> import pandas as pd
>>> pds = pd.Series([pd.Timestamp('2018-11-06T14:00:00+00:00')])
>>> pds
0   2018-11-06 14:00:00+00:00
dtype: datetime64[ns, UTC]

查看它如何在末尾包含

+00:00

，数据类型为

datetime64[ns，UTC]

。这就是我想要的

现在我把它转换成考拉：

>>> import databricks.koalas as ks
>>> kss = ks.from_pandas(pds)
kss
0   2018-11-06 08:00:00
dtype: datetime64[ns]

它丢失了时区信息，并且减去了6小时。不知道为什么，因为我在美国CDT，你会认为它会增加5个小时，而不是第6部分。此外，现在当我将其写入CSV时：

>>> kss.to_csv('output.csv')

它通过添加

-06:00

，再减去六个小时：

2018-11-06T08:00:00.000-06:00

所以从熊猫->考拉->CSV开始，我的时间戳已经丢失了12个完整的小时：最初的

2018-11-06 14:00:00+00:00

变成了

2018-11-06T08:00:00.000-06:00

UTC-6上的8小时是UTC-14小时，所以我想你不会浪费时间。然而，这不应该发生；tz信息应该被保留。哦，是的，你是对的，我的大脑不工作了。。。但问题仍然在于如何在考拉中保存tz信息