Python 从日期开始的时间戳,以及熊猫或csv格式
我有一个函数,可以输出从RINEX(GPS)文件生成的数据帧。目前,我将数据帧输出到单独的卫星(1-32)文件中。我希望访问第一列(当它仍然是数据帧或在这些新文件中),以便将日期格式化为以秒为单位的时间戳,如下所示:Python 从日期开始的时间戳,以及熊猫或csv格式,python,csv,pandas,gps,timestamp,Python,Csv,Pandas,Gps,Timestamp,我有一个函数,可以输出从RINEX(GPS)文件生成的数据帧。目前,我将数据帧输出到单独的卫星(1-32)文件中。我希望访问第一列(当它仍然是数据帧或在这些新文件中),以便将日期格式化为以秒为单位的时间戳,如下所示: Epochs Epochs 2014-04-27 00:00:00 -> 00000 2014-04-27 00:00:30 -> 00030 2014-04-27 00:01:00 -> 00060 这需要去掉日期,然
Epochs Epochs
2014-04-27 00:00:00 -> 00000
2014-04-27 00:00:30 -> 00030
2014-04-27 00:01:00 -> 00060
这需要去掉日期,然后将hh:mm:ss转换为秒。我遇到了一个难题,试图找出如何最好地访问第一列(历代),然后对整个列进行转换。我一直在研究的代码是:
def read_data(self, RINEXfile):
obs_data_chunks = []
while True:
obss, _, _, epochs, _ = self.read_data_chunk(RINEXfile)
if obss.shape[0] == 0:
break
obs_data_chunks.append(pd.Panel(
np.rollaxis(obss, 1, 0),
items=['G%02d' % d for d in range(1, 33)],
major_axis=epochs,
minor_axis=self.obs_types
).dropna(axis=0, how='all').dropna(axis=2, how='all'))
obs_data_chunks_dataframe = obs_data_chunks[0]
for sv in range(32):
sat = obs_data_chunks_dataframe[sv, :]
print "sat_columns: {0}".format(sat.columns[0]) #list header of first column: L1
sat.to_csv(('SV_{0}').format(sv+1), index_label="Epochs", sep='\t')
我是在数据帧内执行此转换,即在“sat”上,还是在使用“to_csv”后在文件上执行此转换?我在这里有点迷路了。设置列的格式也有同样的问题。请参见下面格式不太好的列:
Epochs L1 L2 P1 P2 C1 S1 S2
2014-04-27 00:00:00 669486.833 530073.33 24568752.516 24568762.572 24568751.442 43.0 38.0
2014-04-27 00:00:30 786184.519 621006.551 24590960.634 24590970.218 24590958.374 43.0 38.0
2014-04-27 00:01:00 902916.181 711966.252 24613174.234 24613180.219 24613173.065 42.0 38.0
2014-04-27 00:01:30 1019689.006 802958.016 24635396.428 24635402.41 24635395.627 42.0 37.0
2014-04-27 00:02:00 1136478.43 893962.705 24657620.079 24657627.11 24657621.828 42.0 37.0
更新:
通过说我在试图找出如何最好地访问第一列(Epochs)时遇到了麻烦,“sat”数据帧最初在其标题中没有“Epochs”。它只是有以下信号:
L1 L2 P1 P2 C1 S1 S2
标题中缺少索引(日期和时间)。为了在我的csv输出文件中解决此问题,我“强制”使用以下名称:
sat.to_csv(('SV_{0}').format(sv+1), index_label="Epochs", sep='\t')
我希望在生成csv文件之前,我应该(但不知道如何)能够访问这个索引(日期和时间)列,并简单地一次性转换所有日期/时间,以便输出时间戳
更新:
在另一个函数的数据帧中生成历元,如下所示:
epochs = np.zeros(CHUNK_SIZE, dtype='datetime64[us]')
更新:
def read_data_chunk(self, RINEXfile, CHUNK_SIZE = 10000):
obss = np.empty((CHUNK_SIZE, TOTAL_SATS, len(self.obs_types)), dtype=np.float64) * np.NaN
llis = np.zeros((CHUNK_SIZE, TOTAL_SATS, len(self.obs_types)), dtype=np.uint8)
signal_strengths = np.zeros((CHUNK_SIZE, TOTAL_SATS, len(self.obs_types)), dtype=np.uint8)
epochs = np.zeros(CHUNK_SIZE, dtype='datetime64[us]')
flags = np.zeros(CHUNK_SIZE, dtype=np.uint8)
i = 0
while True:
hdr = self.read_epoch_header(RINEXfile)
#print hdr
if hdr is None:
break
epoch, flags[i], sats = hdr
epochs[i] = np.datetime64(epoch)
sat_map = np.ones(len(sats)) * -1
for n, sat in enumerate(sats):
if sat[0] == 'G':
sat_map[n] = int(sat[1:]) - 1
obss[i], llis[i], signal_strengths[i] = self.read_obs(RINEXfile, len(sats), sat_map)
i += 1
if i >= CHUNK_SIZE:
break
return obss[:i], llis[:i], signal_strengths[:i], epochs[:i], flags[:i]
更新:
def read_data_chunk(self, RINEXfile, CHUNK_SIZE = 10000):
obss = np.empty((CHUNK_SIZE, TOTAL_SATS, len(self.obs_types)), dtype=np.float64) * np.NaN
llis = np.zeros((CHUNK_SIZE, TOTAL_SATS, len(self.obs_types)), dtype=np.uint8)
signal_strengths = np.zeros((CHUNK_SIZE, TOTAL_SATS, len(self.obs_types)), dtype=np.uint8)
epochs = np.zeros(CHUNK_SIZE, dtype='datetime64[us]')
flags = np.zeros(CHUNK_SIZE, dtype=np.uint8)
i = 0
while True:
hdr = self.read_epoch_header(RINEXfile)
#print hdr
if hdr is None:
break
epoch, flags[i], sats = hdr
epochs[i] = np.datetime64(epoch)
sat_map = np.ones(len(sats)) * -1
for n, sat in enumerate(sats):
if sat[0] == 'G':
sat_map[n] = int(sat[1:]) - 1
obss[i], llis[i], signal_strengths[i] = self.read_obs(RINEXfile, len(sats), sat_map)
i += 1
if i >= CHUNK_SIZE:
break
return obss[:i], llis[:i], signal_strengths[:i], epochs[:i], flags[:i]
如果我的描述有点模糊,我很抱歉。事实上,我正在修改已经开发的代码,而且我不是软件开发人员,所以这对我来说也是一个很强的学习曲线。让我进一步解释一下:“时代”是从另一个函数读取的:
def read_epoch_header(self, RINEXfile):
epoch_hdr = RINEXfile.readline()
if epoch_hdr == '':
return None
year = int(epoch_hdr[1:3])
if year >= 80:
year += 1900
else:
year += 2000
month = int(epoch_hdr[4:6])
day = int(epoch_hdr[7:9])
hour = int(epoch_hdr[10:12])
minute = int(epoch_hdr[13:15])
second = int(epoch_hdr[15:18])
microsecond = int(epoch_hdr[19:25]) # Discard the least significant digits (use microseconds only).
epoch = datetime.datetime(year, month, day, hour, minute, second, microsecond)
flag = int(epoch_hdr[28])
if flag != 0:
raise ValueError("Don't know how to handle epoch flag %d in epoch header:\n%s", (flag, epoch_hdr))
n_sats = int(epoch_hdr[29:32])
sats = []
for i in range(0, n_sats):
if ((i % 12) == 0) and (i > 0):
epoch_hdr = RINEXfile.readline()
sats.append(epoch_hdr[(32+(i%12)*3):(35+(i%12)*3)])
return epoch, flag, sats
在上面的read_data函数中,这些被附加到一个数据帧中。我基本上想让这个数据帧由它的卫星轴分开,这样每个卫星文件在第一列中都有历元,然后是以下7个信号。read_data文件(下面)中的最后一位代码解释了这一点:
for sv in range(32):
sat = obs_data_chunks_dataframe[sv, :]
print "sat_columns: {0}".format(sat.columns[0]) #list header of first column: L1
sat.to_csv(('SV_{0}').format(sv+1), index_label="Epochs", sep='\t')
The problem here is (1) I want to have the first column as timestamps (so, strip the date, convert so midnight = 00000s and 23:59:59 = 86399s) not as they are now, and (2) ensure the columns are aligned, so I can eventually manipulate these further using a different class to perform other calculations i.e. L1 minus L2 plotted against time, etc.
如果数据类型为
datetime64
,则转换为int64
,然后除以纳秒,这样做会更快:
In [241]:
df['Epochs'].astype(np.int64) // 10**9
Out[241]:
0 1398556800
1 1398556830
2 1398556860
3 1398556890
4 1398556920
Name: Epochs, dtype: int64
如果是字符串,则使用将其转换为\u datetime
,然后执行上述操作:
df['Epochs'] = pd.to_datetime(df['Epochs']).astype(np.int64) // 10**9
请参见最后我自己解决了部分问题:在read_epoch_header函数中,我简单地操作了一个变量,该变量仅将hh:mm:ss转换为秒,并将其用作epoch。虽然看起来不那么优雅,但它可以工作。只需格式化header,使其与列对齐(它们也对齐).干杯,pymat对不起,“Epochs”在df中已经是datetime64了吗?那么你的索引已经是datetime或datetime字符串了吗?你的
Epochs
索引在sat
数据框中吗?@NaderHisham它的dtype='datetime64[us]'(更新如上)抱歉,现在还不清楚您说您生成了epoch,但是您是将其添加为索引还是新列?索引标签(sat.to_csv(('SV_{0}')。format(SV+1),index_label=“epochs”,sep='\t'))我在从dataframe转换为csv后分配了。我需要告诉dataframe使用第一列。这没有索引。我真的不明白你的意思,你能用原始数据和创建df的代码编辑你的问题并作进一步解释吗