Python 如何将时间序列数据转换为NN输入向量?

Python 如何将时间序列数据转换为NN输入向量?,python,vector,tensorflow,time-series,tflearn,Python,Vector,Tensorflow,Time Series,Tflearn,例如,我有各种股票的csv时间序列数据,我想将这些数据转换成向量,然后输入神经网络 我不确定这是否有任何相关性,但最终,我想根据各种当前基本指标预测未来股价——TDebt、IntAssets、TAssets和EBITDA。然后,我比较了Price Today和Price+1年。如果PriceDiff为正值,则数据标记为正确;如果为负值,则数据标记为不正确 日期、股票代码、TDebt、集成资产、TASSET、息税折旧摊销前利润、今日价格、价格+1年、价格差异、标签 1/1/10,AAPL,6.73

例如,我有各种股票的csv时间序列数据,我想将这些数据转换成向量,然后输入神经网络

我不确定这是否有任何相关性,但最终,我想根据各种当前基本指标预测未来股价——TDebt、IntAssets、TAssets和EBITDA。然后,我比较了Price Today和Price+1年。如果PriceDiff为正值,则数据标记为正确;如果为负值,则数据标记为不正确

日期、股票代码、TDebt、集成资产、TASSET、息税折旧摊销前利润、今日价格、价格+1年、价格差异、标签 1/1/10,AAPL,6.73,3.05,41.16,11.06179.26219.26,22.31,正确 1/1/10,古格尔,3.19,12.54,24.08,2.631135.971115.97,-1.76,不正确 1/1/10,MSFT,4.32,15.74,35.84,7.43,90.1,94.1,4.44,正确 1/1/10,AMZN,0.52,0.24,18.5,7.551293.321044.32,-19.25,不正确 1/1/10,FB,3.32,7.79,15.05,0.63179.8156.8,-12.79,不正确 1/1/10,BABA,13.61,18.02122.56,25.31184.4205.4,11.39,正确 1/1/10,JNJ,5.18,2.54,39.44,8.06146.92185.92,26.55,正确 1/1/10,XOM,2.23,-2.17,94.32,14.52,87.43,48.43,-44.61,不正确 2011年1月1日,AAPL,7.27,3.35,42.9,12.04219.26230.26,5.02,更正 2011年1月1日,古格尔,4.01,12.8,24.87,2.341115.971135.97,1.79,更正 2011年1月1日,MSFT,5.4,14.04,33.84,5.04,94.1,88.1,-6.38,不正确 2011年1月1日,AMZN,0.59,0.31,19.04,9.311044.321396.32,33.71,正确 2011年1月1日,FB,2.8,9.08,16.04,0.74156.8151.8,-3.19,不正确 2011年1月1日,爸爸,12.68,19.03124.05,24.03205.4216.4,5.36,正确 2011年1月1日,JNJ,6.01,2.7,37.04,10.02185.92174.92,-5.92,不正确 1/1/11,XOM,2.8,-2.9,93.1,13.23,48.43,78.43,61.95,正确 2012年1月1日,AAPL,7.18,-4.88,67.78,26.03230.26209.26,-9.12,不正确 2012年1月1日,古格尔,1.05,0.47102.09,11.291135.971145.97,0.88,正确 2012年1月1日,MSFT,6.45,-5.68,59.01,21.42,88.1,58.1,-34.05,不正确 1/1/12,AMZN,6.23,1.59,19.44,6.911396.321276.32,-8.59,不正确 2012年1月1日,FB,6.08,-1.15,53.7,13.43151.8156.8,3.29,正确 2012年1月1日,爸爸,10.89,12.57194.62,20.91216.4204.4,-5.55,不正确 1/1/12,JNJ,5.88,5.48,78.08,12.8174.92184.92,5.72,正确 1/1/12,XOM,14.57,0.92121.11,13.76,78.43,66.43,-15.3,不正确

谢谢您的帮助。

正如@evamicur所解释的,您应该使用pandas library转换日期。 我会这样做,但您应该根据需要进行编辑:

import pandas as pd

df = pd.read_csv('my.csv')

df['Date'] = pd.to_datetime(df['Date'])

df.set_index('Date', inplace=True)
注意,我也会将NN的标签更改为0或1,而不是“正确”和“不正确”

df[' Label '] = df[' Label '].map({'Correct ': 1, 'Incorrect ': 0})
您还应该清除csv文件中的所有空格。
希望对您有所帮助。

使用pandas阅读,然后使用pandas的转换将其转换为您需要的任何格式。Pandas将数据存储为numpy数组,因此您基本上已经完成了,那么您可以提供一个执行此操作的代码示例吗?非常感谢。