Python 总结/减少N个特征为一个特征_Python_R_Machine Learning_Time Series_Feature Extraction

Python 总结/减少N个特征为一个特征

python r machine-learning

Python 总结/减少N个特征为一个特征,python,r,machine-learning,time-series,feature-extraction,Python,R,Machine Learning,Time Series,Feature Extraction,我有多维（f1、f2、f3）时间序列数据 # R CODE library(xts) timeseq <- seq(as.POSIXct("2017-06-01"),as.POSIXct("2017-06-20 23:59:59"),"hours") df <- data.frame(f1=rnorm(length(timeseq),30,1), f2=rnorm(length(timeseq),40,0.5), f

我有多维（

f1、f2、f3

）时间序列数据

# R CODE
library(xts)
timeseq <- seq(as.POSIXct("2017-06-01"),as.POSIXct("2017-06-20 23:59:59"),"hours")
df <- data.frame(f1=rnorm(length(timeseq),30,1),
                 f2=rnorm(length(timeseq),40,0.5),
                 f3=rnorm(length(timeseq),50, 2))
df_xts <-xts(df,timeseq)

#R代码
图书馆（xts）
timeseq即使使用最标准的特征简化方法之一（如主成分分析），也会丢失依赖于各种特征之间重叠的信息。例如，如果使用摘要（prcomp（coredata（df_xts），scale=TRUE））对数据集执行PCA
，第一个主成分仅捕获37%的方差，前两个主成分累计捕获70%的方差，这意味着你的序列和任何近似值之间存在非常微小的重叠，这将不可避免地导致信息丢失。与此相对应的是包含德国、瑞士、法国和英国股市指数水平的数据集，如data（EuStockMarkets）
。对于摘要（prcomp（diff（log（EuStockMarkets）），scale=TRUE，center=TRUE））
，仅第一个主成分就捕获了近75%的方差。在这种情况下，我们可以合理地用第一个主成分来代理股票市场收益数据。@hNu，感谢您的详细评论。您是对的，这种方法取决于数据的性质。我仍然在寻找一些替代方法，用一维来重新表示三维数据。