Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/317.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 总结/减少N个特征为一个特征_Python_R_Machine Learning_Time Series_Feature Extraction - Fatal编程技术网

Python 总结/减少N个特征为一个特征

Python 总结/减少N个特征为一个特征,python,r,machine-learning,time-series,feature-extraction,Python,R,Machine Learning,Time Series,Feature Extraction,我有多维(f1、f2、f3)时间序列数据 # R CODE library(xts) timeseq <- seq(as.POSIXct("2017-06-01"),as.POSIXct("2017-06-20 23:59:59"),"hours") df <- data.frame(f1=rnorm(length(timeseq),30,1), f2=rnorm(length(timeseq),40,0.5), f

我有多维(
f1、f2、f3
)时间序列数据

# R CODE
library(xts)
timeseq <- seq(as.POSIXct("2017-06-01"),as.POSIXct("2017-06-20 23:59:59"),"hours")
df <- data.frame(f1=rnorm(length(timeseq),30,1),
                 f2=rnorm(length(timeseq),40,0.5),
                 f3=rnorm(length(timeseq),50, 2))
df_xts <-xts(df,timeseq)
#R代码
图书馆(xts)

timeseq即使使用最标准的特征简化方法之一(如主成分分析),也会丢失依赖于各种特征之间重叠的信息。例如,如果使用
摘要(prcomp(coredata(df_xts),scale=TRUE))对数据集执行PCA
,第一个主成分仅捕获37%的方差,前两个主成分累计捕获70%的方差,这意味着你的序列和任何近似值之间存在非常微小的重叠,这将不可避免地导致信息丢失。与此相对应的是包含德国、瑞士、法国和英国股市指数水平的数据集,如
data(EuStockMarkets)
。对于
摘要(prcomp(diff(log(EuStockMarkets)),scale=TRUE,center=TRUE))
,仅第一个主成分就捕获了近75%的方差。在这种情况下,我们可以合理地用第一个主成分来代理股票市场收益数据。@hNu,感谢您的详细评论。您是对的,这种方法取决于数据的性质。我仍然在寻找一些替代方法,用一维来重新表示三维数据。