Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/ssl/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 在一组相关变量中,我如何推断出哪个变量子集最能描述其余变量?_Machine Learning_Statistics_Correlation_Prediction_Information Theory - Fatal编程技术网

Machine learning 在一组相关变量中,我如何推断出哪个变量子集最能描述其余变量?

Machine learning 在一组相关变量中,我如何推断出哪个变量子集最能描述其余变量?,machine-learning,statistics,correlation,prediction,information-theory,Machine Learning,Statistics,Correlation,Prediction,Information Theory,我有一个60个传感器的数据集,进行1684次测量。我希望减少实验中使用的传感器数量,并使用剩余的传感器数据预测(使用机器学习)移除的传感器 我查看了数据(请参阅),发现了传感器之间的一些强相关性,这应该可以移除X个传感器,并使用剩余的传感器预测其行为 我如何“评分”哪一组传感器(X)最能预测剩余的一组(60-X)?您熟悉主成分分析(PCA)吗?这是方差分析(ANOVA)的产物。降维是描述这个过程的另一个术语 这些通常针对预测单个输出的一组输入,而不是一组对等测量。为了使您的案例适应这些方法,我认

我有一个60个传感器的数据集,进行1684次测量。我希望减少实验中使用的传感器数量,并使用剩余的传感器数据预测(使用机器学习)移除的传感器

我查看了数据(请参阅),发现了传感器之间的一些强相关性,这应该可以移除X个传感器,并使用剩余的传感器预测其行为

我如何“评分”哪一组传感器(X)最能预测剩余的一组(60-X)?

您熟悉主成分分析(PCA)吗?这是方差分析(ANOVA)的产物。降维是描述这个过程的另一个术语

这些通常针对预测单个输出的一组输入,而不是一组对等测量。为了使您的案例适应这些方法,我认为您应该首先考虑60个传感器中的每一个,依次作为“地面真相”,看看哪些传感器可以最可靠地由其余传感器驱动。移除这些并重复该过程,直到达到所需的相关性阈值


我还建议用遗传方法来进行这种筛选;也许随机森林在这一阶段会有所帮助。

采用pca。现在我们有两个小组,说20“入”和240“出”。从随机分配开始,这应该很好。现在对两组进行主成分分析,并提出互换方案,看看代表组的主成分分析是否更接近整个组的主成分分析。不随机创建组,是否可能;1) 计算每个变量的原始数据与第一主成分(PC1)之间的相关性2)移除与PC1相关性最差的传感器