Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/280.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 最大化组内相关性,同时最小化组间相关性_Python_R_Machine Learning_Data Science - Fatal编程技术网

Python 最大化组内相关性,同时最小化组间相关性

Python 最大化组内相关性,同时最小化组间相关性,python,r,machine-learning,data-science,Python,R,Machine Learning,Data Science,我试图找出是否有一种方法可以对对象进行排序,从而最大化组内相关性并最小化组间相关性 例如,假设数据帧DF包含12列s1到s12,每个列具有100个观察值。假设每个代表股票回报率 我想找到一种方法,将这些数据分为3组,每组4个变量,最大化组内相关性,最小化组间相关性。 假设皮尔逊方法很有效 df_cor <- cor(df) df_cor一段时间前,我写了一个函数,它采用矩阵或数据帧(预测值),并返回高度相关的对,同时考虑了许多参数。希望这就是你真正要求的 示例数据 lst_s = lis

我试图找出是否有一种方法可以对对象进行排序,从而最大化组内相关性并最小化组间相关性

例如,假设数据帧DF包含12列s1到s12,每个列具有100个观察值。假设每个代表股票回报率

我想找到一种方法,将这些数据分为3组,每组4个变量,最大化组内相关性,最小化组间相关性。 假设皮尔逊方法很有效

df_cor <- cor(df)

df_cor一段时间前,我写了一个函数,它采用矩阵或数据帧(预测值),并返回高度相关的对,同时考虑了许多参数。希望这就是你真正要求的

示例数据

lst_s = list()

set.seed(1) 
for (i in 1:12) {

  nam = paste0("s_", i)

  lst_s[[nam]] = runif(100)
}

s_matr = do.call(cbind, lst_s)
通过使用,您可以安装软件包,然后运行

dat = FeatureSelection::func_correlation(s_matr, target = NULL, correlation_thresh = 0.05, use_obs = "everything", correlation_method = "pearson")

# here the *correlation_thresh* is low because I use random data, adjust it to your needs
它返回一个列表(out_list)和一个数据帧(out_df)。该列表显示了高于相关阈值的单个预测值的相关性

然而,数据帧显示了高于相关_阈值的所有预测器对


不久前,我写了一个函数,它采用一个矩阵或数据帧(预测器)并返回高度相关的对,同时考虑了许多参数。希望这就是你真正要求的

示例数据

lst_s = list()

set.seed(1) 
for (i in 1:12) {

  nam = paste0("s_", i)

  lst_s[[nam]] = runif(100)
}

s_matr = do.call(cbind, lst_s)
通过使用,您可以安装软件包,然后运行

dat = FeatureSelection::func_correlation(s_matr, target = NULL, correlation_thresh = 0.05, use_obs = "everything", correlation_method = "pearson")

# here the *correlation_thresh* is low because I use random data, adjust it to your needs
它返回一个列表(out_list)和一个数据帧(out_df)。该列表显示了高于相关阈值的单个预测值的相关性

然而,数据帧显示了高于相关_阈值的所有预测器对


谢谢你的回复!我想知道你的函数和融合相关矩阵(以及按相关降序排序)有什么区别?@TaeyoungAhn,我想我的答案不是你实际期望的结果。谢谢你的回答!我想知道你的函数和融合相关矩阵(以及按相关降序排序)有什么区别?@TaeyoungAhn,我想我的答案并不是你实际期望的结果。