Python 最大化组内相关性，同时最小化组间相关性_Python_R_Machine Learning_Data Science

Python 最大化组内相关性，同时最小化组间相关性

python r machine-learning

Python 最大化组内相关性，同时最小化组间相关性,python,r,machine-learning,data-science,Python,R,Machine Learning,Data Science,我试图找出是否有一种方法可以对对象进行排序，从而最大化组内相关性并最小化组间相关性例如，假设数据帧DF包含12列s1到s12，每个列具有100个观察值。假设每个代表股票回报率我想找到一种方法，将这些数据分为3组，每组4个变量，最大化组内相关性，最小化组间相关性。假设皮尔逊方法很有效 df_cor <- cor(df) df_cor一段时间前，我写了一个函数，它采用矩阵或数据帧（预测值），并返回高度相关的对，同时考虑了许多参数。希望这就是你真正要求的示例数据 lst_s = lis

我试图找出是否有一种方法可以对对象进行排序，从而最大化组内相关性并最小化组间相关性

例如，假设数据帧DF包含12列s1到s12，每个列具有100个观察值。假设每个代表股票回报率

我想找到一种方法，将这些数据分为3组，每组4个变量，最大化组内相关性，最小化组间相关性。假设皮尔逊方法很有效

df_cor <- cor(df)

df_cor一段时间前，我写了一个函数，它采用矩阵或数据帧（预测值），并返回高度相关的对，同时考虑了许多参数。希望这就是你真正要求的
示例数据
lst_s = list()

set.seed(1) 
for (i in 1:12) {

  nam = paste0("s_", i)

  lst_s[[nam]] = runif(100)
}

s_matr = do.call(cbind, lst_s)

通过使用，您可以安装软件包，然后运行
dat = FeatureSelection::func_correlation(s_matr, target = NULL, correlation_thresh = 0.05, use_obs = "everything", correlation_method = "pearson")

# here the *correlation_thresh* is low because I use random data, adjust it to your needs

它返回一个列表（out_list）和一个数据帧（out_df）。该列表显示了高于相关阈值的单个预测值的相关性
然而，数据帧显示了高于相关_阈值的所有预测器对
不久前，我写了一个函数，它采用一个矩阵或数据帧（预测器）并返回高度相关的对，同时考虑了许多参数。希望这就是你真正要求的
示例数据
lst_s = list()

set.seed(1) 
for (i in 1:12) {

  nam = paste0("s_", i)

  lst_s[[nam]] = runif(100)
}

s_matr = do.call(cbind, lst_s)

通过使用，您可以安装软件包，然后运行
dat = FeatureSelection::func_correlation(s_matr, target = NULL, correlation_thresh = 0.05, use_obs = "everything", correlation_method = "pearson")

# here the *correlation_thresh* is low because I use random data, adjust it to your needs

它返回一个列表（out_list）和一个数据帧（out_df）。该列表显示了高于相关阈值的单个预测值的相关性
然而，数据帧显示了高于相关_阈值的所有预测器对
谢谢你的回复！我想知道你的函数和融合相关矩阵（以及按相关降序排序）有什么区别？@TaeyoungAhn，我想我的答案不是你实际期望的结果。谢谢你的回答！我想知道你的函数和融合相关矩阵（以及按相关降序排序）有什么区别？@TaeyoungAhn，我想我的答案并不是你实际期望的结果。