将纵断面与具有R的结构进行比较_R

将纵断面与具有R的结构进行比较

将纵断面与具有R的结构进行比较,r,R,我想比较一个配置文件（变量的平均外观）和一个给定的结构（变量的真实外观）该数据集与配置文件p的数据集类似： structure(list(V1 = c(0.047, 0.092, 0.065, 0.091, 0.076, 0.067, 0.087, 0.065, 0.076, 0.052), V2 = c(0.086, 0.06, 0.056, 0.076, 0.09, 0.071, 0.075, 0.063, 0.078, 0.038), V3 = c(0.065, 0.085, 0.

我想比较一个配置文件（变量的平均外观）和一个给定的结构（变量的真实外观）

该数据集与配置文件p的数据集类似：

structure(list(V1 = c(0.047, 0.092, 0.065, 0.091, 0.076, 0.067, 
0.087, 0.065, 0.076, 0.052), V2 = c(0.086, 0.06, 0.056, 0.076, 
0.09, 0.071, 0.075, 0.063, 0.078, 0.038), V3 = c(0.065, 0.085, 
0.097, 0.082, 0.061, 0.053, 0.073, 0.083, 0.073, 0.081), V4 = c(0.071, 
0.083, 0.091, 0.07, 0.063, 0.067, 0.107, 0.071, 0.109, 0.094), 
    V5 = c(0.102, 0.104, 0.107, 0.101, 0.12, 0.116, 0.113, 0.112, 
    0.122, 0.1), V6 = c(0.086, 0.067, 0.091, 0.08, 0.07, 0.067, 
    0.073, 0.067, 0.083, 0.081), V7 = c(0.086, 0.079, 0.095, 
    0.082, 0.093, 0.114, 0.081, 0.079, 0.078, 0.083), V8 = c(0.053, 
    0.056, 0.046, 0.058, 0.067, 0.037, 0.043, 0.057, 0.034, 0.063
    ), V9 = c(0.069, 0.065, 0.069, 0.042, 0.067, 0.069, 0.071, 
    0.075, 0.06, 0.096), V10 = c(0.067, 0.054, 0.048, 0.042, 
    0.063, 0.051, 0.045, 0.053, 0.058, 0.073), V11 = c(0.024, 
    0.044, 0.042, 0.066, 0.023, 0.051, 0.024, 0.024, 0.022, 0.044
    ), V12 = c(0.047, 0.048, 0.048, 0.04, 0.044, 0.047, 0.045, 
    0.051, 0.042, 0.052), V13 = c(0.075, 0.075, 0.056, 0.072, 
    0.053, 0.079, 0.075, 0.079, 0.06, 0.046), V14 = c(0.122, 
    0.088, 0.089, 0.095, 0.11, 0.11, 0.087, 0.12, 0.105, 0.098
    )), .Names = c("V1", "V2", "V3", "V4", "V5", "V6", "V7", 
"V8", "V9", "V10", "V11", "V12", "V13", "V14"), row.names = c(NA, 
10L), class = "data.frame")

结构如下所示：

structure(c(1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 
1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 
1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 
1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 
0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 
1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 
0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 
1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 
1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 
0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0), .Dim = c(20L, 14L), .Dimnames = list(
    NULL, c("UH6401", "UH6402", "UH6403", "UH6404", "UH6409", 
    "UH6410", "UH6411", "UH6412", "UH6503", "UH66", "UH68", "UH6501a", 
    "UH6405a", "UH6407a")))

     V1    V2    V3    V4    V5    V6    V7    V8    V9   V10   V11   V12   V13   V14
1  0.047 0.086 0.065 0.071 0.102 0.086 0.086 0.053 0.069 0.067 0.024 0.047 0.075 0.122
2  0.092 0.060 0.085 0.083 0.104 0.067 0.079 0.056 0.065 0.054 0.044 0.048 0.075 0.088
3  0.065 0.056 0.097 0.091 0.107 0.091 0.095 0.046 0.069 0.048 0.042 0.048 0.056 0.089
4  0.091 0.076 0.082 0.070 0.101 0.080 0.082 0.058 0.042 0.042 0.066 0.040 0.072 0.095
5  0.076 0.090 0.061 0.063 0.120 0.070 0.093 0.067 0.067 0.063 0.023 0.044 0.053 0.110
6  0.067 0.071 0.053 0.067 0.116 0.067 0.114 0.037 0.069 0.051 0.051 0.047 0.079 0.110
7  0.087 0.075 0.073 0.107 0.113 0.073 0.081 0.043 0.071 0.045 0.024 0.045 0.075 0.087
8  0.065 0.063 0.083 0.071 0.112 0.067 0.079 0.057 0.075 0.053 0.024 0.051 0.079 0.120
9  0.076 0.078 0.073 0.109 0.122 0.083 0.078 0.034 0.060 0.058 0.022 0.042 0.060 0.105
10 0.052 0.038 0.081 0.094 0.100 0.081 0.083 0.063 0.096 0.073 0.044 0.052 0.046 0.098

      V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14
 [1,]  1  1  0  1  0  1  0  1  1   1   0   1   1   0
 [2,]  1  1  1  0  1  1  0  1  1   1   0   1   1   1
 [3,]  0  0  0  0  0  1  0  1  1   1   0   0   1   0
 [4,]  1  1  0  0  0  0  0  1  1   1   0   1   0   0
 [5,]  1  1  1  1  0  1  1  1  1   1   1   1   0   0
 [6,]  0  0  0  0  0  0  1  1  1   1   0   1   0   0
 [7,]  1  1  1  0  0  1  0  1  0   0   1   0   0   0
 [8,]  0  0  0  0  0  0  0  0  1   1   0   1   0   0
 [9,]  1  1  1  1  1  0  0  1  1   1   1   1   0   0
[10,]  1  1  1  1  0  0  0  1  1   1   1   1   1   0
[11,]  0  0  0  0  0  1  1  1  1   1   0   1   0   0
[12,]  1  1  0  0  0  0  0  1  1   1   1   1   1   0
[13,]  0  1  0  1  0  1  0  1  1   1   0   1   0   0
[14,]  0  0  0  0  0  1  1  1  1   1   0   1   0   0
[15,]  1  0  1  1  0  0  0  1  1   1   1   1   0   0
[16,]  1  1  1  1  0  0  0  1  1   1   0   1   0   0
[17,]  1  1  1  0  0  1  1  1  1   1   0   1   1   1
[18,]  1  1  1  0  0  1  0  1  1   1   0   1   0   0
[19,]  1  1  1  1  1  1  1  1  1   1   1   1   1   1
[20,]  1  1  1  1  0  0  0  1  1   1   0   1   0   0

因此，在这两种情况下，变量的数量是相等的。还有结构。差异是每个单元格中的数字。在配置文件中，它是一个浮点数，单元格是二进制的（变量是否可用）。现在我想找到profiles矩阵的这一行，它最接近structure行

更新：

好吧，也许我的描述有点不清楚，我不应该使用有特定含义的术语。因此，我尝试详细说明我尝试做的事情。如果我们看第一个矩阵，它是这样的：

structure(c(1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 
1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 
1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 
1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 
0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 
1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 
0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 
1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 
1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 
0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0), .Dim = c(20L, 14L), .Dimnames = list(
    NULL, c("UH6401", "UH6402", "UH6403", "UH6404", "UH6409", 
    "UH6410", "UH6411", "UH6412", "UH6503", "UH66", "UH68", "UH6501a", 
    "UH6405a", "UH6407a")))

     V1    V2    V3    V4    V5    V6    V7    V8    V9   V10   V11   V12   V13   V14
1  0.047 0.086 0.065 0.071 0.102 0.086 0.086 0.053 0.069 0.067 0.024 0.047 0.075 0.122
2  0.092 0.060 0.085 0.083 0.104 0.067 0.079 0.056 0.065 0.054 0.044 0.048 0.075 0.088
3  0.065 0.056 0.097 0.091 0.107 0.091 0.095 0.046 0.069 0.048 0.042 0.048 0.056 0.089
4  0.091 0.076 0.082 0.070 0.101 0.080 0.082 0.058 0.042 0.042 0.066 0.040 0.072 0.095
5  0.076 0.090 0.061 0.063 0.120 0.070 0.093 0.067 0.067 0.063 0.023 0.044 0.053 0.110
6  0.067 0.071 0.053 0.067 0.116 0.067 0.114 0.037 0.069 0.051 0.051 0.047 0.079 0.110
7  0.087 0.075 0.073 0.107 0.113 0.073 0.081 0.043 0.071 0.045 0.024 0.045 0.075 0.087
8  0.065 0.063 0.083 0.071 0.112 0.067 0.079 0.057 0.075 0.053 0.024 0.051 0.079 0.120
9  0.076 0.078 0.073 0.109 0.122 0.083 0.078 0.034 0.060 0.058 0.022 0.042 0.060 0.105
10 0.052 0.038 0.081 0.094 0.100 0.081 0.083 0.063 0.096 0.073 0.044 0.052 0.046 0.098

      V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14
 [1,]  1  1  0  1  0  1  0  1  1   1   0   1   1   0
 [2,]  1  1  1  0  1  1  0  1  1   1   0   1   1   1
 [3,]  0  0  0  0  0  1  0  1  1   1   0   0   1   0
 [4,]  1  1  0  0  0  0  0  1  1   1   0   1   0   0
 [5,]  1  1  1  1  0  1  1  1  1   1   1   1   0   0
 [6,]  0  0  0  0  0  0  1  1  1   1   0   1   0   0
 [7,]  1  1  1  0  0  1  0  1  0   0   1   0   0   0
 [8,]  0  0  0  0  0  0  0  0  1   1   0   1   0   0
 [9,]  1  1  1  1  1  0  0  1  1   1   1   1   0   0
[10,]  1  1  1  1  0  0  0  1  1   1   1   1   1   0
[11,]  0  0  0  0  0  1  1  1  1   1   0   1   0   0
[12,]  1  1  0  0  0  0  0  1  1   1   1   1   1   0
[13,]  0  1  0  1  0  1  0  1  1   1   0   1   0   0
[14,]  0  0  0  0  0  1  1  1  1   1   0   1   0   0
[15,]  1  0  1  1  0  0  0  1  1   1   1   1   0   0
[16,]  1  1  1  1  0  0  0  1  1   1   0   1   0   0
[17,]  1  1  1  0  0  1  1  1  1   1   0   1   1   1
[18,]  1  1  1  0  0  1  0  1  1   1   0   1   0   0
[19,]  1  1  1  1  1  1  1  1  1   1   1   1   1   1
[20,]  1  1  1  1  0  0  0  1  1   1   0   1   0   0

每行代表一个所谓的变量配置文件（V1到V14）。我把蓝线称为变量的轮廓（Ausländer、Keine Umweltbelastung等）

每行的总和是1，因此每个单元格中的数字是整行变量的分数

Resp是一个21000 x 14矩阵，如下所示：

structure(c(1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 1, 1, 1, 
1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 
1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 1, 1, 1, 
1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 
0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 
1, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 
0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 
1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 1, 0, 
1, 0, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 1, 0, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 
0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0), .Dim = c(20L, 14L), .Dimnames = list(
    NULL, c("UH6401", "UH6402", "UH6403", "UH6404", "UH6409", 
    "UH6410", "UH6411", "UH6412", "UH6503", "UH66", "UH68", "UH6501a", 
    "UH6405a", "UH6407a")))

     V1    V2    V3    V4    V5    V6    V7    V8    V9   V10   V11   V12   V13   V14
1  0.047 0.086 0.065 0.071 0.102 0.086 0.086 0.053 0.069 0.067 0.024 0.047 0.075 0.122
2  0.092 0.060 0.085 0.083 0.104 0.067 0.079 0.056 0.065 0.054 0.044 0.048 0.075 0.088
3  0.065 0.056 0.097 0.091 0.107 0.091 0.095 0.046 0.069 0.048 0.042 0.048 0.056 0.089
4  0.091 0.076 0.082 0.070 0.101 0.080 0.082 0.058 0.042 0.042 0.066 0.040 0.072 0.095
5  0.076 0.090 0.061 0.063 0.120 0.070 0.093 0.067 0.067 0.063 0.023 0.044 0.053 0.110
6  0.067 0.071 0.053 0.067 0.116 0.067 0.114 0.037 0.069 0.051 0.051 0.047 0.079 0.110
7  0.087 0.075 0.073 0.107 0.113 0.073 0.081 0.043 0.071 0.045 0.024 0.045 0.075 0.087
8  0.065 0.063 0.083 0.071 0.112 0.067 0.079 0.057 0.075 0.053 0.024 0.051 0.079 0.120
9  0.076 0.078 0.073 0.109 0.122 0.083 0.078 0.034 0.060 0.058 0.022 0.042 0.060 0.105
10 0.052 0.038 0.081 0.094 0.100 0.081 0.083 0.063 0.096 0.073 0.044 0.052 0.046 0.098

      V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14
 [1,]  1  1  0  1  0  1  0  1  1   1   0   1   1   0
 [2,]  1  1  1  0  1  1  0  1  1   1   0   1   1   1
 [3,]  0  0  0  0  0  1  0  1  1   1   0   0   1   0
 [4,]  1  1  0  0  0  0  0  1  1   1   0   1   0   0
 [5,]  1  1  1  1  0  1  1  1  1   1   1   1   0   0
 [6,]  0  0  0  0  0  0  1  1  1   1   0   1   0   0
 [7,]  1  1  1  0  0  1  0  1  0   0   1   0   0   0
 [8,]  0  0  0  0  0  0  0  0  1   1   0   1   0   0
 [9,]  1  1  1  1  1  0  0  1  1   1   1   1   0   0
[10,]  1  1  1  1  0  0  0  1  1   1   1   1   1   0
[11,]  0  0  0  0  0  1  1  1  1   1   0   1   0   0
[12,]  1  1  0  0  0  0  0  1  1   1   1   1   1   0
[13,]  0  1  0  1  0  1  0  1  1   1   0   1   0   0
[14,]  0  0  0  0  0  1  1  1  1   1   0   1   0   0
[15,]  1  0  1  1  0  0  0  1  1   1   1   1   0   0
[16,]  1  1  1  1  0  0  0  1  1   1   0   1   0   0
[17,]  1  1  1  0  0  1  1  1  1   1   0   1   1   1
[18,]  1  1  1  0  0  1  0  1  1   1   0   1   0   0
[19,]  1  1  1  1  1  1  1  1  1   1   1   1   1   1
[20,]  1  1  1  1  0  0  0  1  1   1   0   1   0   0

每一行现在都是响应者，单元格条目指示变量（V1到V14）是否对他可用（1）或不可用（0）。VAR中的条目是一个亚组所有受访者的平均数据，而resp中的条目是观察到的。变量表示组的邻域结构。变量显示10个不同的子组。我想知道，resp的受访者可能属于哪个亚组。因此，我需要将resp中的每一行与vars中的每一行进行比较。我会假设，受访者属于总体差异最小的亚组。我的第一个想法是将resp的每一行除以行的总和，但结果并不适用。接下来，我想通过平均轮廓来加权每个变量，即：

aver <- c(0.0718023287061849, 0.0693420423225302, 0.0753384763664876, 
0.0827043835101492, 0.109631516692048, 0.0765927537218141, 0.0870322381232645, 
0.0515014684350035, 0.0683398169561522, 0.0554744519820495, 0.0363337127130046, 
0.0463575341160886, 0.0671060291182815, 0.102443247236942)

aver在第二种情况下，有一个矩阵，它实际上是一个长度为prod（dim（mtx））
的折叠向量，其折叠由其.dim
属性管理。在第一种情况下，您有一种特殊形式的长度==14的列表，称为数据帧，它与矩形列表类似，但与矩阵不同，可能具有不同模式的值：逻辑、整数、字符、数字或因子。它实际上是一组经过同等长度测试的命名列表。你说的是细胞和轮廓，但它们都不是真正的R术语，所以有点不清楚你最后两个问题的真正目的是什么
如果希望快速查看数据对象，请尝试：
str(object-name)

回答：如果我正确理解您的更新，您希望在第一个对象（我将称为“Profiles”）和第二个对象（我将称为“Cells”）中的行之间建立距离度量。因为所有配置文件行总和为1，所以它们的平均值为1/14。您可以创建一个矩阵，其元素为1或0，这取决于“Profiles”中的每个行/列项目是高于平均值还是低于平均值。称之为“procells”
您可以忽略比较不同procell行和单元格行的距离，只关注procell和单元格之间的距离。我想您会在
中找到其他适用的策略，您如何定义close？什么会使配置文件行接近结构行？@PLapointe:我刚刚更新了描述……我刚刚更新了描述。我希望更好地理解我在寻找什么。