从Rcpp函数返回数值向量列表

从Rcpp函数返回数值向量列表,r,rcpp,R,Rcpp,我试图计算高尔在一组物品之间的相似性。使用Rcpp包,我正在编写自己的函数来计算相似性值,因为对于较大的数据,daisy函数会抛出一个错误 功能是: #include <Rcpp.h> using namespace Rcpp; // [[Rcpp::export]] List gowerSim(CharacterMatrix inp) { int n_row = inp.nrow(), n_col = inp.ncol(); int sumRow = 0, colLen

我试图计算高尔在一组物品之间的相似性。使用Rcpp包,我正在编写自己的函数来计算相似性值,因为对于较大的数据,daisy函数会抛出一个错误

功能是:

#include <Rcpp.h>
using namespace Rcpp;

// [[Rcpp::export]]
List gowerSim(CharacterMatrix inp) {

  int n_row = inp.nrow(), n_col = inp.ncol();
  int sumRow = 0, colLen;
  List out(n_row);

  //double sim[n_row];
  NumericVector sim(n_row);

  for (int i = 0; i < n_row; i++) {

    for (int j = 0; j < n_row; j++) {

      sumRow = 0; 
      colLen = n_col;

      for (int k = 0; k < n_col; k++) {
        if (inp(i,k) != "NA" && inp(j,k) != "NA") {

          if (inp(i,k) != inp(j,k)) {
            sumRow = sumRow + 1;
          }
        } else {
          colLen = colLen - 1;
        }
      }
      if (colLen > 0) {
        sim[j] = (double) sumRow/colLen;
        //printf("%f",sim[j]);
      } else {
        sim[j] = NA_INTEGER;
      }
    }

    out[i] = sim;

    if (i < 3) {
      print(out);
    }
  }

  return out;
}

/*** R
clust<-gowerSim(inp)
*/
#包括
使用名称空间Rcpp;
//[[Rcpp::导出]]
列表gowerSim(字符矩阵inp){
int n_row=inp.nrow(),n_col=inp.ncol();
int-sumRow=0,科伦;
列出(n_行);
//双卡[n_行];
数字向量sim(n_行);
对于(int i=0;i0){
sim[j]=(双)sumRow/colLen;
//printf(“%f”,sim[j]);
}否则{
sim[j]=NA_整数;
}
}
out[i]=sim;
如果(i<3){
打印(输出);
}
}
返回;
}
/***R

clust此问题的解决方案是在第一个
for
命令之后定义向量
sim
,如下所示:

List gowerSim(CharacterMatrix inp) {

  int n_row = inp.nrow(), n_col = inp.ncol();
  int sumRow=0,colLen;
  List out(n_row);

  for(int i=0;i<n_row;i++){

    NumericVector sim(n_row);

    for(int j=0;j<n_row;j++){
      sumRow=0; 
      colLen=n_col;
      for(int k=0; k<n_col;k++){
        if(inp(i,k)!="NA" && inp(j,k)!="NA"){
          if(inp(i,k)!=inp(j,k)){
            sumRow=sumRow+1;
          }
        }else{
          colLen=colLen-1;
        }
      }
      if(colLen>0){
        sim[j] = (double) sumRow/colLen;
        //printf("%f",sim[j]);
      }else{
        sim[j] = NA_INTEGER;
      }
    }
    out[i] = sim;
    if(i<3){
      print(out);
    }
  }

  return out;
}
List gowerSim(字符矩阵inp){
int n_row=inp.nrow(),n_col=inp.ncol();
int-sumRow=0,科伦;
列出(n_行);

对于(int i=0;它是有效的..非常感谢。你能再解释一下为什么这样做的逻辑吗?sim被声明为一个向量来存储迭代器“i”和“j”的所有组合的相似性,然后分配给out。那么为什么它失败了呢?
mat <- matrix( as.character(c(rep(1,5),sample(3,15,repl=TRUE),rep(5,5))),5)
clust <- gowerSim(mat)
clust
NumericMatrix gowerSim(CharacterMatrix inp) {

  int n_row = inp.nrow(), n_col = inp.ncol();
  int sumRow=0,colLen;
  NumericMatrix out(n_row, n_col);
  NumericVector sim(n_row);

  for(int i=0;i<n_row;i++);

    for(int j=0;j<n_row;j++){
      sumRow=0; 
      colLen=n_col;
      for(int k=0; k<n_col;k++){
        if(inp(i,k)!="NA" && inp(j,k)!="NA"){
          if(inp(i,k)!=inp(j,k)){
            sumRow=sumRow+1;
          }
        }else{
          colLen=colLen-1;
        }
      }
      if(colLen>0){
        sim[j] = (double) sumRow/colLen;
        //printf("%f",sim[j]);
      }else{
        sim[j] = NA_INTEGER;
      }
    }
    out(_,i) = sim;
    if(i<3){
      print(out);
    }
  }

  return out;
}