Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/66.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
增加Azure ML中选定的行数_R_Azure_Prediction_Azure Machine Learning Studio - Fatal编程技术网

增加Azure ML中选定的行数

增加Azure ML中选定的行数,r,azure,prediction,azure-machine-learning-studio,R,Azure,Prediction,Azure Machine Learning Studio,我创建了一个反洗钱预测模型。问题是,当我执行r组件时,从数据集输入中只选择了1567行(结果数据集)(它包含大约85000行)。我想在训练和得分中至少包括7000人,但我不确定如何做到这一点 输入数据集: 结果数据集 模型 提前谢谢 # Map 1-based optional input ports to variables dataset <- maml.mapInputPort(1) # class: data.frame dataset$Capacidad <- as

我创建了一个反洗钱预测模型。问题是,当我执行r组件时,从数据集输入中只选择了1567行(结果数据集)(它包含大约85000行)。我想在训练和得分中至少包括7000人,但我不确定如何做到这一点

输入数据集:

结果数据集

模型

提前谢谢

# Map 1-based optional input ports to variables
dataset <- maml.mapInputPort(1) # class: data.frame

dataset$Capacidad <- as.numeric(dataset$Capacidad)

resource <- list()
output_forecast <- data.frame()


datasource <- data.frame(Fecha = character(0), Delegacion = character(0), Grupo_recurso = character(0), IDRecurso = character(0), Numero_proyectos = numeric(0), Cantidad = numeric(0), Capacidad = numeric(0), Productividad = numeric(0))


addToDatasource <- function(datasource_data_frame, fecha, delegacion, grupo_recurso, id_recurso, numero_proyectos, cantidad, capacidad, productividad){

  new_data_frame <- data.frame(Fecha = fecha, Delegacion = delegacion, Grupo_recurso = grupo_recurso, IDRecurso = id_recurso, Numero_proyectos = numero_proyectos, Cantidad = cantidad, Capacidad = capacidad, Productividad = productividad)

  return(rbind(datasource_data_frame, new_data_frame))
}

 resource_data <- dataset[!(dataset$Grupo_recurso %in% c("ADMIN", 
 "DIRECTOR", "EXTERNO", "GERENTE", "RESP OPERACIONES", 

 "MARKETING", "TELEMARKETING")), ]

resource_list <- unique(resource_data[(resource_data$Activo == 1), 
"IDRecurso"])
resource_list <- resource_list[!(resource_list %in% c("AFH", "BSS", "EDC","GLM", "GJ", "GPV"))]



for(i in 1:length(resource_list)){

  dataset_res <- dataset[(dataset$IDRecurso %in% resource_list[i]),]

  dataset_res$Fecha <- format(as.Date(dataset_res$Fecha), "%m-%Y")

  date_list <- unique(dataset_res$Fecha)
    for(j in 1:length(date_list)){

    dataset_date <- dataset_res[(dataset_res$Fecha == date_list[j]),]

    #Number of projects calculation
    number_projects <- length(unique(dataset_date$Proyecto))

    if(sum(dataset_date$Capacidad) > 0){

  #Productivity calculation
  productivity <- sum(dataset_date$Cantidad_productiva)/sum(dataset_date$Capacidad)

  datasource <- addToDatasource(datasource, date_list[j], unique(dataset_date$Delegacion), unique(dataset_res$Grupo_recurso), resource_list[i], number_projects, sum(dataset_date$Cantidad), sum(dataset_date$Capacidad), productivity)
}
#将基于1的可选输入端口映射到变量

数据集你能展示这个实验吗?我在我的问题中更新了图像。我可以通过添加行来复制行,但我认为这不是增加数据的好方法。但是,通过这些重复的行,我得到了期望的结果。您是否签入了
分割数据
?它的参数。是的,我试过,但似乎不起作用。