增加Azure ML中选定的行数_R_Azure_Prediction_Azure Machine Learning Studio

增加Azure ML中选定的行数

r azure

增加Azure ML中选定的行数,r,azure,prediction,azure-machine-learning-studio,R,Azure,Prediction,Azure Machine Learning Studio,我创建了一个反洗钱预测模型。问题是，当我执行r组件时，从数据集输入中只选择了1567行（结果数据集）（它包含大约85000行）。我想在训练和得分中至少包括7000人，但我不确定如何做到这一点输入数据集：结果数据集模型提前谢谢 # Map 1-based optional input ports to variables dataset <- maml.mapInputPort(1) # class: data.frame dataset$Capacidad <- as

我创建了一个反洗钱预测模型。问题是，当我执行r组件时，从数据集输入中只选择了1567行（结果数据集）（它包含大约85000行）。我想在训练和得分中至少包括7000人，但我不确定如何做到这一点

输入数据集：

结果数据集

模型

提前谢谢

# Map 1-based optional input ports to variables
dataset <- maml.mapInputPort(1) # class: data.frame

dataset$Capacidad <- as.numeric(dataset$Capacidad)

resource <- list()
output_forecast <- data.frame()


datasource <- data.frame(Fecha = character(0), Delegacion = character(0), Grupo_recurso = character(0), IDRecurso = character(0), Numero_proyectos = numeric(0), Cantidad = numeric(0), Capacidad = numeric(0), Productividad = numeric(0))


addToDatasource <- function(datasource_data_frame, fecha, delegacion, grupo_recurso, id_recurso, numero_proyectos, cantidad, capacidad, productividad){

  new_data_frame <- data.frame(Fecha = fecha, Delegacion = delegacion, Grupo_recurso = grupo_recurso, IDRecurso = id_recurso, Numero_proyectos = numero_proyectos, Cantidad = cantidad, Capacidad = capacidad, Productividad = productividad)

  return(rbind(datasource_data_frame, new_data_frame))
}

 resource_data <- dataset[!(dataset$Grupo_recurso %in% c("ADMIN", 
 "DIRECTOR", "EXTERNO", "GERENTE", "RESP OPERACIONES", 

 "MARKETING", "TELEMARKETING")), ]

resource_list <- unique(resource_data[(resource_data$Activo == 1), 
"IDRecurso"])
resource_list <- resource_list[!(resource_list %in% c("AFH", "BSS", "EDC","GLM", "GJ", "GPV"))]



for(i in 1:length(resource_list)){

  dataset_res <- dataset[(dataset$IDRecurso %in% resource_list[i]),]

  dataset_res$Fecha <- format(as.Date(dataset_res$Fecha), "%m-%Y")

  date_list <- unique(dataset_res$Fecha)
    for(j in 1:length(date_list)){

    dataset_date <- dataset_res[(dataset_res$Fecha == date_list[j]),]

    #Number of projects calculation
    number_projects <- length(unique(dataset_date$Proyecto))

    if(sum(dataset_date$Capacidad) > 0){

  #Productivity calculation
  productivity <- sum(dataset_date$Cantidad_productiva)/sum(dataset_date$Capacidad)

  datasource <- addToDatasource(datasource, date_list[j], unique(dataset_date$Delegacion), unique(dataset_res$Grupo_recurso), resource_list[i], number_projects, sum(dataset_date$Cantidad), sum(dataset_date$Capacidad), productivity)
}

#将基于1的可选输入端口映射到变量
数据集你能展示这个实验吗？我在我的问题中更新了图像。我可以通过添加行来复制行，但我认为这不是增加数据的好方法。但是，通过这些重复的行，我得到了期望的结果。您是否签入了分割数据
？它的参数。是的，我试过，但似乎不起作用。