将rxPredict与rxLogit一起使用在R轴上_R_Revolution R

将rxPredict与rxLogit一起使用在R轴上

将rxPredict与rxLogit一起使用在R轴上,r,revolution-r,R,Revolution R,我在Revolution R（Package RevoScaleR）中使用了rxLogit函数来拟合一个逻辑回归模型，该模型包含许多分类变量（例如STATE-IL、FL、OH、CA、TX…）和一对数字变量。当我试图使用rxPredict函数对数据进行评分时，我得到了一个错误 INTERNAL ERROR: In rxPredict, the number of parameters does not match the number of variables: 16 vs. 45. 我理解的

我在Revolution R（Package RevoScaleR）中使用了rxLogit函数来拟合一个逻辑回归模型，该模型包含许多分类变量（例如STATE-IL、FL、OH、CA、TX…）和一对数字变量。当我试图使用rxPredict函数对数据进行评分时，我得到了一个错误

INTERNAL ERROR: In rxPredict, the number of parameters does not match the number of  variables: 16 vs. 45.

我理解的一件事是，评分数据只有较少的类别（比如STATE-IL数据）。因此，提供给模型的参数数量少于模型中的变量数量

我写的代码是：

winlossmodel <- rxLogit(Flag ~ price+quantity+product_group+state+mode_of_transportation+cluster, data = training_data)

winlosspredict <- rxPredict(winlossmodel, data=scoring_data,type="response",checkFactorLevels=FALSE)

winlossmodel是的，我想说，所以试着将训练数据的数量限制在与评分数据相同的数量，以检查这是否会影响错误是的，它确实会影响错误。但这是适合模型的正确方法吗？如果我只获取一个产品组、一个州和一种运输方式的培训数据，那么我正在构建一个有偏见的模型。我不是吗？我认为我需要为所有产品组、所有州和所有运输方式类别建立一个模型。然后预测一个特定状态、产品组和运输的mdoe的响应。如果我遗漏了什么或者我错了，请纠正我。谢谢，我不是统计学家，但是是的，你应该使用所有州的所有数据。如果你对统计数据有疑问，问问有没有人在这方面运气好？我这里有一个类似的问题。我同意你的观点，因为模型应该基于所有可用数据进行参数化，rxPredict
函数可以基于单个或更少的输入预测结果——在你的例子中，是单个状态和产品组（假设价格和数量不是分类的）。