将rxPredict与rxLogit一起使用在R轴上

将rxPredict与rxLogit一起使用在R轴上,r,revolution-r,R,Revolution R,我在Revolution R(Package RevoScaleR)中使用了rxLogit函数来拟合一个逻辑回归模型,该模型包含许多分类变量(例如STATE-IL、FL、OH、CA、TX…)和一对数字变量。当我试图使用rxPredict函数对数据进行评分时,我得到了一个错误 INTERNAL ERROR: In rxPredict, the number of parameters does not match the number of variables: 16 vs. 45. 我理解的

我在Revolution R(Package RevoScaleR)中使用了rxLogit函数来拟合一个逻辑回归模型,该模型包含许多分类变量(例如STATE-IL、FL、OH、CA、TX…)和一对数字变量。当我试图使用rxPredict函数对数据进行评分时,我得到了一个错误

INTERNAL ERROR: In rxPredict, the number of parameters does not match the number of  variables: 16 vs. 45.
我理解的一件事是,评分数据只有较少的类别(比如STATE-IL数据)。因此,提供给模型的参数数量少于模型中的变量数量

我写的代码是:

winlossmodel <- rxLogit(Flag ~ price+quantity+product_group+state+mode_of_transportation+cluster, data = training_data)

winlosspredict <- rxPredict(winlossmodel, data=scoring_data,type="response",checkFactorLevels=FALSE)

winlossmodel是的,我想说,所以试着将训练数据的数量限制在与评分数据相同的数量,以检查这是否会影响错误是的,它确实会影响错误。但这是适合模型的正确方法吗?如果我只获取一个产品组、一个州和一种运输方式的培训数据,那么我正在构建一个有偏见的模型。我不是吗?我认为我需要为所有产品组、所有州和所有运输方式类别建立一个模型。然后预测一个特定状态、产品组和运输的mdoe的响应。如果我遗漏了什么或者我错了,请纠正我。谢谢,我不是统计学家,但是是的,你应该使用所有州的所有数据。如果你对统计数据有疑问,问问有没有人在这方面运气好?我这里有一个类似的问题。我同意你的观点,因为模型应该基于所有可用数据进行参数化,
rxPredict
函数可以基于单个或更少的输入预测结果——在你的例子中,是单个状态和产品组(假设价格和数量不是分类的)。