在python中使用逻辑回归查找失败概率

在python中使用逻辑回归查找失败概率,python,pandas,Python,Pandas,我试图通过逻辑回归从数据集中获得一些见解。起始数据帧包含是否有未计划的删除内容(1=是,0=否)的信息,以及随此删除提供的一些数据。 这看起来像这样: 然后,使用pandas.get_dummies对该数据进行“虚拟化”,结果与预期一致。 然后,我对发现的系数进行了归一化(使用coef\uuz)以对所有参数进行相同的缩放。我将其放在一个数据帧中,其中包含列“Parameter”(这是虚拟数据帧的列名)和列“Value”(这是使用系数获得的值) 现在我将得到以下结果 现在,这个结果表明,在计划

我试图通过逻辑回归从数据集中获得一些见解。起始数据帧包含是否有未计划的删除内容(1=是,0=否)的信息,以及随此删除提供的一些数据。 这看起来像这样:

然后,使用pandas.get_dummies对该数据进行“虚拟化”,结果与预期一致。 然后,我对发现的系数进行了归一化(使用coef\uuz)以对所有参数进行相同的缩放。我将其放在一个数据帧中,其中包含列“Parameter”(这是虚拟数据帧的列名)和列“Value”(这是使用系数获得的值)

现在我将得到以下结果

现在,这个结果表明,在计划外搬迁中,飞行时间是最大的贡献者

现在的问题是:我如何预测由于这个原因(本专栏)会有多大的可能会有一次非计划的搬迁?那么,我有多大的机会会因为飞行时间的原因而被另一次非计划的搬走呢

请注意,这些参数可能会发生变化,因为这些数据是假的数据,以后可能会添加这些数据。因此,当最大贡献者发生变化时,预测也应该关注新的最大贡献者

我希望你能理解这个问题

编辑

完整的代码和数据集(假的)可以在这里找到:1drv.ms/u/s!AjkQWQ6EO_fMiSEfu3vYgSTBR0PZ


Ganesh

数据集的一小部分对我们没有帮助。请粘贴您的示例数据。到目前为止您尝试了什么?当然,展示我们的努力。请使用以下链接在OneDrive中查找完整的代码+数据集:如果您对“机会是什么…”感兴趣,Logistic回归已预测了_proba()。2.缩放系数听起来很奇怪,但也许这是正常的事情。我所看到的大多数事情都是人们在动手之前缩放输入数据。3.为什么你对最大的贡献者最感兴趣?你打算如何处理这些信息?4.这是为你好Jared的分类监狱,2号。在手之前缩放输入数据是一个好主意,但是如何通过查看代码来实现这一点呢?3.我是一名研究生,正在进行一项研究,以了解数据挖掘在哪些方面有助于更集中地进行分析。要做到这一点,其中一件事就是在数据集中寻找最大的贡献者,以便分析能够将自己的注意力集中到该贡献者身上。这只是看看这是否可能,以及(更重要的)这是如何可能的。我做错什么了吗?