Machine learning 数据科学案例研究

Machine learning 数据科学案例研究,machine-learning,classification,data-science,Machine Learning,Classification,Data Science,请帮助我获得以下问题的正确答案,这是在一次面试中提出的 有一家银行,没有用户访问银行的不同-不同的服务,但大多数用户给坏评级和去不满意。银行应该怎么做?找出评级不好的原因。银行捕获数据,如用户信息、与用户打交道的代理信息、提供的服务,以及“如果没有”之类的信息 如何仅使用机器学习技术识别在不良评级中起重要作用的规则或原因 如果我们建立一个分类模型,用户将不满意/满意。然后假设我们得到了一个不满意的用户列表。现在,我们应该如何处理这些不满意用户的数据,以帮助银行提高评级和业务 我希望您的不满意客户

请帮助我获得以下问题的正确答案,这是在一次面试中提出的

有一家银行,没有用户访问银行的不同-不同的服务,但大多数用户给坏评级和去不满意。银行应该怎么做?找出评级不好的原因。银行捕获数据,如用户信息、与用户打交道的代理信息、提供的服务,以及“如果没有”之类的信息

  • 如何仅使用机器学习技术识别在不良评级中起重要作用的规则或原因

  • 如果我们建立一个分类模型,用户将不满意/满意。然后假设我们得到了一个不满意的用户列表。现在,我们应该如何处理这些不满意用户的数据,以帮助银行提高评级和业务


  • 我希望您的不满意客户数据集包含有关不满意原因的信息以及其他属性,如用户详细信息、年龄、,他们从银行获得的地区和服务。在这种情况下,可能需要对一个或多个ML模型和算法进行培训和优化,以获得准确的情况。然而,要寻找的关键因素是与他们相关的服务、不满意的原因,以及他们映射到的代理。
    上述3个关键属性可通过回归模型执行,以获得预测和改进计划。请注意,ML模型的选择还取决于对数据集的详细分析,以及从利益相关者那里提出并得出正确的问题。

    培训分类器以预测不满意

    不要使用中立的网络,而是一些可解释的网络

    然后解释模型的特征重要性


    一个好的选择是随机林。

    对于这种情况,您可能需要从用户那里收集一些数据。首先,每个用户都需要在一定范围内(1-5)对银行的每项服务进行评分。然后,我们计算出最大的负面评级以及他们提供的服务。这项服务将是银行必须作出更大改进的服务之一。然后,我们需要计算该评级与其他服务评级的相似性。他们的服务是最相似的有一个负面评价一样,较早的一个。这成为第二个需要改进的服务。我们如何使用树模型识别多个原因?这是我无法回答的问题。我们没有不满意的理由,这是我们想要确定的事情,我们只是有用户给出的评分和其他用户的详细信息,如工资年龄教育,等等。我们想确定在不好的评级中起重要作用的原因或规则,数据集中不仅有服务,而且没有功能。好的。在这种情况下,case的评级(不好)是一个因素。正如我注意到的,您可能会与代理商就这些评级进行一些关联,与用户关联的服务和功能。是这样吗?所以在我看来,映射数据映射可以是这样的,用户-->代理->服务->功能->评级。如果这可能是高级数据集,您可以在此基础上运行ML模型。