Machine learning 哪种类型的神经网络最适合信用评分？_Machine Learning_Artificial Intelligence_Neural Network

Machine learning 哪种类型的神经网络最适合信用评分？

machine-learning artificial-intelligence neural-network

Machine learning 哪种类型的神经网络最适合信用评分？,machine-learning,artificial-intelligence,neural-network,Machine Learning,Artificial Intelligence,Neural Network,让我先说我在学校只上过本科人工智能课，所以我知道这很危险这是我想要解决的问题…准确的信用评分是我生意成功的关键部分。目前，我们依靠精算师团队和统计分析，找出我们跟踪的几十个变量中的模式，这些变量表明每个人的信用风险可能较低或较高。据我所知，这正是神经网络擅长解决的工作类型，也就是说，在人类可能永远无法发现的许多输入之间找到高阶关系，然后做出比训练有素的人类平均更准确的决策或输出。简言之，我希望能够输入您的姓名、地址、婚姻状况、驾驶的汽车、工作地点、头发颜色、喜爱的食物等，并获得信用评分我的问

让我先说我在学校只上过本科人工智能课，所以我知道这很危险

这是我想要解决的问题…准确的信用评分是我生意成功的关键部分。目前，我们依靠精算师团队和统计分析，找出我们跟踪的几十个变量中的模式，这些变量表明每个人的信用风险可能较低或较高。据我所知，这正是神经网络擅长解决的工作类型，也就是说，在人类可能永远无法发现的许多输入之间找到高阶关系，然后做出比训练有素的人类平均更准确的决策或输出。简言之，我希望能够输入您的姓名、地址、婚姻状况、驾驶的汽车、工作地点、头发颜色、喜爱的食物等，并获得信用评分

我的问题是神经网络的哪种类型或结构最适合这个特定问题。我做了一些研究，似乎我提出问题的速度比我找到答案的速度要快。我能想到的最好的方法是一种具有多个隐藏层的生成性深层神经网络，其中每一层都能在前一层的基础上抽象出一个层次。我假设它是前馈的，只是因为它似乎是默认值。我们拥有所有以前客户的历史数据，包括我们用来进行初始评分的信息，以及他们实际面临的信用风险类型的数据。这似乎有利于无监督的学习。我迷失的地方是层的数量，层之间的差异，每一层的大小，每一个感知机的连通性等等。我越是深挖，我就越是钻研那些超出我头脑的研究论文，所以我只需要一些聪明的人给我指出正确的方向

有人有什么想法吗？再次强调，我不需要透彻的解释，只需要一个我应该关注的一般领域。

这是监督学习，因为您有可以标记的实际数据。它也是前馈的，因为你不是预测时间序列而是分配分数。此外，在投入时间实施最先进的体系结构之前，您可能应该准备好数据（手动或通过一些粗略的启发式方法分配信用分数），并开始尝试一些工具。一个具有1个隐藏层的多层感知器（MLP）是解决这个问题的一个足够的起点。从那以后，你可以训练网络来概括你开始时的信用分配启发式

您应该知道，您在研究时可能读到的大多数“新”体系结构所处理的问题比信用评分（语音/图像/字符识别/检测）困难得多。有一系列关于信用评分/风险分类场景的论文，因此我建议您将重点从架构转移到实际案例研究（参见示例）。只需选择一篇最近发表的文章，并应用它们的参数。从简单开始，逐步改进系统（如@roganjosh所述）。

这似乎是crossvalidated（）的一个问题。因此，你应该给我们一些代码来查看，并尝试帮助我们。同意。这很难回答。然而，我很好奇为什么你建议这是应该在无监督的方式处理。如果你有所有的输入和实际的结果，为什么你不想利用它进行监督学习呢？仔细想想，我认为你得到的任何“最佳”答案只会导致理解上的巨大飞跃。仅从数字数据开始，例如，将汽车转换为汽车值，然后设置自己构建一个具有单个隐藏层的bog标准前馈多层感知器。你可能会对结果感到惊讶。然后，您可以查找任何不足之处，这可能有助于更清楚地指导您自己的道路。这一领域是如此之广，以渐进的方式进行处理。你是对的，这应该是有监督的学习，因为我们有客户提供给我们的所有数据来表示输入向量，以及按照我们表示目标向量的方式对客户进行评级的实际结果。我想我是想走无人监管的路线，因为这更接近我们今天使用的手动方法。目前的方法是根据客户提供给我们的信息组合，确定要瞄准或避免的客户类别。例如，25岁以下独居的男性客户比25岁以上已婚的女性客户风险更高。我在想，也许神经网络可以识别出我们没有考虑过的新的或更精细的客户群体。我发现的一个例子是，我们不赞成频繁更换电话号码，因为这表明您无法维持长期服务协议。然而，如果我们发现这些电话变更与地址变更相对应，那么现在你只是一个喜欢拥有本地号码的人。以前我们可能会把你一笔勾销，但现在发现了这种模式，我们认识到你并不像我们之前想象的那样危险。我想我低估了一个隐藏层的力量。我发现最接近我想要实现的示例都有多个层次，每个层次在生成分数的过程中都有一个特定的任务。我是从我们目前使用的方向来解决这个问题的，就像一场普林科的游戏。现在，当客户进来时，我们会用一系列旨在将客户区分为类似风险类别的规则来打击他们。他们进来，根据规则弹跳，然后从底部掉到桶中，然后我们对桶进行评级。我不排除更复杂的神经结构，但我的主要观点是，很难在方法论上过多地围绕这个主题，因为在某一点上，这是一个重大的调整阶段