Artificial intelligence 如何筛选/排序/排列对象模型节点?

Artificial intelligence 如何筛选/排序/排列对象模型节点?,artificial-intelligence,filtering,machine-learning,classification,bayesian,Artificial Intelligence,Filtering,Machine Learning,Classification,Bayesian,我有一些对象模型,我需要对它的节点进行过滤和排序,以获得某种属性。存在哪些类型的自动化系统来生成和选择与我想要的内容相关的对象模型属性?(我故意抽象和不具体) 我正在考虑一个类似垃圾邮件过滤器或监督分类系统的系统,在给定一个示例数据集的情况下,它可以识别找到感兴趣节点的规则。然而,我正在寻找一个更通用的系统,因为它不需要任何关于对象模型的设计时信息。它应该可以很好地用作电子邮件上的垃圾邮件过滤器、代码库上的bug查找器、新闻组中的兴趣过滤器或社交网站上的bot帐户查找器。只要它能够通过反射探索对

我有一些对象模型,我需要对它的节点进行过滤和排序,以获得某种属性。存在哪些类型的自动化系统来生成和选择与我想要的内容相关的对象模型属性?(我故意抽象和不具体)


我正在考虑一个类似垃圾邮件过滤器或监督分类系统的系统,在给定一个示例数据集的情况下,它可以识别找到感兴趣节点的规则。然而,我正在寻找一个更通用的系统,因为它不需要任何关于对象模型的设计时信息。它应该可以很好地用作电子邮件上的垃圾邮件过滤器、代码库上的bug查找器、新闻组中的兴趣过滤器或社交网站上的bot帐户查找器。只要它能够通过反射探索对象模型,并获得一组“有趣”的节点,它就应该能够找到规则,找到更多类似的节点。

很可能没有一个单一的自动分类系统可以满足您的所有要求。此外,我相信bug finder应用程序不属于此类系统的范围,因为在该领域中成功使用的方法主要围绕语法分析、数据流分析和其他高度定制的算法方法,以解决围绕软件错误的问题。尽管机器学习的研究正在那里进行,但该领域的分类系统主要用于增强而不是取代分析方法(据我所知)

对于大多数非平凡的分类问题,通常需要仔细选择和细化问题表示,以便通过机器学习获得有用和有效的结果。简单地使用现有的“原始”数据对象模型,而不对状态空间进行某种定制转换,往往会导致输入数据值分布的不完全覆盖和/或学习分类器的泛化能力差。此外,特定于正在使用的机器学习方法的其他参数可能需要反复调整,以获得给定问题的良好结果。并非所有的方法都有这样的参数,但许多方法都有,如神经网络、遗传算法、贝叶斯推理方法等


你所要求的是一种几乎通用的机器学习方法,而目前还不存在这种方法。我所能看到的最可行的替代方案是:(1)找到不同问题的子集,而这不是所需的能力/复杂程度,或者(2)创建一个系统,该系统不仅使用一种分类技术,而且还拥有一个工具箱,其中包含各种方法,可以针对给定的问题自动进行测试,然后使用在监督学习机制下生成最佳分类结果的方法。但是,要有效地实现后者仍然是一个相当大的挑战,并且它不能消除如何表示/转换数据模型的状态空间的问题

几乎不可能有一个单一的自动分类系统可以满足您的所有要求。此外,我相信bug finder应用程序不属于此类系统的范围,因为在该领域中成功使用的方法主要围绕语法分析、数据流分析和其他高度定制的算法方法,以解决围绕软件错误的问题。尽管机器学习的研究正在那里进行,但该领域的分类系统主要用于增强而不是取代分析方法(据我所知)

对于大多数非平凡的分类问题,通常需要仔细选择和细化问题表示,以便通过机器学习获得有用和有效的结果。简单地使用现有的“原始”数据对象模型,而不对状态空间进行某种定制转换,往往会导致输入数据值分布的不完全覆盖和/或学习分类器的泛化能力差。此外,特定于正在使用的机器学习方法的其他参数可能需要反复调整,以获得给定问题的良好结果。并非所有的方法都有这样的参数,但许多方法都有,如神经网络、遗传算法、贝叶斯推理方法等


你所要求的是一种几乎通用的机器学习方法,而目前还不存在这种方法。我所能看到的最可行的替代方案是:(1)找到不同问题的子集,而这不是所需的能力/复杂程度,或者(2)创建一个系统,该系统不仅使用一种分类技术,而且还拥有一个工具箱,其中包含各种方法,可以针对给定的问题自动进行测试,然后使用在监督学习机制下生成最佳分类结果的方法。但是,要有效地实现后者仍然是一个相当大的挑战,并且它不能消除如何表示/转换数据模型的状态空间的问题

顺便说一句:如果没有好的解决方案,我一点也不会感到惊讶。顺便说一句:如果没有好的解决方案,我一点也不会感到惊讶。最后一句话的后半部分“如何表示/转换数据模型的状态空间”实际上描述了我想知道的问题的解决方案。状态空间模型问题的一种可能性是扩展“工具箱”的概念,并有各种不同的表示形式,可以自动测试。这可能包括(1)无转换[可能适用于某些类型的离散值或文本数据],(2)自然语言的概念集群或本体,(3)数字数据的粗略编码表示,等等。这些也是