Machine learning 支持向量机的创建/更新有多容易/快速?

Machine learning 支持向量机的创建/更新有多容易/快速?,machine-learning,svm,Machine Learning,Svm,如果我向您提供足够的数据来将一堆对象分类为苹果、桔子或香蕉,那么您需要多长时间来构建一个支持向量机来进行分类?我理解,这可能取决于数据的性质,但我们更可能谈论几个小时、几天或几周 嗯。既然您已经有了支持向量机,并且您已经了解了数据的行为,那么升级该支持向量机(或构建一个新的支持向量机)以对额外的类(西红柿)进行分类可能需要多长时间?秒?分钟?时间 这个问题的动机是试图评估支持向量机在并非所有数据都可以随时采样的情况下的实际适用性。水果是一个明显的例子——它们随着季节的变化而改变颜色和供应量 如果

如果我向您提供足够的数据来将一堆对象分类为苹果、桔子或香蕉,那么您需要多长时间来构建一个支持向量机来进行分类?我理解,这可能取决于数据的性质,但我们更可能谈论几个小时、几天或几周

嗯。既然您已经有了支持向量机,并且您已经了解了数据的行为,那么升级该支持向量机(或构建一个新的支持向量机)以对额外的类(西红柿)进行分类可能需要多长时间?秒?分钟?时间

这个问题的动机是试图评估支持向量机在并非所有数据都可以随时采样的情况下的实际适用性。水果是一个明显的例子——它们随着季节的变化而改变颜色和供应量


如果您认为支持向量机过于灵活,无法在5分钟内按需创建,尽管有问题领域的经验,则建议针对这种情况提供更为用户友好的分类器形式将不胜感激。

您需要向我们提供有关您的问题的更多详细信息,因为有太多不同的场景可以相当快地训练SVM(我可以在第三人称射击游戏中实时训练它,并且没有任何延迟),或者可以持续几分钟(我有一个关于人脸检测器的案例,训练需要一个小时)


根据经验法则,训练时间与样本数量和每个向量的维数成正比。

您需要向我们提供有关您的问题的更多详细信息,因为有太多不同的场景可以相当快地训练SVM(我可以在第三人射击游戏中实时训练,并且没有任何延迟)或者可以持续几分钟(我有一个面部检测器的案例,培训需要一个小时)


根据经验法则,训练时间与样本数量和每个向量的维数成正比。

通常,向1 vs.多SVM分类器添加一个类需要重新训练所有类。对于大型数据集,这可能会非常昂贵。在现实世界中,当面对非常大的数据集时,如果性能和灵活性比最先进的精度更重要,那么朴素贝叶斯(naivebayes)被广泛使用(将类添加到NB分类器只需要训练新类)


但是,根据您的评论,数据有几十个维度和多达1000个样本,问题相对较小,因此实际上,SVM重新训练可以非常快地执行(可能以秒到几十秒的顺序)。

通常,向1对多SVM分类器添加一个类需要重新训练所有类。对于大型数据集,这可能会非常昂贵。在现实世界中,当面对非常大的数据集时,如果性能和灵活性比最先进的精度更重要,那么朴素贝叶斯(naivebayes)被广泛使用(将类添加到NB分类器只需要训练新类)


但是,根据您的评论,数据有几十个维度,最多1000个样本,问题相对较小,因此实际上,SVM重新训练可以非常快地执行(可能以秒到几十秒的顺序)。

构建SVM是什么意思?你想从头开始为一个非常简单的数据编写SVM吗?不-数据不会很简单。它将涉及对每个物体的颜色、大小、形状等进行基于图像的测量,因此可能至少有5-10个维度。因为数据集在不断扩展(比如人脸识别),最终可能会有1000个样本,所以再培训时间是我关心的关键性能方面。因此,您不打算从头开始构建SVM。另外,如果你在观察1000维空间(不关心高达200-300维空间)和100000个样本,那么SVM可能会开始变得非常昂贵。然后你可以转向一种叫做
随机森林
@Parag-随机森林看起来很有趣。。。但是维基百科上关于过度装修的图示让它看起来不可行!不要担心过度装修。相信我,在大多数情况下,Random Forest与SVM一样有效。它设计用于处理大数据和多类问题。这是一个成熟的算法。你说建立支持向量机是什么意思?你想从头开始为一个非常简单的数据编写SVM吗?不-数据不会很简单。它将涉及对每个物体的颜色、大小、形状等进行基于图像的测量,因此可能至少有5-10个维度。因为数据集在不断扩展(比如人脸识别),最终可能会有1000个样本,所以再培训时间是我关心的关键性能方面。因此,您不打算从头开始构建SVM。另外,如果你在观察1000维空间(不关心高达200-300维空间)和100000个样本,那么SVM可能会开始变得非常昂贵。然后你可以转向一种叫做
随机森林
@Parag-随机森林看起来很有趣。。。但是维基百科上关于过度装修的图示让它看起来不可行!不要担心过度装修。相信我,在大多数情况下,Random Forest与SVM一样有效。它设计用于处理大数据和多类问题。这是一个成熟的算法。也许你可以分享每个射击游戏和人脸检测器示例的样本数量和数据维度。我可以想象非常快的人脸检测器和非常慢的射击游戏。我还可以想象一个游戏会预先设想所有场景,而人脸检测器可能需要一直添加新的人脸。如果你能编辑你的答案来提供更多的细节,那将非常有帮助:-)@omatai我的观点是,如果问题足够小的话