Python 决策树是否适用于少数样本？_Python_Machine Learning_Scikit Learn_Physics

Python 决策树是否适用于少数样本？

python machine-learning scikit-learn

Python 决策树是否适用于少数样本？,python,machine-learning,scikit-learn,physics,Python,Machine Learning,Scikit Learn,Physics,在这里我只想做分类例如，当我只有很少的样本时，少于100（实验数据）。我可以使用决策树或其他机器学习算法吗我可以模拟许多样本，比如10^8个样本，样本重量为10^-6。那么使用决策树呢我可以随时模拟任意多的样本，但实验数据会很少（我无法提高实验数据的数量）。在这种情况下，机器学习算法的结果是正确的吗例如，在此指南链接中：样本编号的含义是什么？是样本编号还是样本编号乘以样本重量和类别重量欢迎来到StackOverflow！不清楚你所说的“模拟样本”是什么意思。你能详细说明一下吗？有两种

在这里我只想做分类

例如，当我只有很少的样本时，少于100（实验数据）。我可以使用决策树或其他机器学习算法吗

我可以模拟许多样本，比如10^8个样本，样本重量为10^-6。那么使用决策树呢

我可以随时模拟任意多的样本，但实验数据会很少（我无法提高实验数据的数量）。在这种情况下，机器学习算法的结果是正确的吗

例如，在此指南链接中：

样本编号的含义是什么？是样本编号还是样本编号乘以样本重量和类别重量

欢迎来到StackOverflow！不清楚你所说的“模拟样本”是什么意思。你能详细说明一下吗？有两种获取样品的方法。一种是实验，当然这是“真实”的样本，第二种方法是使用一些工具模拟样本（这些工具可以模拟实验仪器）。因此，我们可以获得许多模拟样本（例如，反复运行模拟工具…），但实验样本受到实验条件的限制，因此实验样本较少。例如，实验将生成100个包含粒子A和粒子B的样本（当然我们不知道它是A还是B，我们只知道它们的特征）。我想区分粒子A和B。你可以认为A和B的类别标签和一些粒子特征是参数。我可以模拟10^8个样本吗。对于模拟样本，我知道它们的标签，它们的参数，并使用决策树。然后使用此决策树预测实验样本的标签？这会不会你会犯很多错误吗？在不同的学科（计算机和物理…）很难说出一些东西。也许问题可以用另一种方式：如果我使用10^8样本来拟合决策树，那么，对于任何100个样本（随机选取100个样本）（但类的比例与10^8样本中的比例相同），使用此决策树预测100个样本的标签，误差有多大？很明显，例如，对于10^8个样本，特征是平滑变化的，但在100个样本中，特征可能分布不好。对于第二条评论，这句话很抱歉“你可以认为A和B类标签和一些粒子字符是参数。”，应该是。你可以认为A和B类标签和一些粒子字符是特征。”以避免歧义。