Python 决策树是否适用于少数样本?

Python 决策树是否适用于少数样本?,python,machine-learning,scikit-learn,physics,Python,Machine Learning,Scikit Learn,Physics,在这里我只想做分类 例如,当我只有很少的样本时,少于100(实验数据)。我可以使用决策树或其他机器学习算法吗 我可以模拟许多样本,比如10^8个样本,样本重量为10^-6。那么使用决策树呢 我可以随时模拟任意多的样本,但实验数据会很少(我无法提高实验数据的数量)。在这种情况下,机器学习算法的结果是正确的吗 例如,在此指南链接中: 样本编号的含义是什么?是样本编号还是样本编号乘以样本重量和类别重量 欢迎来到StackOverflow!不清楚你所说的“模拟样本”是什么意思。你能详细说明一下吗?有两种

在这里我只想做分类

例如,当我只有很少的样本时,少于100(实验数据)。我可以使用决策树或其他机器学习算法吗

我可以模拟许多样本,比如10^8个样本,样本重量为10^-6。那么使用决策树呢

我可以随时模拟任意多的样本,但实验数据会很少(我无法提高实验数据的数量)。在这种情况下,机器学习算法的结果是正确的吗

例如,在此指南链接中:


样本编号的含义是什么?是样本编号还是样本编号乘以样本重量和类别重量

欢迎来到StackOverflow!不清楚你所说的“模拟样本”是什么意思。你能详细说明一下吗?有两种获取样品的方法。一种是实验,当然这是“真实”的样本,第二种方法是使用一些工具模拟样本(这些工具可以模拟实验仪器)。因此,我们可以获得许多模拟样本(例如,反复运行模拟工具…),但实验样本受到实验条件的限制,因此实验样本较少。例如,实验将生成100个包含粒子A和粒子B的样本(当然我们不知道它是A还是B,我们只知道它们的特征)。我想区分粒子A和B。你可以认为A和B的类别标签和一些粒子特征是参数。我可以模拟10^8个样本吗。对于模拟样本,我知道它们的标签,它们的参数,并使用决策树。然后使用此决策树预测实验样本的标签?这会不会你会犯很多错误吗?在不同的学科(计算机和物理…)很难说出一些东西。也许问题可以用另一种方式:如果我使用10^8样本来拟合决策树,那么,对于任何100个样本(随机选取100个样本)(但类的比例与10^8样本中的比例相同),使用此决策树预测100个样本的标签,误差有多大?很明显,例如,对于10^8个样本,特征是平滑变化的,但在100个样本中,特征可能分布不好。对于第二条评论,这句话很抱歉“你可以认为A和B类标签和一些粒子字符是参数。”,应该是。你可以认为A和B类标签和一些粒子字符是特征。”以避免歧义。