Python 如何使用scikit学习交叉验证约束

Python 如何使用scikit学习交叉验证约束,python,scikit-learn,Python,Scikit Learn,投入: 我有一个图像数组X,其中每一行都是代表一个人的示例 另一个数组y用于其标签,其中标签是介于1和7之间的整数 以及id的最后一个数组,其中ids[i]表示X[i]处第i个人的id。(同一个人有相同的id,同一个人可能有不同的图像。) 是否可以对X和y进行分区,这样同一个人就不会同时进入测试和培训集中 我认为我需要使用。有人能解释一下“分层”的作用吗?这是我想做的正确方法吗?意味着sklearn将尝试将列车中的班级比例和测试拆分与总体数据的比例相匹配 y标签中包含哪些信息? 听起来您需要

投入:

  • 我有一个图像数组
    X
    ,其中每一行都是代表一个人的示例
  • 另一个数组
    y
    用于其标签,其中标签是介于1和7之间的整数
  • 以及
    id
    的最后一个数组,其中
    ids[i]
    表示
    X[i]
    处第i个人的id。(同一个人有相同的id,同一个人可能有不同的图像。)
是否可以对
X
y
进行分区,这样同一个人就不会同时进入测试和培训集中

我认为我需要使用。有人能解释一下“分层”的作用吗?这是我想做的正确方法吗?

意味着
sklearn
将尝试将列车中的班级比例和测试拆分与总体数据的比例相匹配

y标签中包含哪些信息? 听起来您需要类似的东西,或者在您的案例中标签应该是
id

您可以使用,它实现了所需的逻辑。第一个参数应该是带有person_ID的列。