Python 如何使用scikit学习交叉验证约束
投入:Python 如何使用scikit学习交叉验证约束,python,scikit-learn,Python,Scikit Learn,投入: 我有一个图像数组X,其中每一行都是代表一个人的示例 另一个数组y用于其标签,其中标签是介于1和7之间的整数 以及id的最后一个数组,其中ids[i]表示X[i]处第i个人的id。(同一个人有相同的id,同一个人可能有不同的图像。) 是否可以对X和y进行分区,这样同一个人就不会同时进入测试和培训集中 我认为我需要使用。有人能解释一下“分层”的作用吗?这是我想做的正确方法吗?意味着sklearn将尝试将列车中的班级比例和测试拆分与总体数据的比例相匹配 y标签中包含哪些信息? 听起来您需要
- 我有一个图像数组
,其中每一行都是代表一个人的示例李>X
- 另一个数组
用于其标签,其中标签是介于1和7之间的整数李>y
- 以及
的最后一个数组,其中id
表示ids[i]
处第i个人的id。(同一个人有相同的id,同一个人可能有不同的图像。)X[i]
X
和y
进行分区,这样同一个人就不会同时进入测试和培训集中
我认为我需要使用。有人能解释一下“分层”的作用吗?这是我想做的正确方法吗?意味着sklearn
将尝试将列车中的班级比例和测试拆分与总体数据的比例相匹配
y标签中包含哪些信息?
听起来您需要类似的东西,或者在您的案例中标签应该是id
您可以使用,它实现了所需的逻辑。第一个参数应该是带有person_ID的列。