Machine learning 随机过采样条件以创建相等分布

Machine learning 随机过采样条件以创建相等分布,machine-learning,scikit-learn,imblearn,Machine Learning,Scikit Learn,Imblearn,我目前正在从事一个基于ML的项目,我的数据有一点不平衡,需要一种过度采样技术。特征(X_序列)尺寸为(90664190),目标(Y_二进制序列)尺寸为(90664,)。但是,代码运行时仍然输出相同的、不相等的目标分布。 这是用于随机过采样器的代码,它也曾使用smote进行过尝试 counter= Counter(Y_binary_train_trans) ros= RandomOverSampler(random_state=42) X_train, Y_binary_train_trans =

我目前正在从事一个基于ML的项目,我的数据有一点不平衡,需要一种过度采样技术。特征(X_序列)尺寸为(90664190),目标(Y_二进制序列)尺寸为(90664,)。但是,代码运行时仍然输出相同的、不相等的目标分布。 这是用于随机过采样器的代码,它也曾使用smote进行过尝试

counter= Counter(Y_binary_train_trans)
ros= RandomOverSampler(random_state=42)
X_train, Y_binary_train_trans = ros.fit_resample(X_train,Y_binary_train_trans)
counter = Counter(Y_binary_test_trans)
对于这段代码,您的第二个计数器统计的是测试样本,而不是您实际更改的训练样本

相反,它应该是:

counter= Counter(Y_binary_train_trans)
ros= RandomOverSampler(random_state=42)
X_train, Y_binary_train_trans = ros.fit_resample(X_train,Y_binary_train_trans)
counter = Counter(Y_binary_train_trans)
对于这段代码,您的第二个计数器统计的是测试样本,而不是您实际更改的训练样本

相反,它应该是:

counter= Counter(Y_binary_train_trans)
ros= RandomOverSampler(random_state=42)
X_train, Y_binary_train_trans = ros.fit_resample(X_train,Y_binary_train_trans)
counter = Counter(Y_binary_train_trans)

我无法复制这些结果。你能提供最小的和可重复的例子吗?代码是根据您的问题描述生成的,它按预期工作。我无法复制这些结果。你能提供最小的和可重复的例子吗?代码是根据您的问题描述生成的,并按预期工作。