Julia 在列车和测试向量数据集中保持相同的装箱

Julia 在列车和测试向量数据集中保持相同的装箱,julia,Julia,我有一个数值向量train,用于模型的训练数据集。假设我想把它切成5个箱子。我知道我可以使用categoricalarray.jl中的cut(x,5)来完成。如何从模型的测试数据集在测试向量中设置相同的装箱?也许有更好的解决方案,但这会起作用: using CategoricalArrays, Statistics nbins = 5 breaks = Statistics.quantile(train, (1:nbins-1)/nbins) cat_train = cut(train, b

我有一个数值向量
train
,用于模型的训练数据集。假设我想把它切成5个箱子。我知道我可以使用categoricalarray.jl中的
cut(x,5)
来完成。如何从模型的测试数据集在
测试
向量中设置相同的装箱?

也许有更好的解决方案,但这会起作用:

using CategoricalArrays, Statistics

nbins = 5
breaks = Statistics.quantile(train, (1:nbins-1)/nbins)

cat_train = cut(train, breaks;extend=true,labels=string.("BIN_",1:5))

cat_test =  cut(test, breaks;extend=true,labels=string.("BIN_",1:5))